kedro-org · deepyaman · Nov 22, 2023 · Nov 20, 2023 · Nov 20, 2023 · Nov 20, 2023
diff --git a/Makefile b/Makefile
@@ -28,7 +28,6 @@ dataset-doctests:
 	# TODO(deepyaman): Fix as many doctests as possible (so that they run).
 	cd kedro-datasets && pytest kedro_datasets --doctest-modules --doctest-continue-on-failure --no-cov \
 	  --ignore kedro_datasets/api/api_dataset.py \
-	  --ignore kedro_datasets/dask/parquet_dataset.py \
 	  --ignore kedro_datasets/databricks/managed_table_dataset.py \
 	  --ignore kedro_datasets/matplotlib/matplotlib_writer.py \
 	  --ignore kedro_datasets/pandas/deltatable_dataset.py \

diff --git a/kedro-datasets/MANIFEST.in b/kedro-datasets/MANIFEST.in
@@ -0,0 +1 @@
+exclude kedro_datasets/conftest.py
diff --git a/kedro-datasets/kedro_datasets/conftest.py b/kedro-datasets/kedro_datasets/conftest.py
@@ -0,0 +1,6 @@
+import pytest
+
+
+@pytest.fixture(autouse=True)
+def add_np(doctest_namespace, tmp_path):
+    doctest_namespace["tmp_path"] = tmp_path
diff --git a/kedro-datasets/kedro_datasets/dask/parquet_dataset.py b/kedro-datasets/kedro_datasets/dask/parquet_dataset.py
@@ -43,24 +43,18 @@ class ParquetDataset(AbstractDataset[dd.DataFrame, dd.DataFrame]):
         >>> import dask.dataframe as dd
         >>> import pandas as pd
         >>> from kedro_datasets.dask import ParquetDataset
+        >>> from pandas.testing import assert_frame_equal
         >>>
         >>> data = pd.DataFrame({"col1": [1, 2], "col2": [4, 5], "col3": [[5, 6], [7, 8]]})
         >>> ddf = dd.from_pandas(data, npartitions=2)
         >>>
         >>> dataset = ParquetDataset(
-        ...     filepath="s3://bucket_name/path/to/folder",
-        ...     credentials={
-        ...         "client_kwargs": {
-        ...             "aws_access_key_id": "YOUR_KEY",
-        ...             "aws_secret_access_key": "YOUR SECRET",
-        ...         }
-        ...     },
-        ...     save_args={"compression": "GZIP"},
+        ...     filepath=tmp_path / "path/to/folder", save_args={"compression": "GZIP"}
         ... )
         >>> dataset.save(ddf)
         >>> reloaded = dataset.load()
         >>>
-        >>> assert ddf.compute().equals(reloaded.compute())
+        >>> assert_frame_equal(ddf.compute(), reloaded.compute())
 
     The output schema can also be explicitly specified using
     `Triad <https://triad.readthedocs.io/en/latest/api/\

diff --git a/kedro-datasets/pyproject.toml b/kedro-datasets/pyproject.toml
@@ -32,7 +32,7 @@ version = {attr = "kedro_datasets.__version__"}
 fail_under = 100
 show_missing = true
 # temporarily ignore kedro_datasets/__init__.py in coverage report
-omit = ["tests/*", "kedro_datasets/holoviews/*", "kedro_datasets/snowflake/*", "kedro_datasets/tensorflow/*", "kedro_datasets/__init__.py", "kedro_datasets/databricks/*"]
+omit = ["tests/*", "kedro_datasets/holoviews/*", "kedro_datasets/snowflake/*", "kedro_datasets/tensorflow/*", "kedro_datasets/__init__.py", "kedro_datasets/conftest.py", "kedro_datasets/databricks/*"]
 exclude_lines = ["pragma: no cover", "raise NotImplementedError", "if TYPE_CHECKING:"]
 
 [tool.pytest.ini_options]