pre-commit formatting

Signed-off-by: Michael Clifford <[email protected]>
instructlab · Sep 23, 2024 · 9c1e00c · 9c1e00c
1 parent 631d48c
commit 9c1e00c
Show file tree

Hide file tree

Showing 4 changed files with 11 additions and 7 deletions.
diff --git a/README.md b/README.md
@@ -247,7 +247,7 @@ from instructlab.training import (
     DataProcessArgs,
     data_process as dp
 )
-
+ 
 ...
 
 data_process_args = DataProcessArgs(

diff --git a/src/instructlab/training/__init__.py b/src/instructlab/training/__init__.py
@@ -22,9 +22,13 @@
 
 
 # defer import of main_ds
-def run_training(torch_args: TorchrunArgs, train_args: TrainingArgs, process_data: bool = True) -> None:
+def run_training(
+    torch_args: TorchrunArgs, train_args: TrainingArgs, process_data: bool = True
+) -> None:
     """Wrapper around the main training job that calls torchrun."""
     # Local
     from .main_ds import run_training
 
-    return run_training(torch_args=torch_args, train_args=train_args, process_data=process_data)
+    return run_training(
+        torch_args=torch_args, train_args=train_args, process_data=process_data
+    )
diff --git a/src/instructlab/training/data_process.py b/src/instructlab/training/data_process.py
@@ -175,10 +175,8 @@ def get_masked_and_orig_text(sample):
 
 
 def main(args: DataProcessArgs):
-
     if not os.path.exists(args.data_output_path):
         os.makedirs(args.data_output_path, exist_ok=True)
-
     print("\033[92m data arguments are:\033[0m")
     print("\033[36m" + args.model_dump_json() + "\033[0m")
     NUM_PROC = args.num_cpu_procs

diff --git a/src/instructlab/training/main_ds.py b/src/instructlab/training/main_ds.py
@@ -602,7 +602,9 @@ def main(args):
 
 
 # public API
-def run_training(torch_args: TorchrunArgs, train_args: TrainingArgs, process_data: bool = True) -> None:
+def run_training(
+    torch_args: TorchrunArgs, train_args: TrainingArgs, process_data: bool = True
+) -> None:
     """
     Wrapper around the main training job that calls torchrun.
     """
@@ -611,7 +613,7 @@ def run_training(torch_args: TorchrunArgs, train_args: TrainingArgs, process_dat
         raise ValueError(
             f"the `max_batch_len` cannot be less than `max_seq_len`: {train_args.max_batch_len=} < {train_args.max_seq_len=}"
         )
-    
+
     if process_data:
         dp.main(
             DataProcessArgs(
-Original file line number
+Diff line change
@@ Expand Up / @@ -247,7 +247,7 @@ from instructlab.training import ( @@
         DataProcessArgs,
         data_process as dp
     )
     ...
     data_process_args = DataProcessArgs(
@@ Expand Down @@