Training with Custom Datasets

This repository is a deep learning pipeline for classifying custom screenshots with data augmentation using PyTorch and Albumentations. The model is based on Google's GoogLeNet architecture and includes functionalities for data preprocessing, augmentation, training, validation, testing, and result visualization.

Features

Custom Dataset Loader: Handles loading and preprocessing of screenshots from a directory structure and CSV file.
Data Augmentation: Includes rotation, flipping, and padding to enhance model generalization.
Training and Validation: Implements training with early stopping and learning rate scheduling.
Visualization: Provides confusion matrix, metric plots, and augmented image samples for analysis.
Model Persistence: Saves and loads models for reuse and evaluation.

Installation

Clone this repository to your local machine:

git clone https://github.com/cxycode32/Training-With-Custom-Datasets.git
cd Training-With-Custom-Datasets

Install the required dependencies:

pip install -r requirements.txt

File Structure

├── main.py                # Training script
├── utils.py               # Utility functions
├── dataset.py             # Custom dataset class
├── your_datasets/         # Your images
├── data_labels.csv        # CSV file with image labels
├── model.pth.tar          # Your model
├── requirements.txt       # Project dependencies
└── .gitignore             # Ignored files for Git

Dataset Structure

your_datasets/
  ├── class1/
  │   ├── image1.jpg
  │   ├── image2.jpg
  │   └── ...
  ├── class2/
  │   ├── image1.jpg
  │   ├── image2.jpg
  │   └── ...
  └── ...

A CSV file named data_labels.csv should contain the mapping of filenames to their corresponding labels.

Usage

Run the training script with default parameters:

python main.py

Visualization

Training Loss and Accuracy

The training loss and accuracy.

Contribution

Feel free to fork this repository and submit pull requests to improve the project or add new features.

License

This project is licensed under the MIT License.

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
assets		assets
.gitignore		.gitignore
README.md		README.md
data_labels_sample.csv		data_labels_sample.csv
dataset.py		dataset.py
main.py		main.py
requirements.txt		requirements.txt
utils.py		utils.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Training with Custom Datasets

Features

Installation

File Structure

Dataset Structure

Usage

Visualization

Training Loss and Accuracy

Contribution

License

About

Releases

Packages

Languages

cxycode32/Training-With-Custom-Datasets

Folders and files

Latest commit

History

Repository files navigation

Training with Custom Datasets

Features

Installation

File Structure

Dataset Structure

Usage

Visualization

Training Loss and Accuracy

Contribution

License

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages