This project aims to analyze obesity levels in individuals using machine learning techniques, specifically through logistic regression and clustering. The data includes demographic information, lifestyle choices, and medical measurements, aiming to predict obesity categories (NObeyesdad
).
- Logistic Regression: Applied to predict different obesity categories based on the characteristics of individuals;
- Clustering: Used to identify natural groupings in the dataset, offering insights into obesity patterns;
- Random Forest: An ensemble model that uses multiple decision trees to improve the robustness and accuracy of classification;
- Support Vector Machine (SVM): A powerful classifier that uses linear and non-linear separation techniques to distinguish between different categories.
- Data preparation: Cleaning and transforming the initial data;
- Logistic Regression Model: Training the model for the classification of obesity categories;
- Applying Clustering: Performing clustering analysis to discover groupings and patterns;
- Random Forest Model: Training and validation of the Random Forest model to improve classification;
- Support Vector Machine (SVM): Implementation and optimization of SVM model for effective classification of obesity categories.
Questo progetto mira ad analizzare i livelli di obesità in individui utilizzando tecniche di machine learning, nello specifico attraverso la regressione logistica e il clustering. I dati includono informazioni demografiche, scelte di vita e misurazioni mediche, con l'obiettivo di prevedere le categorie di obesità (NObeyesdad
).
- Regressione Logistica: Applicata per prevedere le diverse categorie di obesità basandosi sulle caratteristiche degli individui;
- Clustering: Utilizzato per identificare raggruppamenti naturali nel dataset, offrendo intuizioni sui pattern di obesità;
- Random Forest: Un modello ensemble che utilizza molteplici alberi di decisione per migliorare la robustezza e l'accuratezza della classificazione;
- Support Vector Machine (SVM): Un potente classificatore che utilizza tecniche di separazione lineare e non lineare per distinguere tra diverse categorie.
- Preparazione dei dati: Pulizia e trasformazione dei dati iniziali;
- Modello di Regressione Logistica: Addestramento del modello per la classificazione delle categorie di obesità;
- Applicazione del Clustering: Esecuzione dell'analisi di clustering per scoprire raggruppamenti e pattern;
- Modello Random Forest: Addestramento e validazione del modello Random Forest per migliorare la classificazione;
- Support Vector Machine (SVM): Implementazione e ottimizzazione del modello SVM per una classificazione efficace delle categorie di obesità.