Skip to content

Utilizing logistic regression and clustering, the study models obesity levels based on lifestyle, demographic, and medical data. Logistic regression predicts obesity categories, while clustering uncovers natural data groupings, offering insights into obesity patterns.

Notifications You must be signed in to change notification settings

Flavio-Mangione/Unsupervised-and-Supervised-Algorithms

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

13 Commits
 
 
 
 
 
 

Repository files navigation

Obesity Study Using Unsupervised and Supervised Algorithms

Project Description

This project aims to analyze obesity levels in individuals using machine learning techniques, specifically through logistic regression and clustering. The data includes demographic information, lifestyle choices, and medical measurements, aiming to predict obesity categories (NObeyesdad).

Techniques Used

  • Logistic Regression: Applied to predict different obesity categories based on the characteristics of individuals;
  • Clustering: Used to identify natural groupings in the dataset, offering insights into obesity patterns;
  • Random Forest: An ensemble model that uses multiple decision trees to improve the robustness and accuracy of classification;
  • Support Vector Machine (SVM): A powerful classifier that uses linear and non-linear separation techniques to distinguish between different categories.

How to Use

  1. Data preparation: Cleaning and transforming the initial data;
  2. Logistic Regression Model: Training the model for the classification of obesity categories;
  3. Applying Clustering: Performing clustering analysis to discover groupings and patterns;
  4. Random Forest Model: Training and validation of the Random Forest model to improve classification;
  5. Support Vector Machine (SVM): Implementation and optimization of SVM model for effective classification of obesity categories.

Studio sull'Obesità Utilizzando Regressione Logistica e Clustering

Descrizione del Progetto

Questo progetto mira ad analizzare i livelli di obesità in individui utilizzando tecniche di machine learning, nello specifico attraverso la regressione logistica e il clustering. I dati includono informazioni demografiche, scelte di vita e misurazioni mediche, con l'obiettivo di prevedere le categorie di obesità (NObeyesdad).

Tecniche Utilizzate

  • Regressione Logistica: Applicata per prevedere le diverse categorie di obesità basandosi sulle caratteristiche degli individui;
  • Clustering: Utilizzato per identificare raggruppamenti naturali nel dataset, offrendo intuizioni sui pattern di obesità;
  • Random Forest: Un modello ensemble che utilizza molteplici alberi di decisione per migliorare la robustezza e l'accuratezza della classificazione;
  • Support Vector Machine (SVM): Un potente classificatore che utilizza tecniche di separazione lineare e non lineare per distinguere tra diverse categorie.

Come Utilizzare

  1. Preparazione dei dati: Pulizia e trasformazione dei dati iniziali;
  2. Modello di Regressione Logistica: Addestramento del modello per la classificazione delle categorie di obesità;
  3. Applicazione del Clustering: Esecuzione dell'analisi di clustering per scoprire raggruppamenti e pattern;
  4. Modello Random Forest: Addestramento e validazione del modello Random Forest per migliorare la classificazione;
  5. Support Vector Machine (SVM): Implementazione e ottimizzazione del modello SVM per una classificazione efficace delle categorie di obesità.

About

Utilizing logistic regression and clustering, the study models obesity levels based on lifestyle, demographic, and medical data. Logistic regression predicts obesity categories, while clustering uncovers natural data groupings, offering insights into obesity patterns.

Topics

Resources

Stars

Watchers

Forks