AWS Data Engineering Project - Spotify data analysis

This project aims to enable data analysts of imaginary music firms to have queryable and up-to-date data available for analysis everyday. The data is of Spotify's top trending songs, which they can use for understanding audiences listening habits by applying data analytics.

This project seeks to effectively set up a data pipeline that takes data straight from a Spotify API and transforms it into a form that can be analysed and presented in a query-friendly manner.
To import, extract, and process the data and make it accessible for analysis, the data pipeline makes use of AWS services.

Data source: Portal of Spotify APIs - Spotify for Developers

Data Pipeline flowchart

Highlights

Data extraction via API
Data cleansing
Data transformation
Data crawling
Data quering and analysis

Main activities

Integrating with Spotify API and extracting the data
Using AWS S3 to store the files
Deploying Python codes on AWS Lambda for Data Extraction, Transformation and Loading
Adding triggers to schedule and run the functions automatically
Building Data Catalogs of the data files using AWS Glue crawlers
Analysing the tables using SQL in Athena

AWS services used:

Extraction:
- Cloudwatch Trigger
- Lambda Function
- S3
Transformation and loading:
- Lambda Trigger
- Lambda Function
- S3
Data Catalogging
- S3
- Glue Crawlers
Data Analysis
- Athena Query Editor
Other services
- IAM

Name		Name	Last commit message	Last commit date
Latest commit History 23 Commits
.cache		.cache
DataFlowDiagram.jpg		DataFlowDiagram.jpg
Data_Analysis_Queries.pdf		Data_Analysis_Queries.pdf
README.md		README.md
Relationship_Diagram.png		Relationship_Diagram.png
Spotify_Project_Data_Pipeline.ipynb		Spotify_Project_Data_Pipeline.ipynb
spotify_api_data_extract.py		spotify_api_data_extract.py
spotify_data_transformation_load.py		spotify_data_transformation_load.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

AWS Data Engineering Project - Spotify data analysis

Data Pipeline flowchart

Highlights

Main activities

AWS services used:

File Formats Handled:

Other Tools

References

About

Releases

Packages

Languages

shreeyajoshi2013/AWS_Data_Engineering_Spotify_Data

Folders and files

Latest commit

History

Repository files navigation

AWS Data Engineering Project - Spotify data analysis

Data Pipeline flowchart

Highlights

Main activities

AWS services used:

File Formats Handled:

Other Tools

References

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages