Skip to content

Latest commit

 

History

History
47 lines (34 loc) · 1.82 KB

README.md

File metadata and controls

47 lines (34 loc) · 1.82 KB

Data Analysis Tutorial

数学基础

  1. 《统计自然语言处理基础》第二章(必读),作者:Christopher D. Manning; Hinrich Schütz
  2. 《深度学习》第一章至第四章(推荐)

公开的参考资料在lectures目录下,其他不能公开的资料在Google Team Drive里面。

课程安排:

课程参考《Python数据分析与挖掘实战》设计,相当于对原书内容的整理和补充,另外将代码调整为python3可以运行的版本。希望大家支持正版,购买原书!

  • Day 1: 介绍数据分析、数据探索与数据挖掘,并重点让大家了解数据探索,以及动手实验和作业。
  • Day 2: 介绍数据预处理的要点与方法,以及动手实验和作业。
  • Day 3: 介绍预测性分析的方法和要点,以及动手实验和作业。
  • Day 4: 介绍聚类分析的方法和要点,以及动手实验和作业。
  • Day 5: 介绍关联规则挖掘的方法和要点,以及动手实验和作业。
  • Day 6: 介绍时间序列分析的方法和要点,以及动手实验和作业。
  • Day 7: 介绍生存分析的方法和要点,以及动手实验和作业。
  • Day 8: 基于电商产品评论数据情感分析。
  • Day 9: 针对销售目标的任务分配优化。
  • 大作业:
    1. 通过汽车之家的评论数据分析主要车型在市场上的情况。

作业

每位同学把作业写在每次课的目录(day$N/assignment)下,assignment目录已经被添加到.gitignore里面了,所以作业不会提交到git仓库。

ls day1/assignment
assignment.ipynb

Day 1

重点笔记: day1/note.md

课后补充阅读:

  1. 《Anomaly Detection: A Survey》

Day 2

课后补充阅读:

  1. 《Summarization - Compressing Data into an Informative Representation》

Day 3

课后补充阅读:

  1. 《Feature Selection》