Python數(shù)據(jù)分析與挖掘
|
時間
|
模塊
|
內(nèi)容概要
|
Day1
|
數(shù)據(jù)分析初探
|
- 什么是數(shù)據(jù)分析
- 數(shù)據(jù)分析應(yīng)用場景
- 數(shù)據(jù)分析方法論
- 數(shù)據(jù)分析常用指標(biāo)
- 數(shù)據(jù)分析流程
- python數(shù)據(jù)分析常用模塊介紹
- 數(shù)據(jù)分析環(huán)境準(zhǔn)備
|
Numpy 數(shù)值計(jì)算基礎(chǔ)
|
- ndarray的創(chuàng)建、訪問、常用屬性
- 矩陣的創(chuàng)建
- 通用函數(shù)ufunc
- 廣播機(jī)制
- 簡單統(tǒng)計(jì)分析,讀寫文件、排序、去重、常用統(tǒng)計(jì)函數(shù)
|
Day2
|
Pandas基礎(chǔ)操作
|
- Series常用操作
- DataFrame常用操作
- 讀寫不同數(shù)據(jù)源
- 數(shù)據(jù)過濾與轉(zhuǎn)換
- 時間序列操作
- 分組與聚合
- 透視與交叉表
|
Pandas數(shù)據(jù)處理
|
- 合并數(shù)據(jù),堆疊合并、主鍵合并、重疊合并
- 清洗數(shù)據(jù),處理重復(fù)值、缺失值、異常值的處理
- 標(biāo)準(zhǔn)化數(shù)據(jù),離差標(biāo)準(zhǔn)化、標(biāo)準(zhǔn)差標(biāo)準(zhǔn)化、小數(shù)定標(biāo)標(biāo)準(zhǔn)化
- 轉(zhuǎn)化數(shù)據(jù) ,類別型特征處理為啞變量,連續(xù)性特征離散化處理
|
Day3
|
數(shù)據(jù)可視化
|
- Matplotlib繪圖
- Pandas 繪圖
- Seanborn繪圖
- Pyecharts繪圖
- 可視化實(shí)戰(zhàn)
|
Day4
|
機(jī)器學(xué)習(xí)
|
- 機(jī)器學(xué)習(xí)概述
- 機(jī)器學(xué)習(xí)算法分類
- 機(jī)器學(xué)習(xí)完整流程
- 機(jī)器學(xué)習(xí)模型評估
- 常用算法原理解析
- 線性回歸
- 邏輯回歸
- 樸素貝葉斯
- 決策樹
- 集成學(xué)習(xí)
- 支持向量機(jī)
- KNN
- Kmeans
- 關(guān)聯(lián)規(guī)則
- 時序模式
- 推薦算法
- sk-learn 框架
- 拆分?jǐn)?shù)據(jù)集
- 特征工程
- 模型訓(xùn)練
- 模型評估
|
Day5
|
數(shù)據(jù)分析實(shí)戰(zhàn)
|
- 拉勾網(wǎng)招聘需求分析
- 客戶價值分析
- 房價數(shù)據(jù)分析
- 電影推薦系統(tǒng)
|
Day6
|
數(shù)據(jù)分析實(shí)戰(zhàn)
|
- 股票數(shù)據(jù)分析
- 商品評論情感分析
- 評分卡模型
|
擴(kuò)充知識點(diǎn)
|
- 大數(shù)據(jù)場景的分析
- 更多學(xué)習(xí)平臺推薦
|