系列一:《python数据分析基础与实践》
章节1Python概况
课时2Python简介
章节2Python安装
课时3安装Anaconda
课时4使用Anaconda
章节3数据准备
课时5数据类型 – 布尔型
课时6数据类型 – 数值型
课时7数据类型 – 字符型
课时8数据结构 – List
课时9数据结构 – Tuple
课时10数据结构 – Set
课时11 数据结构 – Dic
课时12 Pandas数据结构 – Series
课时13 Pandas数据结构 – DataFrame
课时14程序结构 – 选择
课时15程序结构 – 循环
课时16函数使用
课时17向量化运算
章节4数据处理
课时18数据的导入 – CSV
课时19数据的导入 – 修改文件编码
课时20数据的导入 – TXT
课时21数据的导入 – Excel
课时22数据的导出
课时23重复值处理
课时24 缺失值处理
课时25空格值处理
课时26字段抽取
课时27字段拆分
课时28记录抽取
课时29随机抽样
课时30记录合并
课时31字段合并
课时32字段匹配
课时33简单计算
课时34数据标准化
课时35数组分组
课时36日期转换
课时37日期格式化
课时38日期抽取
章节5数据可视化
课时39散点图
课时40折线图
课时41饼图
课时42柱形图
课时43直方图
章节6网页数据抓取
课时44HTML简述
课时45JSON简述
课时46网页结构分析
课时47解析网页
课时48综合案例
章节7连接MySQL
课时49Python & MySQL
章节8数据分析
课时50基本统计
课时51分组分析
课时52分布分析
课时53交叉分析
课时54结构分析
课时55相关分析
系列二:《Python数据分析班(视频+课件+源码)》
第一课 Python入门 (王)
1.Python安装
2.常用数据分析库NumPy、Scipy、Pandas、matplotlib安装
3.常用高级数据分析库scikit-learn、NLTK安装
4.IPython的安装与使用
5.Python2与Python3区别简介
案例:Python常用科学计算
第二课 数据准备与Numpy (应)
1.多维数组对象
2.元素级别处理函数
3.利用数组进行数据处理
4.文件输入输出
5.线性代数相关功能以及线性代数基础知识
6.随机数的生成
案例:通过实际代码演示NumPy的多维数组与线性代数矩阵操作,以及数据输入输出
第三课 Python数据分析主力Pandas (应)
1.基本数据结构
2.基本功能:索引,选取,过滤,排序…
3.基本统计功能
4.缺失数据处理
5.层次化索引
案例:通过实际代码演示pandas处理及统计数据
第四课 数据获取与处理 (寒)
1.工业界常见数据格式与形态
2.python对不同格式的数据读写
3.pandas数据处理复习
4.数据简易爬取与解析
5.正则表达式:快捷捕捉你想要的信息
案例:简易网页爬取与数据解析处理
第五课 数据可视化Matplotlib (冯)
1.信息可视化和数据可视化的基本原理
2.常见可视化的方式
3.如何针对数据特点设计可视化方案
案例:一典型可视化方式的实现(提供课堂ipython代码实例)
第六课 Python文本分析NLTK (加)
1.分词
2.词性标注
3.情感分析
4.词形还原
5.拼写检查
6.文本分类
案例:一个典型文本分类流程的实现
第七课 python 社交网络分析igraph(王)
1.社交网络分析指标介绍
2.pagerank算法
3.igraph中多种社区发现算法介绍
案例:如何构造一个图,节点、边操作,以及基础图算法使用和可视化案例
第八课 Python机器学习scikit-learn(冯)
1.scikit-learn简介
2.机器学习的处理流程:以scikit-learn为例
3.scikit-learn的优化方法(并行化处理,cython的使用等)
案例:以手写数字识别和房价预估为例,如何利用sklearn进行机器学习的特征转化、建模、可视化,以及最后的模型评估
第九课 数据科学完整案例:学会使用你的“瑞士军刀”(寒)
1.数据获取与解析:你爱的足球队
2.用“数据”的眼睛去看球:“一个人完成的央视数据统计”
3.球员数据统计与可视化:“到底谁是最好的球员?”
案例说明:从抓取数据、解析数据、分析数据,到可视化、建模完整走一遍,从实际案例中一举窥探数学科学完整工作流程
第十课 Python分布式计算 (王)
1.Python多进程模块Multiprocessing
2.Python使用Hadoop分布式计算库mrjob
3.Python使用Spark分布式计算库PySpark
案例:分别使用MapReduce和Spark实现wordcount
系列三《十五周完完全全学python数据分析》:(20元)
课程大纲:
第一部分. Python基础
第一课:Python的概览——Python的基本介绍、安装与基本语法、变量类型与运算符
第二课:了解Python流程控制——条件、循环语句与其他语句
第三课:常用函数——函数的定义与使用方法、主要内置函数的介绍
第四课:NumPy基础——数组的创建、组合与分割
第二部分 数据分析的准备
第五课:了解数据——数据加载、储存与文件格式;异常值的清理与缺失值处理
第六课:数据清洗与初步分析——数据清理、转换、合并与重塑;数据汇总与描述统计;
第七课:绘图与可视化——基本绘图命令与图形概览、图形元素设定与实例:地震危机数据的可视化
第八课:数据聚合与分组处理——数据聚合、分组运算与转换、透视表与交叉表
第三部分 数据分析初探
第九课:假设检验——常用假设检验与实例分析
第十课:线性回归——线性回归模型、分析结果呈现与解读;实例:商品价格预测
第十一课: logistic回归——logistic回归模型讲解;实例:电信客户流失分析
第十二课:时间序列分析——时间序列基本处理、时间序列模型构建与结果解读;实例:未来股票价格预测
第四部分 深入数据分析
第十三课:分类算法——knn、决策树、贝叶斯分类器等算法介绍;实例:网页注册用户预测
第十四课:聚类算法——k-means算法介绍;实例:通信基站聚类分析
第十五课:降维方法——主成分分析与因子分析算法介绍;实例:地区经济指标评分
系列四:Python可视化分析教程(新增)
1.课程简介和环境搭建16:26
2.Numpy简介12:47
3.散点图12:16
4.折线图11:14
5.条形图10:23
6.直方图09:30
7.饼状图06:39
8.箱形图07:35
9.颜色和样式12:40
10.面向对象 VS Matlab Style09:18
11.子图-subplot07:46
12.多图-figure03:03
13.网格08:03
14.图例_legend12:09
15.坐标轴范围06:08
16.坐标轴刻度14:56
17.添加坐标轴09:15
18.注释09:29
19.文字10:40
20.Tex公式16:33
21.工具栏04:49
22.区域填充11:20
23.形状10:26
24.样式-美化13:41
25.极坐标09:03
26.函数积分图(一)14:09
27.函数积分图(二)17:29
28.散点-条形图(一)14:53
29.散点-条形图(二)14:41
30.球员能力图(一)15:37
31.球员能力图(二)15:34
32.股票K线图(一)10:04
33.股票K线图(二)12:03
系列五:2017年5月最新数据分析升级班(视频+代码+课件)
课程大纲:
第一课 工作环境准备及数据分析建模理论基础 (2课时)
1. 课程介绍
2. Python语言基础及Python 3.x新特性
3. 使用NumPy和SciPy进行科学计算
4. 数据分析建模理论基础
a. 数据分析建模过程
b. 常用的数据分析建模工具
5. 实战案例:科技工作者心理健康数据分析(Mental Health in Tech Survey)
第二课 数据采集与操作 (2课时)
1. 本地数据的采集与操作
a. 常用格式的本地数据读写
b. Python的数据库基本操作
2. 网络数据的获取与表示
a. BeautifulSoup解析网页
b. 爬虫框架Scrapy基础
3. 回归分析– Logistic回归
4. 实战案例:获取国内城市空气质量指数数据
第三课 数据分析工具Pandas (2-3课时)
1. Pandas的数据结构
2. Pandas的数据操作
a. 数据的导入、导出
b. 数据的过滤筛选
c. 索引及多重索引
3. Pandas统计计算和描述
4. 数据的分组与聚合
5. 数据清洗、合并、转化和重构
6. 聚类模型 — K-Means
7. 实战案例:全球食品数据分析(World Food Facts)
第四课 数据可视化 (2课时)
1. Matplotlib绘图
2. Pandas绘图
3. Seaborn绘图
4. 交互式数据可视化 — Bokeh绘图
5. 实战案例:世界高峰数据可视化 (World’s Highest Mountains)
第五课 时间序列数据分析 (2课时)
1. Python的日期和时间处理及操作
2. Pandas的时间序列数据处理及操作
3. 时间数据重采样
4. 时间序列数据统计 — 滑动窗口
5. 时序模型 — ARIMA
6. 实战案例:股票数据分析
第六课 文本数据分析 (2课时)
1. Python文本分析工具NLTK
2. 分词
3. 情感分析
4. 文本分类
5. 分类与预测模型 — 朴素贝叶斯
6. 实战案例:微博情感分析
第七课 图像数据处理及分析 (2课时)
1. 基本的图像操作和处理
2. 常用的图像特征描述
3. 分类与预测模型 — 人工神经网络
4. 实战案例:电影口碑与海报图像的相关性分析
第八课 机器学习基础及机器学习库scikit-learn (2课时)
1. 机器学习基础
2. Python机器学习库scikit-learn
3. 特征降维 — 主成分分析
4. 实战案例:识别Twitter用户性别 (Twitter User Gender Classification)
第九课 项目实战:通过移动设备行为数据预测使用者的性别和年龄(2课时)
1. 交叉验证及参数调整
2. 特征选择
3. 项目实操
4. 课程总结
系列六:2018python数据分析与机器学习实战(视频+源码+课件)
目录
章节1:人工智能入门指南(有基础的同学请略过!)
课时1课程介绍(主题与大纲)10:46
课时2AI时代首选Python09:20
课时3Python我该怎么学04:21
课时4人工智能的核心-机器学习10:35
课时5机器学习怎么学?08:37
课时6算法推导与案例08:19
章节2:Python科学计算库-Numpy
课时7使用Anaconda安装python环境(Python新手先看这个)13:10
课时8课程数据,代码,PPT(在参考资料界面)
课时9科学计算库Numpy10:32
课时10Numpy基础结构10:41
课时11Numpy矩阵基础05:55
课时12Numpy常用函数12:02
课时13矩阵常用操作10:18
课时14不同复制操作对比10:49
章节3:python数据分析处理库-Pandas
课时15Pandas数据读取11:50
课时16Pandas索引与计算10:26
课时17Pandas数据预处理实例13:01
课时18Pandas常用预处理方法11:11
课时19Pandas自定义函数07:44
课时20Series结构12:29
章节4:Python数据可视化库-Matplotlib
课时21折线图绘制08:25
课时22子图操作14:05
课时23条形图与散点图10:12
课时24柱形图与盒图10:17
课时25细节设置06:13
章节5:Python可视化库Seaborn
课时26Seaborn简介02:44
课时27整体布局风格设置07:48
课时28风格细节设置06:50
课时29调色板10:40
课时30调色板颜色设置08:18
课时31单变量分析绘图09:38
课时32回归分析绘图08:53
课时33多变量分析绘图10:36
课时34分类属性绘图09:40
课时35Facetgrid使用方法08:50
课时36Facetgrid绘制多变量08:30
课时37热度图绘制14:19
章节6:线性回归算法原理推导
课时38线性回归算法概述14:24
课时39误差项分析11:33
课时40似然函数求解09:36
课时41目标函数推导09:22
课时42线性回归求解10:57
章节7:梯度下降策略
课时43梯度下降原理11:42
课时44梯度下降方法对比07:20
课时45学习率对结果的影响06:09
章节8:逻辑回归算法
课时46逻辑回归算法原理推导10:52
课时47逻辑回归求解14:59
章节9:案例实战:Python实现逻辑回归与梯度下降策略
课时48Python实现逻辑回归任务概述07:34
课时49完成梯度下降模块12:51
课时50停止策略与梯度下降案例10:55
课时51实验对比效果10:25
章节10:项目实战-交易数据异常检测
课时52案例背景和目标08:32
课时53样本不均衡解决方案10:18
课时54下采样策略06:36
课时55交叉验证13:03
课时56模型评估方法13:06
课时57正则化惩罚08:09
课时58逻辑回归模型07:37
课时59混淆矩阵08:53
课时60逻辑回归阈值对结果的影响10:01
课时61SMOTE样本生成策略15:51
章节11:决策树算法
课时62决策树原理概述12:25
课时63衡量标准-熵11:04
课时64决策树构造实例10:09
课时65信息增益率05:49
课时66决策树剪枝策略15:31
章节12:案例实战:使用sklearn构造决策树模型
课时67决策树复习08:55
课时68决策树涉及参数11:09
课时69树可视化与sklearn库简介18:14
课时70sklearn参数选择11:46
章节13:集成算法与随机森林
课时71集成算法-随机森林12:03
课时72特征重要性衡量13:51
课时73提升模型11:15
课时74堆叠模型07:09
章节14:案例实战:泰坦尼克获救预测
课时75船员数据分析11:02
课时76数据预处理11:39
课时77使用回归算法进行预测12:13
课时78使用随机森林改进模型13:25
课时79随机森林特征重要性分析15:55
章节15:贝叶斯算法
课时80贝叶斯算法概述06:58
课时81贝叶斯推导实例07:38
课时82贝叶斯拼写纠错实例11:46
课时83垃圾邮件过滤实例14:10
课时84贝叶斯实现拼写检查器12:21
章节16:Python文本数据分析:新闻分类任务
课时85文本分析与关键词提取12:11
课时86相似度计算11:44
课时87新闻数据与任务简介10:20
课时88TF-IDF关键词提取13:28
课时89LDA建模09:10
课时90基于贝叶斯算法进行新闻分类14:53
章节17:支持向量机
课时91支持向量机要解决的问题10:06
课时92距离与数据的定义10:33
课时93目标函数09:41
课时94目标函数求解11:27
课时95SVM求解实例13:45
课时96支持向量的作用11:53
课时97软间隔问题06:46
课时98SVM核变换16:52
章节18:案例:SVM调参实例
课时99sklearn求解支持向量机11:24
课时100SVM参数选择14:00
章节19:聚类算法-Kmeans
课时101KMEANS算法概述11:34
课时102KMEANS工作流程09:42
课时103KMEANS迭代可视化展示08:20
课时104使用Kmeans进行图像压缩07:58
章节20:聚类算法-DBSCAN
课时105DBSCAN聚类算法11:04
课时106DBSCAN工作流程15:03
课时107DBSCAN可视化展示08:52
章节21:案例实战:聚类实践
课时108多种聚类算法概述04:34
课时109聚类案例实战17:19
章节22:降维算法-PCA主成分分析
课时110PCA降维概述08:39
课时111PCA要优化的目标12:22
课时112PCA求解10:18
课时113PCA实例08:34
章节23:神经网络
课时114初识神经网络11:28
课时115计算机视觉所面临的挑战09:40
课时116K近邻尝试图像分类10:01
课时117超参数的作用10:31
课时118线性分类原理09:35
课时119神经网络-损失函数09:18
课时120神经网络-正则化惩罚项07:19
课时121神经网络-softmax分类器13:39
课时122神经网络-最优化形象解读06:47
课时123神经网络-梯度下降细节问题11:49
课时124神经网络-反向传播15:17
课时125神经网络架构10:11
课时126神经网络实例演示10:39
课时127神经网络过拟合解决方案15:54
课时128感受神经网络的强大11:30
章节24:Xgboost集成算法
课时129集成算法思想05:35
课时130xgboost基本原理11:07
课时131xgboost目标函数推导12:18
课时132xgboost求解实例11:29
课时133xgboost安装03:32
课时134xgboost实战演示14:44
课时135Adaboost算法概述13:01
章节25:自然语言处理词向量模型-Word2Vec
课时136自然语言处理与深度学习11:58
课时137语言模型06:16
课时138-N-gram模型08:32
课时139词向量09:28
课时140神经网络模型10:03
课时141Hierarchical Softmax10:01
课时142CBOW模型实例11:21
课时143CBOW求解目标05:39
课时144梯度上升求解10:11
课时145负采样模型07:15
章节26:使用Gensim库构造中文维基百度数据词向量模型
课时146使用Gensim库构造词向量06:22
课时147维基百科中文数据处理10:27
课时148Gensim构造word2vec模型08:52
课时149测试模型相似度结果07:42
章节27:scikit-learn模型建立与评估
课时150使用python库分析汽车油耗效率15:09
课时151使用scikit-learn库建立回归模型14:02
课时152使用逻辑回归改进模型效果13:12
课时153 模型效果衡量标准20:09
课时154ROC指标与测试集的价值14:31
课时155交叉验证15:15
课时156多类别问题15:52
章节28:Python库分析科比生涯数据
课时157Kobe Bryan生涯数据读取与简介07:45
课时158特征数据可视化展示11:41
课时159数据预处理12:32
课时160使用Scikit-learn建立模型10:12
章节29:Python时间序列分析
课时161章节简介01:03
课时162Pandas生成时间序列11:28
课时163Pandas数据重采样09:22
课时164Pandas滑动窗口07:47
课时165数据平稳性与差分法11:10
课时166ARIMA模型10:34
课时167相关函数评估方法10:46
课时168建立ARIMA模型07:48
课时169参数选择12:40
课时170股票预测案例09:57
课时171使用tsfresh库进行分类任务12:04
课时172维基百科词条EDA14:30
章节30:机器学习项目实战-贷款申请最大化利润
课时173数据清洗过滤无用特征12:08
课时174数据预处理10:12
课时175获得最大利润的条件与做法13:26
课时176预测结果并解决样本不均衡问题12:47
章节31:机器学习项目实战-用户流失预警
课时177数据背景介绍06:35
课时178数据预处理10:05
课时179尝试多种分类器效果08:32
课时180结果衡量指标的意义19:50
课时181应用阈值得出结果06:26
章节32:探索性数据分析-足球赛事数据集
课时182内容简介02:13
课时183数据背景介绍10:30
课时184数据读取与预处理13:09
课时185数据切分模块14:42
课时186缺失值可视化分析13:27
课时187特征可视化展示12:23
课时188多特征之间关系分析11:21
课时189报表可视化分析10:38
课时190红牌和肤色的关系17:16
章节33:探索性数据分析-农粮组织数据集
课时191数据背景简介11:05
课时192数据切片分析17:26
课时193单变量分析15:21
课时194峰度与偏度11:37
课时195数据对数变换09:43
课时196数据分析维度06:55
课时197变量关系可视化展示12:22
章节34:机器学习项目实战-HTTP日志聚类分析
课时198建立特征工程17:25
课时199特征数据预处理10:34
课时200应用聚类算法得出异常IP
系列七:145课时带你完完全全成为Python数据分析师
章节1: 如何七周成为数据分析师
课时1:为什么需要七周 免费 16:46
课时2:七周应该怎么学 免费 10:22
章节2: 第一周:数据分析思维
课时3:为什么思维重要 02:30
课时4:数据分析的三种核心思维(结构化) 26:34
课时5:数据分析的三种核心思维(公式化) 19:17
课时6:数据分析的三种核心思维(业务化) 14:01
课时7:数据分析的思维技巧(象限法) 04:37
课时8:数据分析的思维技巧(多维法) 05:47
课时9:数据分析的思维技巧(假设法) 07:36
课时10:数据分析的思维技巧(指数法) 18:23
课时11:数据分析的思维技巧(二八法) 03:24
课时12:数据分析的思维技巧(对比法) 04:54
课时13:数据分析的思维技巧(漏斗法) 01:28
课时14:如何在业务时间锻炼数据分析思维 09:16
章节3: 第二周:业务
课时15:为什么业务重要 02:59
课时16:经典的业务分析指标 11:47
课时17:市场营销指标 08:54
课时18:产品运营指标 16:23
课时19:用户行为指标 06:24
课时20:电子商务指标 04:06
课时21:流量指标 07:34
课时22:怎么生成指标 04:37
课时23:如何建立业务分析框架 01:15
课时24:市场营销模型 04:51
课时25:AARRR模型 06:05
课时26:用户行为模型 04:09
课时27:电子商务模型 02:49
课时28:流量模型 04:00
课时29:如何应对各类业务场景 04:15
课时30:如何应对各类业务场景(小练习) 18:02
课时31:数据化管理业务 02:02
章节4: 第三周:Excel
课时32:为什么要学习Excel 07:18
课时33:文本清洗函数 07:35
课时34:常见的文本清洗函数练习 13:35
课时35:关联匹配函数 13:57
课时36:逻辑运算函数 07:27
课时37:计算统计函数 11:23
课时38:时间序列函数 05:40
课时39:Excel的常见技巧 09:23
课时40:Excel工具(1) 06:50
课时41:Excel工具(2) 08:16
课时42:用Excel进行数据分析(1) 22:50
课时43:用Excel进行数据分析(2) 18:11
章节5: 第四周:数据可视化
课时44:数据可视化之美 08:23
课时45:常见的图表类型与应用 08:34
课时46:高级图表类型与应用 09:38
课时47:图表绘制 08:32
课时48:Excel绘图技巧 10:55
课时49:散点图 10:15
课时50:辅助列 13:25
课时51:复合图表 17:03
课时52:甘特图(1) 14:45
课时53:甘特图(2) 07:59
课时54:标靶图 10:54
课时55:杜邦分析法 25:21
课时56:Power BI入门 13:17
课时57:Power BI基础功能 21:14
课时58:Power BI操作技巧 14:21
课时59:用BI进行数据分析(1) 21:58
课时60:用BI进行数据分析(2) 20:00
课时61:Dashboard 15:55
章节6: 第五周:MySQL
课时62:MySQL安装 05:31
课时63:数据库 13:06
课时64:数据库实操 15:12
课时65:SQL select 18:18
课时66:SQL 条件查找 06:16
课时67:SQL group by 05:38
课时68:SQL group by 高级 13:00
课时69:SQL 函数 10:45
课时70:SQL 子查询 12:50
课时71:SQL join 23:41
课时72:SQL leetcode 15:50
课时73:SQL 加载 05:33
课时74:SQL 时间 05:48
课时75:SQL 练习(1) 21:58
课时76:SQL 练习(2) 18:13
课时77:SQL 连接 power bi 09:59
章节7: 第六周:统计学
课时78:描述统计学 08:46
课时79:分位数 08:15
课时80:标准差 17:31
课时81:权重统计 20:17
课时82:切比雪夫 13:38
课时83:箱线图 18:35
课时84:直方图 21:28
课时85:概率 13:22
课时86:贝叶斯 18:49
课时87:二项分布1 05:17
课时88:二项分布2 05:21
课时89:泊松分布 10:33
课时90:正态分布 17:32
课时91:假设检验 33:04
章节8: 第七周:Python
课时92:入门 12:25
课时93:数据类型 17:57
课时94:变量 07:17
课时95:列表 16:04
课时96:列表进阶 06:30
课时97:字典 12:34
课时98:集合 12:36
课时99:控制流 10:53
课时100:Python控制流循环 14:14
课时101:Python循环进阶 07:28
课时102:Python函数 16:41
课时103:高阶函数 09:36
课时104:第三方包 08:30
课时105:numpy 08:38
课时106:Python series 14:55
课时107:dataframe 17:03
课时108:Python dataframe查找 22:09
课时109:read_csv 13:45
课时110:计算 24:31
课时111:Python groupby 12:00
课时112:Python Pandas关联 20:21
课时113:Python Pandas 多重索引 08:58
课时114:Python Pandas 文本函数 06:17
课时115:Python Pandas 去重 09:51
课时116:Python Pandas apply 10:45
课时117:Python Pandas 聚合 apply 10:26
课时118:Python Pandas 数据透视 14:26
课时119:Python 连接数据库 25:40
课时120:Python连接数据库2 10:08
课时121:Python 连接数据库3 07:40
课时122:Python 练习 markdown 05:32
课时123:Python 练习(1) 11:35
课时124:Python 练习(2) 14:49
课时125:Python 练习(3) 23:12
课时126:Python 练习(4) 18:30
课时127:Python 练习(5) 13:52
课时128:Python 练习(6) 16:29
课时129:Python 练习(7) 15:40
课时130:Python 练习(8) 09:50
课时131:Python 练习(9) 08:30
课时132:Python 可视化(1) 07:45
课时133:Python 可视化(2) 08:51
课时134:Python 可视化(3) 06:57
课时135:Python 可视化(4) 12:11
课时136:Python 可视化(5) 06:30
课时137:Python 可视化(6) 07:52
课时138:Python 可视化(7) 14:20
课时139:Python 可视化(8) 15:00
课时140:Python seaborn 01 05:37
课时141:Python seaborn 02 07:20
课时142:Python seaborn 03 10:26
课时143:Python Seaborn 04 10:44
课时144:Python Seaborn 05 08:27
课时145:Python seaborn 06 06:20
获取资料联系Q 86723638