線上閱讀
本書提供兩種檔案格式,請選擇開啟:
EPUB彈性排版,可依載具大小自動斷行或換頁,較適合小螢幕閱讀。
書籍內容
TOP
本書以Python 3版本作為數據分析與挖掘實戰的應用工具,從Pyhton的基礎語法開始,陸續介紹有關數值計算的Numpy、數據處理的Pandas、數據可視化的Matplotlib和數據挖掘的Sklearn等內容。全書共涵蓋15種可視化圖形以及10個常用的數據挖掘算法和實戰項目,通過本書的學習,讀者可以掌握數據分析與挖掘的理論知識和實戰技能。 本書適於統計學、數學、經濟學、金融學、管理學以及相關理工科專業的本科生、研究生使用,也能夠提高從事數據諮詢、研究或分析等人士的專業水平和技能。
- 目錄
-
封面页
-
书名页
-
版权页
-
作者简介
-
内容简介
-
前言
-
目录
-
第1章 数据分析与挖掘概述
-
1.1 什么是数据分析和挖掘
-
1.2 数据分析与挖掘的应用领域
-
1.2.1 电商领域——发现破坏规则的“害群之马”
-
1.2.2 交通出行领域——为打车平台进行私人订制
-
1.2.3 医疗健康领域——找到最佳医疗方案
-
1.3 数据分析与挖掘的区别
-
1.4 数据挖掘的流程
-
1.4.1 明确目标
-
1.4.2 数据搜集
-
1.4.3 数据清洗
-
1.4.4 构建模型
-
1.4.5 模型评估
-
1.4.6 应用部署
-
1.5 常用的数据分析与挖掘工具
-
1.6 本章小结
-
第2章 从收入的预测分析开始
-
2.1 下载与安装Anoconda
-
2.1.1 基于Windows系统安装
-
2.1.2 基于Mac系统安装
-
2.1.3 基于Linux系统安装
-
2.2 基于Python的案例实战
-
2.2.1 数据的预处理
-
2.2.2 数据的探索性分析
-
2.2.3 数据建模
-
2.3 本章小结
-
第3章 Python快速入门
-
3.1 数据结构及方法
-
3.1.1 列表
-
3.1.2 元组
-
3.1.3 字典
-
3.2 控制流
-
3.2.1 if分支
-
3.2.2 for循环
-
3.2.3 while循环
-
3.3 字符串处理方法
-
3.3.1 字符串的常用方法
-
3.3.2 正则表达式
-
3.4 自定义函数
-
3.4.1 自定义函数语法
-
3.4.2 自定义函数的几种参数
-
3.5 一个爬虫案例
-
3.6 本章小结
-
第4章 Python数值计算工具——Numpy
-
4.1 数组的创建与操作
-
4.1.1 数组的创建
-
4.1.2 数组元素的获取
-
4.1.3 数组的常用属性
-
4.1.4 数组的形状处理
-
4.2 数组的基本运算符
-
4.2.1 四则运算
-
4.2.2 比较运算
-
4.2.3 广播运算
-
4.3 常用的数学和统计函数
-
4.4 线性代数的相关计算
-
4.4.1 矩阵乘法
-
4.4.2 diag函数的使用
-
4.4.3 特征根与特征向量
-
4.4.4 多元线性回归模型的解
-
4.4.5 多元一次方程组的求解
-
4.4.6 范数的计算
-
4.5 伪随机数的生成
-
4.6 本章小结
-
第5章 Python数据处理工具——Pandas
-
5.1 序列与数据框的构造
-
5.1.1 构造序列
-
5.1.2 构造数据框
-
5.2 外部数据的读取
-
5.2.1 文本文件的读取
-
5.2.2 电子表格的读取
-
5.2.3 数据库数据的读取
-
5.3 数据类型转换及描述统计
-
5.4 字符与日期数据的处理
-
5.5 常用的数据清洗方法
-
5.5.1 重复观测处理
-
5.5.2 缺失值处理
-
5.5.3 异常值处理
-
5.6 数据子集的获取
-
5.7 透视表功能
-
5.8 表之间的合并与连接
-
5.9 分组聚合操作
-
5.10 本章小结
-
第6章 Python数据可视化
-
6.1 离散型变量的可视化
-
6.1.1 饼图
-
6.1.2 条形图
-
6.2 数值型变量的可视化
-
6.2.1 直方图与核密度曲线
-
6.2.2 箱线图
-
6.2.3 小提琴图
-
6.2.4 折线图
-
6.3 关系型数据的可视化
-
6.3.1 散点图
-
6.3.2 气泡图
-
6.3.3 热力图
-
6.4 多个图形的合并
-
6.5 本章小结
-
第7章 线性回归预测模型
-
7.1 一元线性回归模型
-
7.2 多元线性回归模型
-
7.2.1 回归模型的参数求解
-
7.2.2 回归模型的预测
-
7.3 回归模型的假设检验
-
7.3.1 模型的显著性检验——F检验
-
7.3.2 回归系数的显著性检验——t检验
-
7.4 回归模型的诊断
-
7.4.1 正态性检验
-
7.4.2 多重共线性检验
-
7.4.3 线性相关性检验
-
7.4.4 异常值检验
-
7.4.5 独立性检验
-
7.4.6 方差齐性检验
-
7.5 本章小结
-
第8章 岭回归与LASSO回归模型
-
8.1 岭回归模型
-
8.1.1 参数求解
-
8.1.2 系数求解的几何意义
-
8.2 岭回归模型的应用
-
8.2.1 可视化方法确定λ值
-
8.2.2 交叉验证法确定λ值
-
8.2.3 模型的预测
-
8.3 LASSO回归模型
-
8.3.1 参数求解
-
8.3.2 系数求解的几何意义
-
8.4 LASSO回归模型的应用
-
8.4.1 可视化方法确定λ值
-
8.4.2 交叉验证法确定λ值
-
8.4.3 模型的预测
-
8.5 本章小结
-
第9章 Logistic回归分类模型
-
9.1 Logistic模型的构建
-
9.1.1 Logistic模型的参数求解
-
9.1.2 Logistic模型的参数解释
-
9.2 分类模型的评估方法
-
9.2.1 混淆矩阵
-
9.2.2 ROC曲线
-
9.2.3 K-S曲线
-
9.3 Logistic回归模型的应用
-
9.3.1 模型的构建
-
9.3.2 模型的预测
-
9.3.3 模型的评估
-
9.4 本章小结
-
第10章 决策树与随机森林
-
10.1 节点字段的选择
-
10.1.1 信息增益
-
10.1.2 信息增益率
-
10.1.3 基尼指数
-
10.2 决策树的剪枝
-
10.2.1 误差降低剪枝法
-
10.2.2 悲观剪枝法
-
10.2.3 代价复杂度剪枝法
-
10.3 随机森林
-
10.4 决策树与随机森林的应用
-
10.4.1 分类问题的解决
-
10.4.2 预测问题的解决
-
10.5 本章小结
-
第11章 KNN模型的应用
-
11.1 KNN算法的思想
-
11.2 最佳k值的选择
-
11.3 相似度的度量方法
-
11.3.1 欧式距离
-
11.3.2 曼哈顿距离
-
11.3.3 余弦相似度
-
11.3.4 杰卡德相似系数
-
11.4 近邻样本的搜寻方法
-
11.4.1 KD树搜寻法
-
11.4.2 球树搜寻法
-
11.5 KNN模型的应用
-
11.5.1 分类问题的解决
-
11.5.2 预测问题的解决
-
11.6 本章小结
-
第12章 朴素贝叶斯模型
-
12.1 朴素贝叶斯理论基础
-
12.2 几种贝叶斯模型
-
12.2.1 高斯贝叶斯分类器
-
12.2.2 高斯贝叶斯分类器的应用
-
12.2.3 多项式贝叶斯分类器
-
12.2.4 多项式贝叶斯分类器的应用
-
12.2.5 伯努利贝叶斯分类器
-
12.2.6 伯努利贝叶斯分类器的应用
-
12.3 本章小结
-
第13章 SVM模型的应用
-
13.1 SVM简介
-
13.1.1 距离公式的介绍
-
13.1.2 SVM的实现思想
-
13.2 几种常见的SVM模型
-
13.2.1 线性可分的SVM
-
13.2.2 一个手动计算的案例
-
13.2.3 近似线性可分SVM
-
13.2.4 非线性可分SVM
-
13.2.5 几种常用的SVM核函数
-
13.2.6 SVM的回归预测
-
13.3 分类问题的解决
-
13.4 预测问题的解决
-
13.5 本章小结
-
第14章 GBDT模型的应用
-
14.1 提升树算法
-
14.1.1 AdaBoost算法的损失函数
-
14.1.2 AdaBoost算法的操作步骤
-
14.1.3 AdaBoost算法的简单例子
-
14.1.4 AdaBoost算法的应用
-
14.2 梯度提升树算法
-
14.2.1 GBDT算法的操作步骤
-
14.2.2 GBDT分类算法
-
14.2.3 GBDT回归算法
-
14.2.4 GBDT算法的应用
-
14.3 非平衡数据的处理
-
14.4 XGBoost算法
-
14.4.1 XGBoost算法的损失函数
-
14.4.2 损失函数的演变
-
14.4.3 XGBoost算法的应用
-
14.5 本章小结
-
第15章 Kmeans聚类分析
-
15.1 Kmeans聚类
-
15.1.1 Kmeans的思想
-
15.1.2 Kmeans的原理
-
15.2 最佳k值的确定
-
15.2.1 拐点法
-
15.2.2 轮廓系数法
-
15.2.3 间隔统计量法
-
15.3 Kmeans聚类的应用
-
15.3.1 iris数据集的聚类
-
15.3.2 NBA球员数据集的聚类
-
15.4 Kmeans聚类的注意事项
-
15.5 本章小结
-
第16章 DBSCAN与层次聚类分析
-
16.1 密度聚类简介
-
16.1.1 密度聚类相关的概念
-
16.1.2 密度聚类的步骤
-
16.2 密度聚类与Kmeans的比较
-
16.3 层次聚类
-
16.3.1 簇间的距离度量
-
16.3.2 层次聚类的步骤
-
16.3.3 三种层次聚类的比较
-
16.4 密度聚类与层次聚类的应用
-
16.5 本章小结
同類型書籍推薦
TOP