0 0 0

Python机器学习基础教程.pdf

女痞
1天前 170
我用夸克网盘分享了「 Python机器学习基础教程.pdf」,点击链接即可保存。打开「夸克APP」在线查看,支持多种文档格式转换。
作者: [德] 安德里亚斯·穆勒/[美] 莎拉·吉多 出版社: 人民邮电出版社 原作名: Introduction to Machine Learning with Python 译者: 张亮 出版年: 2018-1 页数: 300 定价: 79.00元 装帧: 平装 ISBN: 9787115475619

内容简介

本书是机器学习入门书,以Python语言介绍。主要内容包括:机器学习的基本概念及其应用;实践中最常用的机器学习算法以及这些算法的优缺点;在机器学习中待处理数据的呈现方式的重要性,以及应重点关注数据的哪些方面;模型评估和调参的高级方法,重点讲解交叉验证和网格搜索;管道的概念;如何将前面各章的方法应用到文本数据上,还介绍了一些文本特有的处理方法。

作者简介

Andreas C. Müller scikit-learn库维护者和核心贡献者。现任哥伦比亚大学数据科学研究院讲师,曾任纽约大学数据科学中心助理研究员、亚马逊公司计算机视觉应用的机器学习研究员。在波恩大学获得机器学习博士学位。 Sarah Guido Mashable公司数据科学家,曾担任Bitly公司首席数据科学家。

网友热评

我就趴着: 在youtube上看过课,只能说老师很害羞...很吸引人..... yezhang: 很简单,非常适合入门,那些说这本书在教调包或者太简单的,是看不到书名写的“基础教程”?总之这是本好书,作者后续也提出了如何进一步学习原理和更好的编程,算是有始有终了。 undefined root: 看了毕设需要的部分:除三七都看了。 也是本手册,每次使用某个api都有解释,可以用作论文的过渡句。 Be不功利的卷王: sklearn工具书,需要的时候翻出来查一查。其实只码了一半,不过实操过后更有信心

图书目录

目录 前言ix 第1章 引言1 1.1 为何选择机器学习1 1.1.1 机器学习能够解决的问题2 1.1.2 熟悉任务和数据4 1.2 为何选择Python4 1.3 scikit-learn4 1.4 必要的库和工具5 1.4.1 JupyterNotebook6 1.4.2 NumPy6 1.4.3 SciPy6 1.4.4 matplotlib7 1.4.5 pandas8 1.4.6 mglearn9 1.5 Python2与Python3的对比9 1.6 本书用到的版本10 1.7 第一个应用:鸢尾花分类11 1.7.1 初识数据12 1.7.2 衡量模型是否成功:训练数据与测试数据14 1.7.3 要事第一:观察数据15 1.7.4 构建第一个模型:k近邻算法16 1.7.5 做出预测17 1.7.6 评估模型18 1.8 小结与展望19 第2章 监督学习21 2.1 分类与回归21 2.2 泛化、过拟合与欠拟合22 2.3 监督学习算法24 2.3.1 一些样本数据集25 2.3.2 k近邻28 2.3.3 线性模型35 2.3.4 朴素贝叶斯分类器53 2.3.5 决策树54 2.3.6 决策树集成64 2.3.7 核支持向量机71 2.3.8 神经网络(深度学习)80 2.4 分类器的不确定度估计91 2.4.1 决策函数91 2.4.2 预测概率94 2.4.3 多分类问题的不确定度96 2.5 小结与展望98 第3章 无监督学习与预处理100 3.1 无监督学习的类型100 3.2 无监督学习的挑战101 3.3 预处理与缩放101 3.3.1 不同类型的预处理102 3.3.2 应用数据变换102 3.3.3 对训练数据和测试数据进行相同的缩放104 3.3.4 预处理对监督学习的作用106 3.4 降维、特征提取与流形学习107 3.4.1 主成分分析107 3.4.2 非负矩阵分解120 3.4.3 用t-SNE进行流形学习126 3.5 聚类130 3.5.1 k均值聚类130 3.5.2 凝聚聚类140 3.5.3 DBSCAN143 3.5.4 聚类算法的对比与评估147 3.5.5 聚类方法小结159 3.6 小结与展望159 第4章 数据表示与特征工程161 4.1 分类变量161 4.1.1 One-Hot编码(虚拟变量)162 4.1.2 数字可以编码分类变量166 4.2 分箱、离散化、线性模型与树168 4.3 交互特征与多项式特征171 4.4 单变量非线性变换178 4.5 自动化特征选择181 4.5.1 单变量统计181 4.5.2 基于模型的特征选择183 4.5.3 迭代特征选择184 4.6 利用专家知识185 4.7 小结与展望192 第5章 模型评估与改进193 5.1 交叉验证194 5.1.1 scikit-learn中的交叉验证194 5.1.2 交叉验证的优点195 5.1.3 分层k折交叉验证和其他策略196 5.2 网格搜索200 5.2.1 简单网格搜索201 5.2.2 参数过拟合的风险与验证集202 5.2.3 带交叉验证的网格搜索203 5.3 评估指标与评分213 5.3.1 牢记目标213 5.3.2 二分类指标214 5.3.3 多分类指标230 5.3.4 回归指标232 5.3.5 在模型选择中使用评估指标232 5.4 小结与展望234 第6章 算法链与管道236 6.1 用预处理进行参数选择237 6.2 构建管道238 6.3 在网格搜索中使用管道239 6.4 通用的管道接口242 6.4.1 用make_pipeline方便地创建管道243 6.4.2 访问步骤属性244 6.4.3 访问网格搜索管道中的属性244 6.5 网格搜索预处理步骤与模型参数246 6.6 网格搜索选择使用哪个模型248 6.7 小结与展望249 第7章 处理文本数据250 7.1 用字符串表示的数据类型250 7.2 示例应用:电影评论的情感分析252 7.3 将文本数据表示为词袋254 7.3.1 将词袋应用于玩具数据集255 7.3.2 将词袋应用于电影评论256 7.4 停用词259 7.5 用tf-idf缩放数据260 7.6 研究模型系数263 7.7 多个单词的词袋(n元分词)263 7.8 分词、词干提取与词形还原267 7.9 主题建模与文档聚类270 7.10 小结与展望277 第8章 全书总结278 8.1 处理机器学习问题278 8.2 从原型到生产279 8.3 测试生产系统280 8.4 构建你自己的估计器280 8.5 下一步怎么走281 8.5.1 理论281 8.5.2 其他机器学习框架和包281 8.5.3 排序、推荐系统与其他学习类型282 8.5.4 概率建模、推断与概率编程282 8.5.5 神经网络283 8.5.6 推广到更大的数据集283 8.5.7 磨练你的技术284 8.6 总结284 关于作者285 关于封面285

Python机器学习基础教程.pdf"网盘下载"

版权说明

1、本站不保存、不存储任何实质资源,以上二维码指向为网盘资源链接,其内容归对应版权方所有
2、如有侵犯版权的情况,请点击下面举报/反馈按钮反馈或发送邮件76556431@qq.com投诉说明情况
3、我们核实后将第一时间删除相关页面内容,谢谢理解和配合

这些人下载过 (12)
  • 北海森屿
  • 北荒玄武
  • 往我伤口上撒盐你真疼我
  • 清嫩少女音
  • 林中雨亭
  • 千秋万象
  • 过往
  • 逗比逗比闪亮亮
  • 一页
  • 夜的第七章
  • 古旧钟摆
  • 对称唱戏
最新回复 (0)

    暂无评论

请先登录后发表评论!

返回
请先登录后发表评论!