Python机器学习及实践——从零开始通往Kaggle竞赛之路(2022年度版) mobi 下载 网盘 caj lrf pdf txt 阿里云

Python机器学习及实践——从零开始通往Kaggle竞赛之路(2022年度版)精美图片
》Python机器学习及实践——从零开始通往Kaggle竞赛之路(2022年度版)电子书籍版权问题 请点击这里查看《

Python机器学习及实践——从零开始通往Kaggle竞赛之路(2022年度版)书籍详细信息

  • I***N:9787302614241
  • 作者:暂无作者
  • 出版社:暂无出版社
  • 出版时间:2022-10
  • 页数:368
  • 价格:97.00
  • 纸张:胶版纸
  • 装帧:平装-胶订
  • 开本:16开
  • 语言:未知
  • 丛书:暂无丛书
  • TAG:暂无
  • 豆瓣评分:暂无豆瓣评分
  • 豆瓣短评:点击查看
  • 豆瓣讨论:点击查看
  • 豆瓣目录:点击查看
  • 读书笔记:点击查看
  • 原文摘录:点击查看

寄语:

Python机器学习入门经典实践教材,近十位领域名家联合推荐。


内容简介:

本书在不涉及大量数学模型与复杂编程知识的前提下,从零开始逐步带领读者熟悉并掌握当下流行的基于Python 3的数据分析,以及支持单机、深度和分布式机器学习的开源程序库,如pandas、Scikitlearn、PyTorch、TensorFlow、PaddlePaddle、PySparkML等。全书分4部分。入门篇包括对全书核心概念的指南性介绍,以及在多种主流操作系统(Windows、macOS、Ubuntu)上配置基本编程环境的详细说明。基础篇涵盖Python 3的编程基础、基于pandas的数据分析,以及使用Scikitlearn解决大量经典的单机(单核/多核)机器学习问题。进阶篇介绍如何使用PyTorch、TensorFlow、PaddlePaddle搭建多种深度学习网络框架,以及如何基于PySpark的ML编程库完成一些常见的分布式机器学习任务。实践篇利用全书所讲授的Python编程、数据分析、机器学习知识,帮助读者挑战和参与Kaggle多种类型的竞赛实战,同时介绍如何使用Git在Gitee、GitHub平台上维护和管理日常代码与编程项目。 本书适合所有对人工智能领域,特别是机器学习、数据挖掘、自然语言处理等技术及其实践感兴趣的初学者。


书籍目录:

第1部分  入门篇

第1章  全书指南3

1.1Python编程3

1.2数据分析5

1.3机器学习6

1.3.1任务9

1.3.2经验10

1.3.3性能11

1.4Kaggle竞赛13

1.5Git代码管理14

1.6章  末小结15

第2章  基本环境搭建与配置16

2.1Windows操作系统下基本环境的搭建与配置16

2.1.1查看Windows的版本与原始配置16

2.1.2下载并安装Anaconda3(Windows)17

2.1.3使用Anaconda Navigator创建虚拟环境python_env(Windows)19

2.1.4在虚拟环境python_env下使用Anaconda Navigator安装

Jupyter Notebook与PyCharm Professional(Windows)20

2.2macOS操作系统下基本环境的搭建与配置21

2.2.1查看macOS的版本与原始配置21

2.2.2下载并安装Anaconda3(macOS)23

2.2.3使用Anaconda Navigator创建虚拟环境python_env(macOS)24

2.2.4在虚拟环境python_env下使用Anaconda Navigator安装

Jupyter Notebook与PyCharm Professional(macOS)24〖1〗Python机器学习及实践——从零开始通往Kaggle竞赛之路(2022年度版)〖1〗目录2.3Ubuntu操作系统下基本环境的搭建与配置26

2.3.1查看Ubuntu的版本与原始配置26

2.3.2下载并安装Anaconda3(Ubuntu)27

2.3.3在终端中创建虚拟环境python_env(Ubuntu)28

2.3.4在虚拟环境python_env下使用conda命令安装Jupyter 

Notebook(Ubuntu)29

2.4Jupyter Notebook使用简介31

2.4.1在虚拟环境python_env下启动Jupyter Notebook31

2.4.2创建一个.ipynb文件32

2.4.3试运行.ipynb文件内的Python 3程序33

2.***yCharm使用简介34

2.5.1在虚拟环境python_env下启动PyCharm34

2.5.2基于虚拟环境python_env的Python 3.8解释器创建一个

.py文件35

2.5.3试运行.py文件内的Python 3程序35

2.6章  末小结37

第2部分  基础篇

第3章  Python编程基础41

3.1Python编程环境配置41

3.1.1基于命令行/终端的交互式编程环境41

3.1.2基于Web的交互式开发环境42

3.1.3集成式开发环境43

3.2Python基本语法44

3.2.1赋值44

3.2.2注释45

3.2.3缩进46

3.***ython数据类型46

3.4Python数据运算49

3.***ython流程控制53

3.5.1分支语句53

3.5.2循环控制55

3.6Python函数设计56

3.7Python面向对象编程57

3.8Python编程库(包)导入60

3.9Python编程综合实践62

3.10章  末小结63

第4章  pandas数据分析64

4.1pandas环境配置65

4.1.1使用Anaconda Navigator搭建和配置环境66

4.1.2使用conda命令搭建和配置环境66

4.2pandas核心数据结构67

4.2.1Series68

4.2.2DataFrame69

4.3pandas读取/写入文件数据70

4.3.1读取/写入CSV文件数据70

4.3.2读取/写入JSON文件数据73

4.3.3读取/写入Excel文件数据76

4.4pandas数据分析的常用功能80

4.4.1添加数据80

4.4.2删除数据83

4.4.3查询/筛选数据84

4.4.4修改数据86

4.4.5数据统计87

4.4.6数据排序89

4.4.7函数应用90

4.5pandas数据合并92

4.6pandas数据清洗93

4.7pandas数据分组与聚合95

4.8章  末小结97

第5章  Scikitlearn单机机器学习98

5.1Scikitlearn环境配置99

5.1.1使用Anaconda Navigator搭建和配置环境100

5.1.2使用conda命令搭建和配置环境100

5.2Scikitlearn无监督学习102

5.2.1降维学习与可视化102

5.2.2聚类算法113

5.3Scikitlearn监督学习模型121

5.3.1分类预测121

5.3.2数值回归141

5.4Scikitlearn半监督学习模型154

5.4.1自学习框架155

5.4.2标签传播算法157

5.5单机机器学习模型的常用优化技巧159

5.5.1交叉验证160

5.5.2特征工程162

5.5.3参数正则化170

5.5.4超参数寻优174

5.5.5并行加速训练176

5.6章  末小结179

第3部分  进阶篇

第6章  PyTorch/TensorFlow/PaddlePaddle深度学习185

6.1PyTorch/TensorFlow/PaddlePaddle环境配置187

6.2前馈神经网络191

6.2.1前馈神经网络的PyTorch实践192

6.2.2前馈神经网络的TensorFlow实践197

6.2.3前馈神经网络的PaddlePaddle实践199

6.3卷积神经网络202

6.3.1卷积神经网络的PyTorch实践204

6.3.2卷积神经网络的TensorFlow实践208

6.3.3卷积神经网络的PaddlePaddle实践211

***循环神经网络214

***.1循环神经网络的PyTorch实践216

***.2循环神经网络的TensorFlow实践220

***.3循环神经网络的PaddlePaddle实践222

6.5自动编码器226

6.5.1自动编码器的PyTorch实践227

6.5.2自动编码器的TensorFlow实践231

6.5.3自动编码器的PaddlePaddle实践234

6.6神经网络模型的常用优化技巧238

6.6.1随机失活238

6.6.2批量标准化249

6.7章  末小结260

第7章  PySparkML分布式机器学习262

7.1PySpark环境配置264

7.1.1使用Anaconda Navigator搭建和配置环境264

7.1.2使用conda命令搭建和配置环境265

7.1.3安装JRE267

7.2PySpark分布式数据结构268

7.2.1RDD269

7.2.2DataFrame271

7.***ySpark分布式特征工程273

7.3.1特征抽取273

7.3.2特征转换279

7.4PySparkML分布式机器学习模型284

7.5分布式机器学习模型的常用优化技巧292

7.5.1留一验证293

7.5.2K折交叉验证295

7.6章  末小结297

第4部分  实践篇

第8章  Kaggle竞赛实践301

8.1泰坦尼克号罹难乘客预测302

8.1.1数据分析303

8.1.2数据预处理305

8.1.3模型设计与寻优306

8.1.4提交测试307

8.2Ames房产价值评估308

8.2.1数据分析309

8.2.2数据预处理315

8.2.3模型设计与寻优316

8.2.4提交测试317

8.3推特短文本分类318

8.3.1数据分析320

8.3.2数据预处理321

8.3.3模型设计与寻优322

8.3.4提交测试323

8.4CIFAR100图像识别324

8.4.1数据分析326

8.4.2数据预处理327

8.4.3模型设计与寻优328

8.4.4提交测试331

8.5章  末小结333

第9章  Git代码管理334

9.1Git本地环境搭建335

9.1.1Windows下Git工具的安装与配置335

9.1.2macOS下Git工具的安装与配置336

9.1.3Ubuntu下Git工具的安装与配置336

9.2Git远程仓库配置337

9.2.1GitHub介绍337

9.2.2GitHub远程仓库的创建与配置338

9.2.3Gitee介绍339

9.2.4Gitee远程仓库的创建与配置339

9.3Git基本指令340

9.3.1***仓库340

9.3.2提交修改341

9.3.3远程推送343

9.4Git分支管理343

9.4.1创建分支344

9.4.2分支合并345

9.4.3合并***346

9.4.4删除分支347

9.5贡献Git项目348

9.5.1Fork项目348

9.5.2本地***、修改与推送349

9.5.3发起拉取请求349

9.6章  末小结351

后记352

第1章  简介篇1

1.1机器学习综述1

1.1.1任务3

1.1.2经验5

1.1.3性能5

1.2Python编程库8

1.2.1为什么使用Python8

1.2.2Python机器学习的优势9

1.2.3NumPy & SciPy10

1.2.4Matplotlib11

1.2.5Scikitlearn11

1.2.6Pandas11

1.2.7Anaconda12

1.***ython环境配置12

1.3.1Windows系统环境12

1.3.2Mac OS 系统环境17

1.4Python编程基础18

1.4.1Python基本语法19

1.4.2Python 数据类型20

1.4.***ython 数据运算22

1.4.4Python 流程控制26

1.4.***ython 函数(模块)设计28

1.4.6Python 编程库(包)的导入29

1.4.7Python 基础综合实践30

1.5章  末小结33第2章  基础篇34

2.1监督学习经典模型34

2.1.1分类学习35

2.1.2回归预测64

2.2无监督学习经典模型81

2.2.1数据聚类81

2.2.2特征降维91

2.3章  末小结97

第3章  进阶篇98

3.1模型实用技巧98

3.1.1特征提升99

3.1.2模型正则化111

3.1.3模型检验121

3.1.4超参数搜索122

3.2流行库/模型实践129

3.2.1自然语言处理包(NLTK)131

3.2.2词向量(Word2Vec)技术133

3.2.3XGBoost模型138

3.2.4Tensorflow框架140

3.3章  末小结152

第4章  实战篇153

4.1Kaggle平台简介153

4.2Titanic罹难乘客预测157

4.3IMDB影评得分估计165

4.4MNIST手写体数字图片识别174

4.5章  末小结180

后记181

参考文献182


作者介绍:

暂无相关内容,正在全力查找中


出版社信息:

暂无出版社相关信息,正在全力查找中!


书籍摘录:

暂无相关书籍摘录,正在全力查找中!



原文赏析:

暂无原文赏析,正在全力查找中!


其它内容:

编辑推荐

该书帮助大量对机器学习、数据挖掘感兴趣的读者朋友整合时下流行的基于Python语言的程序库:如Scikit-learn,NLTK,XGBoost,TensorFlow等,并且针对现实中遇到的数据,甚至是Kaggle竞赛(时下世界流行的机器学习竞赛平台)中的分析任务,快速搭建有效的机器学习系统。

同时,作者力求减少读者为了理解本书,而对编程技能、数学背景的过分依赖;进而降低机器学习模型的实践门槛,让更多的兴趣爱好者体会到使用经典模型以及的高效方法解决实际问题的乐趣。同时,笔者对每一个关键术语都提供了标准的英文表述,也方便读者朋友更加快速查阅、理解相关的英文文献。


前言

在本书第1版付梓之后,我便继续投身于互联网人工智能(Artificial Intelligence,AI)新产品的研发领域。时隔近5年,回望这段时间,我亲身感受到了人工智能理论和技术日新月异的飞速发展。

在此期间,我看到了大量承载着人工智能前沿理念和技术的次时代原型产品被孵化出来,不断刷新着人类的认知:  波士顿动力(Boston Dynamics)公司的机器人Atlas可以像人类运动员一样实现跑步越障、后空翻和惊人的***跳动作;OpenAI设计的人工智能体能够在Dota 2这样环境复杂的策略对抗游戏中几乎“全面碾压”人类优秀选手;DeepMind构建的AlphaGo系列对弈程序接连战胜了多位人类围棋大师;国内外自动驾驶平台所支持的新型汽车陆续投入量产……同时,许多世界的科研人员在机器视觉、语音合成、阅读理解等人工智能的细分领域进行着不懈的理论探索,就在这短短几年间,我们不断听闻人工智能已经逐渐在这些细分领域超越人类的平均水平。而这些各自深耕的细分领域技术经过工程化的打磨和融合之后,又重新在一些既有的人工智能产品上给我们带来了全新的体验。例如,更加实时和准确的机器同声传译;或者是那些能和真人打电话,聊天过程完全不会尴尬,甚至有点“萌”的多轮对话语音助手。

这些新的技术进步和大量的读者来信时刻鞭策着我。许多表示本书第1版给予了他们莫大的帮助;同时也有资深的前辈指出了第1版中的疏漏和不足。这里,我一并诚挚地感谢大家。其实从本书第1版发行之后,我就一直有意继续跟进、维护和更新本书;怎奈步入职场之后,业余时间的确不如在校期间那般充裕,再版的计划一再被搁置。

这5年间,我也意识到书中一些重要的机器学习平台已经有了明显的变化。比起本书的第1版,Scikitlearn从0.17.0更新到0.24.2,并且其1.0版本也发布在即;TensorFlow也有多年的历史,版本号持续维护到2.6。期间,许多新的机器学习模型被添加到Scikitlearn与TensorFlow中,一些API也被调整和修改;许多其他的机器学习平台,如PyTorch、PaddlePaddle等,也逐渐受到更多的关注。上述现象都不停地暗示我应该做出改变了。因此,我在互联网人工智能产业界5年有余的积累之后,决定开始第2版《Python机器学习实践——从零开始通往Kaggle竞赛之路(2022年度版)》的规划和写作。

自这一版开始,本人将力争持续跟进Python、pandas、Scikitlearn、PyTorch、TensorFlow、PaddlePaddle,以及PySparkML的更新,及时推出再版,保持和维护全书内容的先进性和代码的可用性。同时,本书将继续延续我们的理念: 力求减少读者对编程技能和数学知识的过分依赖,进而降低理解本书与实践机器学习模型的门槛;试图让更多的兴趣爱好者体会到使用经典模型,乃至更加高效的方法解决实际问题的乐趣。

全书介绍的上述核心工具,均是作者本人长期总结行业经验,精心筛选后的成果。在面对现实中的工程或者科研问题,或参加一些公开的竞赛(如Kaggle、天池竞赛等)时,相信本书都能够帮助读者使用Python编程语言快速上手,并结合一系列经典的开源工具,搭建行之有效的计算机程序来解决实际问题。

在大数据时代,只要是与数据相关的从业人员,掌握Python编程、数据分析、机器学习的能力,都是不错的职业加分项。不论是在金融、统计、数理研究、社会科学、工业工程等领域的从业者,还是在互联网行业的程序员、数据分析师、运营人员、产品经理等,都会对本书有着不同程度的学习需求。

本书所介绍的知识也能够帮助读者通过一些专业类的考试,如人工智能工程师认证、注册数据分析师认证(CDA、CPDA)等。同时,鉴于内容的入门性和普适性,本书也可以被广泛用于初、高中生的信息学兴趣培训,专科职业教育,本科、研究生通识课程的讲授等。

衷心地希望每一位读者朋友都能够从本书获益,这也是对我的鼓励和支持。欢迎大家关注我的新浪微博https://weibo.com/fanmiaothu。普及人工智能,使机器学习的理论与实践成为一种大众的通识教育,始终是我编写本书的长期目标和动力。

下载地址1

下载地址2全书基于Python 3的实践代码和数据均已分别开源在Gitee和Github平台:

中国境内的读者,请在gitee.com上搜索关键词MLKaggleGitee2022,或扫描二维码下载地址1进行下载。

其他地区的读者,请在 github.com上搜索关键词MLKaggleGithub2022,或扫描二维码下载地址2进行下载。

扫描书后的二维码源程序亦可获取本书代码。

欢迎大家批评指正书中的任何错误,并发送至电子邮箱: fanmiao.cslt.thu@gmail.com。

〖1〗Python机器学习及实践——从零开始通往Kaggle竞赛之路(2022年度版)〖1〗前言致谢

感激父母长久以来对我的关爱和支持,让我可以持续不断地追求学业的成长和进步。

自我踏入北京邮电大学校门的第二年,便十分有幸得到吴国仕教授的指导。彼时的我还不知道,作为一名大一新生,能够有这样一位在企业智能信息化方面深有造诣的老教授亲自指导,是一件多么幸运的事情。

而后,我在人工智能方向上的成长之路便开始了。在清华大学、纽约大学、百度公司等多个人工智能领域的优秀科研院所与企业,我先后得到了郑方、周强、Ralph Grishman、王海峰、王建民等一众知名教授的悉心指导。从每一位老师的身上,我都发现了许许多多不同的优秀品质。不管是对人还是对事,这些优秀品质,都对我的成长和求学之路给予了莫大的帮助。

在漫长的求学之路上,我也结识了一些行业内优秀的学者朋友,感谢张民、马少平等教授为本书撰写推荐语。

感谢清华大学出版社的谢琛编辑。从第1版开始,她就担任本书的责任编辑。如果没有她一直以来的辛勤工作,这本书也无法高质量地呈现到各位读者面前。

范淼2022年6月


书籍介绍

本书在不涉及大量数学模型与复杂编程知识的前提下,从零开始逐步带领读者熟悉并掌握当下流行的基于Python 3的数据分析,以及支持单机、深度和分布式机器学习的开源程序库,如pandas、Scikitlearn、PyTorch、TensorFlow、PaddlePaddle、PySparkML等。全书分4部分。入门篇包括对全书核心概念的指南性介绍,以及在多种主流操作系统(Windows、macOS、Ubuntu)上配置基本编程环境的详细说明。基础篇涵盖Python 3的编程基础、基于pandas的数据分析,以及使用Scikitlearn解决大量经典的单机(单核/多核)机器学习问题。进阶篇介绍如何使用PyTorch、TensorFlow、PaddlePaddle搭建多种深度学习网络框架,以及如何基于PySpark的ML编程库完成一些常见的分布式机器学习任务。实践篇利用全书所讲授的Python编程、数据分析、机器学习知识,帮助读者挑战和参与Kaggle多种类型的竞赛实战,同时介绍如何使用Git在Gitee、GitHub平台上维护和管理日常代码与编程项目。 本书适合所有对人工智能领域,特别是机器学习、数据挖掘、自然语言处理等技术及其实践感兴趣的初学者。


书籍真实打分

  • 故事情节:8分

  • 人物塑造:4分

  • 主题深度:6分

  • 文字风格:4分

  • 语言运用:3分

  • 文笔流畅:6分

  • 思想传递:7分

  • 知识深度:8分

  • 知识广度:4分

  • 实用性:7分

  • 章节划分:3分

  • 结构布局:6分

  • 新颖与独特:9分

  • 情感共鸣:9分

  • 引人入胜:9分

  • 现实相关:9分

  • 沉浸感:8分

  • 事实准确性:3分

  • 文化贡献:9分


网站评分

  • 书籍多样性:7分

  • 书籍信息完全性:6分

  • 网站更新速度:3分

  • 使用便利性:6分

  • 书籍清晰度:8分

  • 书籍格式兼容性:3分

  • 是否包含广告:7分

  • 加载速度:5分

  • 安全性:9分

  • 稳定性:5分

  • 搜索功能:5分

  • 下载便捷性:8分


下载点评

  • 排版满分(484+)
  • 不亏(497+)
  • 一般般(523+)
  • 无漏页(665+)
  • 品质不错(95+)
  • 值得购买(516+)
  • epub(219+)
  • 无广告(456+)
  • 盗版少(175+)
  • 强烈推荐(545+)
  • 实惠(533+)
  • 无颠倒(447+)

下载评价

  • 网友 仰***兰:

    喜欢!很棒!!超级推荐!

  • 网友 养***秋:

    我是新来的考古学家

  • 网友 邱***洋:

    不错,支持的格式很多

  • 网友 师***怀:

    好是好,要是能免费下就好了

  • 网友 敖***菡:

    是个好网站,很便捷

  • 网友 扈***洁:

    还不错啊,挺好

  • 网友 车***波:

    很好,下载出来的内容没有乱码。

  • 网友 居***南:

    请问,能在线转换格式吗?

  • 网友 冯***丽:

    卡的不行啊

  • 网友 索***宸:

    书的质量很好。资源多


随机推荐