数据分析与数据挖掘(第2版) mobi 下载 网盘 caj lrf pdf txt 阿里云

数据分析与数据挖掘(第2版)电子书下载地址
寄语:
“十三五” 国家重点图书出版规划项目。紧密追踪当前科技前沿、数据科学热点。算法由浅入深、由原理到应用,有利于学习和理解。
内容简介:
本书主要介绍数据挖掘和数据分析的基本概念和方法,包括数据的基本属性和概念、数据预处理技术、数据立方体和OLAP技术、频繁模式挖掘、回归分析、分类、聚类、离群点分析。每一部分先介绍基本概念、理论基础、应用实例、思考习题。书中涉及的模型和算法均给予了相应的实例,便于读者更好的理解和使用模型。
书籍目录:
第1章 概述1
1.1 数据分析与数据挖掘1
1.1.1 数据分析1
1.1.2 数据挖掘1
1.1.3 数据分析与数据挖掘的区别和联系3
1.2 分析与挖掘的数据类型3
1.3 数据分析与数据挖掘的方法7
1.4 数据分析与数据挖掘使用的技术8
1.5 应用场景及存在的问题12
1.5.1 数据分析与数据挖掘的应用12
1.5.2 存在的主要问题13
1.6 本书结构概述14
1.7 习题14
第2章 数据16
2.1 数据对象与属性类别16
2.1.1 属性的定义16
2.1.2 属性的分类16
2.2 数据的基本统计描述17
2.2.1 中心趋势度量18
2.2.2 数据分散度量20
2.2.3 数据的图形显示22
2.3 数据的相似性和相异性度量26
2.3.1 数据矩阵与相异性矩阵26
2.3.2 标称属性的邻近性度量27
2.3.3 二元属性的邻近性度量28
2.3.4 数值属性的相异性29
2.3.5 序数属性的邻近性度量31
2.3.6 混合类型属性的相异性31
2.3.7 余弦相似性33目录数据分析与数据挖掘(第2版)2.4 习题34
第3章 数据预处理36
3.1 数据预处理及任务36
3.1.1 数据预处理的必要性36
3.1.2 数据预处理的主要任务39
3.2 数据清理40
3.2.1 缺失值、噪声和不一致数据的处理40
3.2.2 数据清理方式43
3.3 数据集成44
3.4 数据归约49
3.4.1 直方图49
3.4.2 数据立方体聚集50
3.4.3 属性子集选择52
3.4.4 抽样53
3.5 数据变换与数据离散化54
3.5.1 数据变换策略及分类54
3.5.2 数据泛化54
3.5.3 数据规范化55
3.5.4 数据离散化56
3.6 习题58
第4章 数据仓库与联机分析处理59
4.1 数据仓库基本概念59
4.1.1 数据仓库的定义59
4.1.2 数据仓库的性质59
4.1.3 数据仓库体系结构60
4.1.4 数据仓库设计模型61
4.2 数据仓库设计62
4.2.1 数据仓库的概念模型设计62
4.2.2 数据仓库的逻辑模型设计65
4.2.3 数据仓库的物理模型设计67
4.3 数据仓库实现68
4.4 联机分析处理81
4.4.1 OLAP简介81
4.4.2 OLAP与OLTP的关系82
4.4.3 典型的OLAP操作83
4.5 元数据模型87
4.5.1 元数据的类型88
4.5.2 元数据的作用88
4.5.3 元数据的使用89
4.6 习题90
第5章 回归分析91
5.1 回归分析概述91
5.1.1 变量间的两类关系91
5.1.2 回归分析的步骤92
5.2 一元线性回归93
5.2.1 原理分析93
5.2.2 回归方程求解及模型检验93
5.2.3 一元线性回归实例96
5.2.4 案例分析: 使用Weka实现一元线性回归99
5.3 多元线性回归105
5.3.1 原理分析105
5.3.2 回归方程求解及模型检验106
5.3.3 多元线性回归实例108
5.3.4 案例分析: 使用Weka实现多元线性回归110
5.4 多项式回归113
5.4.1 原理分析113
5.4.2 多项式回归实例114
5.4.3 案例分析: 使用Excel实现多项式回归117
5.5 习题123
第6章 频繁模式挖掘125
6.1 概述125
6.1.1 案例分析126
6.1.2 相关概念126
6.1.3 先验性质128
6.2 Apriori算法129
6.2.1 Apriori算法分析129
6.2.2 案例分析: 使用Weka实现Apriori算法133
6.3 FPgrowth算法139
6.3.1 FPgrowth算法分析139
6.3.2 案例分析: 使用Weka实现FPgrowth算法148
*** 压缩频繁项集151
***.1 挖掘闭模式151
***.2 挖掘极大模式152
6.5 关联模式评估152
6.5.1 支持度置信度框架153
6.5.2 相关性分析153
6.5.3 模式评估度量155
6.6 习题156
第7章 分类157
7.1 分类概述157
7.1.1 分类的基本概念157
7.1.2 分类的相关知识158
7.2 决策树162
7.2.1 决策树的基本概念162
7.2.2 决策树分类器的算法过程163
7.2.3 ID3算法165
7.2.4 C4.5 算法172
7.2.5 Weka中使用C4.5 算法进行分类预测实例177
7.2.6 决策树的剪枝184
7.3 朴素贝叶斯分类185
7.3.1 朴素贝叶斯学习基本原理185
7.3.2 朴素贝叶斯分类过程186
7.3.3 使用Weka的朴素贝叶斯分类器进行分类实例187
7.4 惰性学习法191
7.4.1 k近邻算法描述191
7.4.2 k近邻算法性能193
7.4.3 使用Weka进行k近邻分类实例194
7.5 逻辑回归196
7.5.1 逻辑回归的基本概念196
7.5.2 二项逻辑回归过程197
7.5.3 用Weka进行逻辑回归分类实例199
7.6 支持向量机202
7.6.1 线性可分支持向量机算法203
7.6.2 线性可分支持向量机学习算法——间隔法207
7.6.3 使用Weka进行支持向量机分类实例208
7.7 神经网络210
7.7.1 神经网络的基本概念210
7.7.2 BP神经网络算法过程212
7.7.3 BP神经网络分类算法实例214
7.7.4 使用Weka进行神经网络分类实例216
7.8 组合方法223
7.8.1 组合方法概述223
7.8.2 装袋223
7.8.3 提升230
7.8.4 随机森林算法234
7.9 分类模型的评估248
7.9.1 分类模型的评价指标248
7.9.2 交叉验证253
7.9.3 自助法254
7.1 0习题255
第8章 聚类257
8.1 聚类概述257
8.1.1 聚类的基本概念257
8.1.2 聚类算法的分类258
8.2 基于划分的聚类260
8.2.1 k均值算法260
8.2.2 k中心点算法264
8.2.3 使用Weka进行基于划分的聚类实例268
8.3 基于层次的聚类273
8.3.1 基于层次的聚类的基本概念273
8.3.2 簇间距离度量274
8.3.3 ***层次聚类274
8.3.4 凝聚层次聚类276
8.3.5 BIRCH算法278
8.3.6 使用Weka进行基于层次的聚类实例282
8.4 基于密度的聚类285
8.4.1 基于密度的聚类的基本概念285
8.4.2 DBSCAN算法286
8.4.3 使用Weka进行基于密度的聚类实例290
8.5 基于网格的聚类293
8.5.1 STING算法294
8.5.2 CLIQUE算法296
8.6 聚类质量的评估299
8.7 习题300
第9章 离群点检测301
9.1 离群点的定义与类型301
9.1.1 什么是离群点301
9.1.2 离群点的类型302
9.2 离群点的检测303
9.2.1 检测方法的分类303
9.2.2 统计学方法304
9.2.3 近邻性方法307
9.2.4 基于聚类的方法309
9.2.5 基于分类的方法313
9.3 习题314
附录AWeka的安装及使用规范315
A.1 Weka简介与安装315
A.1.1 Weka简介315
A.1.2 JRE的安装315
A.1.3 Weka的安装318
A.2 Weka的使用方法323
A.3 Weka的数据格式326
参考文献330
作者介绍:
喻梅 天津大学智能与计算学部教授,硕士生导师。主要从事计算机网络、数据挖掘及数据库方向的研究及教学。研究重点为社交网络中实体社团的发现及识别、影响因素及发展规律;基于亲密度及影响力的微博社交兴趣圈挖掘算法等。在国际会议及期刊上发表了多篇相关学术论文。担任多个国际会议技术委员会委员,参与会议组织工作及专业技术服务。参与多部计算机教材的编写。
出版社信息:
暂无出版社相关信息,正在全力查找中!
书籍摘录:
暂无相关书籍摘录,正在全力查找中!
在线阅读/听书/购买/PDF下载地址:
原文赏析:
暂无原文赏析,正在全力查找中!
其它内容:
编辑推荐
数据分析与数据挖掘是一门跨学科的计算机科学分支,是人工智能、机器学习、概率论、统计学和数据库知识的交叉学科。数据挖掘的目标是从一个或多个数据集中通过数据处理,结合一定的算法模型*终挖掘出有价值的信息。随着科技的发展,数据量呈爆炸式增长,数据挖掘在工业界和学术界都得到了越来越多的重视。国际知名的互联网公司和科研单位都在大力发展数据科学,在我国,数据科学的发展受到了极大的关注,通过数据分析与数据挖掘帮助决策,进而推动经济发展。
本书主要介绍数据分析与数据挖掘的基本概念和方法,包括数据的基本属性和概念、数据预处理技术、数据仓库和OLAP技术、回归分析、频繁模式挖掘、分类、聚类、离群点分析。每一部分先介绍基本概念、理论基础,再给出应用实例,便于读者更好的理解和应用算法,*后给出习题。
本书所讲述的内容均为数据分析与数据挖掘过程中常用方法和模型,目的是让爱好数据科学的计算机专业、统计学专业以及相关专业的学生熟悉数据挖掘的过程,掌握数据分析与数据挖掘过程中常用的算法模型及数据处理方式。本书知识点的介绍通过基础理论及概念介绍、应用例题、习题三部分进行,部分章节涉及算法应用实例。通过对数据分析与数据挖掘知识点的基础理论讲解,对数据分析与数据挖掘有整体的认识及了解;通过应用例题,能够对算法的过程有深刻的理解;通过习题,能够巩固对相应知识点掌握。
本书适用于数据分析与数据挖掘领域的初学者,可以作为相关专业本科及研究生教材。书中算法由浅入深、由原理到应用,有利于初学者的学习和理解。本书也可作为数据分析与数据挖掘相关专业人士的参考用书。
前言
随着科学技术的发展,数据量呈爆炸式增长,如何从海量数据中挖掘出有助于决策的知识显得尤为重要,这使得数据分析与数据挖掘技术受到极大的关注。为满足数据挖掘学习者的需要,2018年出版了本书第1版,不仅用于高等学校计算机专业的教学,同时也用于非计算机专业相关学科的教学,受到了广大教师和学生的欢迎。经过两年的教学实践,我们对本书进行了修订,以便更好地满足教学及应用需求。
本书主要介绍数据分析及数据挖掘中的基本概念和方法。本书知识点的讲解分别通过基础理论及概念、应用例题、习题三大部分进行,部分知识点涉及算法应用实例。通过相关理论及概念的介绍,使读者对数据分析与数据挖掘的基础算法有整体认识和了解;通过应用例题的讲解,使读者对算法过程有深刻理解;通过习题的训练,使读者能够巩固相应知识点。通过本书的学习,读者可以快速掌握数据分析与数据挖掘的基本概念和基本方法。
为方便教师备课及教学,我们提供了与本书第2版配套的电子课件,若教师需要可以与清华大学出版社联系。我们在学堂在线上同步开设了“数据挖掘”在线课程,以方便教师在线教学以及广大学习者在线学习。
本书第2版由喻梅、于健主编,王建荣、李雪威副主编。参与本书构思、撰写、审稿、应用实例的上机验证及截图校对的人员有喻梅、于健、王建荣、李雪威、王庆节、于瑞国、***、徐天一、赵满坤、高洁、刘志强、刘伟、张妍、刘莹、冯爽、邓锐、刘玉生、李盼、刘鸣喆等。在此也感谢对本书第1版做出贡献的编写者。
在全书的撰写过程中,得到了清华大学出版社和张瑞庆编审的大力支持,在此表示衷心的感谢。
本书编写过程中参考了一些教材和资料,具体见参考文献,在此对原作者表示诚挚的谢意。由于写作时间仓促,编者水平有限,书中疏漏和不当之处敬请读者批评指正,以便今后修订改正。借此机会,向使用本书的广大师生以及关心我们的同行和学者表示感谢。
编者2020年3月
网站评分
书籍多样性:7分
书籍信息完全性:6分
网站更新速度:7分
使用便利性:8分
书籍清晰度:5分
书籍格式兼容性:8分
是否包含广告:9分
加载速度:4分
安全性:7分
稳定性:3分
搜索功能:9分
下载便捷性:4分
下载点评
- 图书多(232+)
- 推荐购买(427+)
- 已买(141+)
- 无漏页(359+)
- 种类多(476+)
- 经典(128+)
- 收费(571+)
- 中评多(390+)
- 无多页(75+)
- 无缺页(334+)
下载评价
- 网友 寇***音:
好,真的挺使用的!
- 网友 益***琴:
好书都要花钱,如果要学习,建议买实体书;如果只是娱乐,看看这个网站,对你来说,是很好的选择。
- 网友 詹***萍:
好评的,这是自己一直选择的下载书的网站
- 网友 师***怀:
好是好,要是能免费下就好了
- 网友 田***珊:
可以就是有些书搜不到
- 网友 堵***格:
OK,还可以
- 网友 融***华:
下载速度还可以
- 网友 国***舒:
中评,付点钱这里能找到就找到了,找不到别的地方也不一定能找到
- 网友 游***钰:
用了才知道好用,推荐!太好用了
- 网友 石***致:
挺实用的,给个赞!希望越来越好,一直支持。
- 网友 辛***玮:
页面不错 整体风格喜欢
- 网友 仰***兰:
喜欢!很棒!!超级推荐!
- 网友 家***丝:
好6666666
- 网友 车***波:
很好,下载出来的内容没有乱码。
- 网友 谭***然:
如果不要钱就好了
- 网友 苍***如:
什么格式都有的呀。
喜欢"数据分析与数据挖掘(第2版)"的人也看了
【年末清仓】申论考试热点标准表达:2010年重庆市***录用考试专用系列教材 mobi 下载 网盘 caj lrf pdf txt 阿里云
全国计算机应用能力考试题库版全真模拟练习光盘Internet 应用 mobi 下载 网盘 caj lrf pdf txt 阿里云
英语品中国:科技篇(高校英语选修课系列教材) mobi 下载 网盘 caj lrf pdf txt 阿里云
快雨堂题跋 mobi 下载 网盘 caj lrf pdf txt 阿里云
资本的秘密 mobi 下载 网盘 caj lrf pdf txt 阿里云
美好妈咪第三期 mobi 下载 网盘 caj lrf pdf txt 阿里云
晶态纳米碳基材料的制备与电容储能应用 mobi 下载 网盘 caj lrf pdf txt 阿里云
探秘海面之下9787115580900 正版新书知其然图书专营店 mobi 下载 网盘 caj lrf pdf txt 阿里云
广告创意大师 浙江少年儿童出版社有限公司 mobi 下载 网盘 caj lrf pdf txt 阿里云
全3册小学英语单词快速记忆简单学英语口语一学就会小学英语语法大全一学就会英语入门零基础3-63456三四五六年级英语学习大全正版 mobi 下载 网盘 caj lrf pdf txt 阿里云
- 儿童情绪管理与逆商培养系列故事发脾气也没关系 ***8册 胆小被拒孩子失败了也没关系儿童情绪管理故事书 幼儿早教启蒙不服输系列图书 幼儿园阅读 mobi 下载 网盘 caj lrf pdf txt 阿里云
- 英文杂志订阅 Art Review Asia 亚洲艺术评论 全年4期 英文艺术杂志 mobi 下载 网盘 caj lrf pdf txt 阿里云
- 宝石与玉石 mobi 下载 网盘 caj lrf pdf txt 阿里云
- 演绎色彩静物2/师语主题教学大观系列丛书 mobi 下载 网盘 caj lrf pdf txt 阿里云
- 哇!水母 mobi 下载 网盘 caj lrf pdf txt 阿里云
- 一代天骄 mobi 下载 网盘 caj lrf pdf txt 阿里云
- 科学巨匠:梁思成 林洙 河北教育出版社【正版保证】 mobi 下载 网盘 caj lrf pdf txt 阿里云
- Go语言精进之路:从新手到高手的编程思想、方法和技巧 2 mobi 下载 网盘 caj lrf pdf txt 阿里云
- 基因之河 mobi 下载 网盘 caj lrf pdf txt 阿里云
- 酒店英语(视听说版)/朱华 北京大学出版社 mobi 下载 网盘 caj lrf pdf txt 阿里云
书籍真实打分
故事情节:4分
人物塑造:6分
主题深度:5分
文字风格:7分
语言运用:9分
文笔流畅:5分
思想传递:4分
知识深度:6分
知识广度:3分
实用性:9分
章节划分:9分
结构布局:8分
新颖与独特:9分
情感共鸣:9分
引人入胜:8分
现实相关:5分
沉浸感:4分
事实准确性:7分
文化贡献:6分