《用商业案例学R语言数据挖掘》PDF 经管之家

瑾年安好 318 0

《用商业案例学R语言数据挖掘》PDF 经管之家-第1张图片-瑾年网络 - 最新最全最热的资源整合网站。

大小 : 31.51 MB |  下载量 : 6 次 |  文件类型 : PDF文档  

信息简介

书名:《用商业案例学R语言数据挖掘》

副标题:《用商业案例学R语言数据挖掘》

作者:经管之家

类别:计算编程

页数:517

格式:PDF

ISBN:9787121319587

出版社:电子工业出版社

出版日期:2017年07月

内容简介

商业智能时代已经全面到来,分析型人才的岗位数量在就业市场中呈现井喷式增长。无论是从事产品研发的工程师,还是从事产品推广的市场人员、人力资源和财务会计人员,都需要掌握数据分析技术,否则很有可能被人工智能替代。

本书包括18章,涉及使用R语言做数据分析和数据挖掘的主要分析方法。其中,第1、2章为数据分析方法概述,第3章为R语言编程基础,第4章到第8章为统计学习方法,第9章到第16章为数据挖掘方法,第17章为特征工程,第18章为R文本挖掘。每章都根据所涉及的知识点的不同,选取了实用的案例,并为读者准备了相应的练习题。

本书作为CDA数据分析师系列丛书中《如虎添翼!数据处理的SPSS和SASEG实现(第2版)》和《胸有成竹!数据分析的SPSS和SASEG进阶(第2版)》的姊妹篇,将前两本书的内容进行整合并做了重大拓展,而且秉承了该系列丛书的特点:内容精练、重点突出、示例丰富、语言通俗。可以作为广大从业人员自学商业数据分析的读物,适合大中专院校师生学习和阅读,同时也可以作为高等院校商科、社会科学及相关培训机构的教材。

作者简介

常国珍,北京大学会计学博士,中国大数据产业生态联盟专家委员会专家委员。主要从事金融、电信行业客户画像,信用与操作风险识别与防范,客户终生价值预测与价值提升等工作。

曾珂,华中师范大学管理科学工程硕士,现为第一车贷金融产品部产品经理,精通Python与R语言数据挖掘。曾经就职于华为、国家电网等企业。以金融信用与欺诈风险建模、文本分析、数据可视化等为主要研究方向。

朱江,挪威科技大学工学硕士,现为CDA数据分析研究院课程开发副总监,CDA数据挖掘竞赛的评委。精通R与SAS语言数据挖掘,从事电商与互联网数据分析的教学工作。研究方向为电商推荐系统开发、数据可视化、客户特征提取和客户行为模式发现

作品目录

第1章商业数据分析基础

1.1商业数据分析的本质

1.2商业数据分析中心的建设

第2章数据分析的武器库

2.1数据挖掘简介

2.2R语言简介

2.3R与RStudio的下载和安装

2.4在RStudio中安装包

2.5练习题

第3章R语言编程

3.1R的基本数据类型

3.2R的基本数据结构

3.3R的程序控制

3.4R的函数

3.5R的日期与时间数据类型

3.6在R中读写数据

3.7练习题

第4章R描述性统计分析与绘图

4.1描述性统计分析

4.2制图的步骤

4.3R基础绘图包

4.4ggplot2绘图

4.5练习题

第5章数据整合和数据清洗

5.1数据整合

5.2R中的高级数据整合

5.3R中的抽样

5.4R的数据清洗.

5.5数据整合

第6章统计推断基础

6.1基本的统计学概念

6.3双样本t检验

6.4方差分析(分类变量和连续变量关系检验)

6.5相关分析(两连续变量关系检验)

6.6卡方检验(两分类变量关系检验)

6.7练习题.

第7章客户价值预测:线性回归模型与诊断

7.1相关性分析

7.2线性回归

7.3线性回归诊断

7.4正则化方法

7.5练习题

第8章Logistic回归构建初始信用评级

8.1Logistic回归的相关关系分析

8.2Logistic回归模型及实现

8.3最大熵模型与极大似然法估计

8.4模型评估

8.5练习题

第9章使用决策树进行信用评级

9.1决策树建模思路

9.2决策树算法

9.3在R中实现决策树

9.4组合算法(EnsembleLearning)

9.5练习题

第10章神经网络

10.1神经元模型

10.2人工神经网络模型

10.3单层感知器

10.4BP神经网络

10.5RBF神经网络

10.6神经网络设计与R代码实现

10.7练习题

第11章分类器入门:最近邻域与贝叶斯网络.

11.1分类器的概念

11.2KNN算法

11.3朴素贝叶斯

11.4贝叶斯网络

11.5练习题

第12章高级分类器:支持向量机

12.1线性可分与线性不可分

12.2线性可分支持向量机

12.3线性支持向量机

12.4非线性支持向量机

12.5R中的支持向量机

12.6练习题

第13章连续变量的维度归约

13.1维度归约方法概述

13.2主成分分析

13.3因子分析

13.4奇异值分解

13.5对应分析和多维尺度分析

13.6练习题

第14章聚类

14.1聚类分析概述

14.2聚类算法逻辑.

14.3层次聚类.

14.4k-means聚类

14.5基于密度的聚类.

14.6聚类模型的评估

14.7高斯混合模型(GaussianMixtureModel)

14.8客户分群

14.9练习题

第15章关联规则与推荐算法

15.1长尾理论

15.2关联规则

15.3序贯模型

15.4推荐算法与推荐系统.

15.5练习题.

第16章时间序列建模

16.1认识时间序列

16.2简单时间序列分析.

16.3平稳时间序列分析ARMA模型

16.4非平稳时间序列分析ARIMA模型

第17章特征工程(FeatureEngineering)(博文视点官方网站下载)

17.1特征工程概述.

17.2数据预处理(DataPreprocessing)

17.3特征构造(FeatureConstruction)

17.4特征抽取(FeatureExtraction)

17.5特征选择(FeatureSelection)

第18章R文本挖掘(博文视点官方网站下载)

18.1文本挖掘

18.2文本清洗

18.3中文分词与文档模型.

18.4文本的特征选择及相关性度量

18.5文本分类

18.6主题模型

18.7综合案例.

附录A数据说明(博文视点官方网站下载)

大小 : 31.51 MB |  下载量 : 6 次 |  文件类型 : PDF文档  

标签: 计算编程

发表评论 (已有0条评论)

还木有评论哦,快来抢沙发吧~