内容简介
本书是大数据挖掘领域的扛鼎之作,由全球科学计算领域的领导者MathWorks(MATLAB公司)官方的资深数据挖掘专家和科学计算专家撰写,MathWorks中国区总裁等多位专家联袂推荐。
它从技术、方法、案例和*实践等4个维度对如何系统、深入掌握大数据挖掘提供了详尽的讲解。
技术:不仅讲解了大数据挖掘的原理、过程、工具,还讲解了大数据的准备、处理、与探索;
方法:既深入地讲解了关联规则方法、回归方法、分类方法、聚类方法、预测方法、诊断方法等6大类数据挖掘主体方法,又重点讲解了时间序列方法和智能优化方法等两种重要的数据挖掘方法;
案例:详细地再现了来自银行、证券、机械、矿业、生命科学和社会科学等6大领域的经典案例,不仅有案例的实现过程,而且还有案例原理和预备知识的的讲解;
*实践:首先总结了数据挖掘中确定挖掘、应用技术的艺术以及如何平衡的艺术,然后总结了数据挖掘的项目管理和团队管理的艺术。
作者简介
周英,中科数据首席数据科学家。曾就职于知名搜索引擎公司6年,主要从事互联网文本挖掘工作的研发工作。目前专注的领域为大数据挖掘技术的工业应用研究和工程应用,已成功完成数据挖掘量化选股、大型设备保养维护预警、银行客户信用评分、电商客户分类及精准营销优化等项目。另著有《量化投资:数据挖掘技术与实践(MATLAB版)》(本书为国际上第一本系统介绍将数据挖掘技术用于量化投资的书籍,已被金融行业多家机构应用)。
卓金武,MathWorks中国科学计算业务总监,主要负责数据挖掘、优化、量化投资、风险管理等科学计算业务,已为工行、交行、中投、华为、通用、一汽、上汽、格力等多家企业提供数据挖掘解决方案。曾2次获全国大学生数学建模竞赛一等奖 (2003, 2004),1次获全国研究生数学建模竞赛一等奖 (2007);主编专著三部:《MATLAB在数学建模中的应用》(第一版和第二版),《量化投资:数据挖掘技术与实践(MATLAB版)》。
卞月青,深圳人人数据挖掘经理。曾就职于三一重工, 主要从事工业大数据分析工作。2012年以来,一直从事基于大数据的应用研发工作,从事的工作包括两个方面, 一是为银行、P2P、小贷公司开发基于数据挖掘的信用评级系统;二是利用互联网大数据挖掘技术,采集、清洗、集成特定领域的数据,并开发成大数据公众服务平台。
目 录
第一篇 基础篇
第1章 绪论
1.1 大数据与数据挖掘
1.1.1 何为大数据
1.1.2 大数据的价值
1.1.3 大数据与数据挖掘的关系
1.2 数据挖掘的概念和原理
1.2.1 什么是数据挖掘
1.2.2 数据挖掘的原理
1.3 数据挖掘的内容
1.3.1 关联
1.3.2 回归
1.3.3 分类
1.3.4 聚类