数据挖掘,作为商业智能(Business Intelligence)实现的最深层次,在商业智能解决方案的体系中占据着重要的位置。
数据库中存在的是数据,对于业务人员来说,只是一些无法看懂的天书,他们需要的是可以更容易理解的信息。那么,我们以前如何解决这个矛盾的呢?一般的答案是报表系统。简单地说,业务人员看到的是美观的界面,便捷的操作,鼠标点击后,报表系统生成SQL语句,数据库服务器收到以后,返回所需要的信息。不错,报表系统已经可以称作是BI了,它是BI的低端实现。
现在国外的企业,大部分已经进入了更深层次的商业智能,叫做数据分析,即基于多维数据库的在线分析系统(OLAP)。还有一些企业已经开始进入更深层次的商业智能,叫做数据挖掘。从广义上说,任何从数据库中挖掘信息的过程都叫做数据挖掘。从这点看来,报表、多维分析和深度的挖掘都是挖掘数据的手段。但是,从技术术语上说,数据挖掘(DataMining)特指的是:源数据经过清洗和转换等成为适合于挖掘的数据集,然后建立特定的挖掘模型,利用这些数据集训练模型,最后利用模型找出的知识模式进行预测,从而辅助决策工作。
过去,谈起数据挖掘,大家想到的往往是那些专业数学家、统计学家,一搬的技术人员和业务人员望而却步。现在,随着IT技术的发展和工业化,SQL Server 2008提炼了上述的各种复杂知识,加工成友好的视窗工具,嵌入到分析服务(Analysis Services)中,使得数据挖掘的用户扩展到了大量的开发者人群,甚至是经过培训的业务人员。它使我们的员和程序变得更聪明了。
1.课程研发环境
课程基于SQL Server数据库,讲解过程中使用的是SQL server2012版,使用office2010(32位)版工具SQL Server2008以上版本均可用。
数据库:SQL Server2008、2012
Office工具:2007、2010
2.内容简介
本教程介绍了SQL Server Data Mining的所有方面,包括使用SQL Server实现成功的数据挖掘解决方案的所有必要知识,带读者熟悉其中的工具,给出了Microsoft数据挖掘算法的深度和广度,然后详细探讨了实现数据挖掘解决方案的各种方式。
榆树老师,一直从事于Java开发方面工作,目前担任公司项目经理职位,负责多项目的系统架构,系统的整体开发涉及到对于JavaEE方面和数据库方面有所深入的研究,主要从事于财务方面的开发,对于ActiveMQ以及MongoDB、Oracle、SQL Server有着一定的研究。目前从事于财务软件,协同办公开发。在此期间取得了各项荣誉称号,同时在一些优秀的培训网站担任讲师一职,发布多方面Java技术领域视频培训课程。主要是Java相关技术:Struts、Sping 、Hibernate、Oracle、SQL Server、MongoDB、Memcache、Html、JavaScript、ActiveMQ。讲课独具特色,由浅到深的理念,深受广大学者的喜爱和学习。
第1章 数据挖掘解决商业问题
1.1-数据挖掘概念及使用场景
1.2-DMX
1.3-常见的数据挖掘任务
第2章 用Excel进行数据挖掘
2.1-分析关键影响因素及检测类别工具
2.2-从示例填充及预测工具
2.3-突出显示异常值工具
2.4-应用场景分析工具
2.5-预测计算器工具
2.6-购物篮分析工具
第3章 数据挖掘概念与DMX
3.1-DMX关键概念
3.2-DMX查询语法-创建挖掘结构
3.3-DMX查询语法-创建挖掘模型(嵌套表)
3.4-DMX查询语法-创建挖掘模型(复杂的嵌套场景和过滤器)
3.5-DMX查询语法-填充挖掘结构(填充嵌套表)
3.6-DMX查询语法-填充挖掘结构(查询结构数据和查询模型数据)
3.7-预测-预测连接和预测查询语法
3.8-预测-预测函数和嵌套表上的预测
第4章 用SQLServer进行数据挖掘
4.1-Bl Dev Studio介绍
4.2-设置数据源
4.3-设置数据源及创建和编辑模型
4.4-使用数据挖掘设计器及处理
4.5-使用模型
4.6-交叉验证、使用挖掘模型预测以及创建数据挖掘报表
第5章 贝叶斯算法
5.1-贝叶斯算法介绍
5.2-数据浏览及文档分类
5.3-理解贝叶斯模型的内容及浏览贝叶斯模型
5.4-贝叶斯算法的基本原理
第6章 决策树算法
6.1-决策数算法介绍及分类模型
6.2-回归模型与关联模型
6.3-模型内容,解释模型及决策树算法的基本原理
6.4-决策树算法的基本原理2
6.5-存储过程
第7章 时序算法
7.1-时序算法介绍
7.2-DMX 模型的创建
7.3-模型的处理
7.4-预测返回辅助的统计信息
7.5-预测执行假设预测
7.6-时序算法的基本原理及参数
第8章 聚类算法
8.1-聚类算法介绍
8.2-利用聚类检查异常以及DMX的模型创建
8.3-DMX常用结构
8.4-模型内容及理解聚类模型
8.5-聚类算法的基本原理及参数
第9章 序列聚类算法和关联规则算法
9.1-序列聚类算法的介绍
9.2-DMX查询-执行聚类预测与执行序列预测
9.3-DMX查询-提取序列预测的概率和使用序列预测的直方图
9.4-解释模型及马尔科夫链
9.5-状态转移矩阵、模型内容以及参数
9.6-关联规则算法介绍
9.7-推荐引擎与高级交叉销售
9.8-DMX
9.9-模型内容、解释模型及关联规则算法的基本原理
9.10-关联规则算法基本概念及挖掘繁琐项集
第10章 神经网络算法和逻辑回归算法
10.1-神经网络算法和逻辑回归算法简介
10.2-使用Microsoft神经网络算法
10.3-DMX查询
10.4-模型内容及解释模型
10.5-组合与激活及处理神经网络的简单事例
10.6-规范化和映射及神经网络算法的参数
第11章 SQL Server集成服务数据挖掘和数据挖掘编程
11.1-SSIS介绍
11.2-在SSIS环境中进行数据挖掘
11.3-数据挖掘客户端
11.4-建模及模型用法
11.5-数据挖掘编程介绍
11.6-创建数据访问对象1
11.7-创建数据访问对象2
11.8-创建挖掘结构
11.9-创建挖掘模型
11.10-处理挖掘模型
11.11-部署挖掘模型及设置挖掘权限
11.12-浏览和查询挖掘模型
11.13-使用ADMD.NET来预测
11.14-使用表参数的数据挖掘查询
目标1 使用Excel进行数据挖掘
目标2 了解数据挖掘概念和MDX
目标3 使用SQL Server进行数据挖掘
目标4 了解几种数据挖掘算法
目标5 了解数据挖掘编程
亮点一、由浅入深,逐渐熟悉并掌握数据挖掘相关知识
亮点二、演示与PPT结合,穿插着讲解每个知识点
亮点三、讲解了常用的几种算法,深入理解数据挖掘