(我承认,这个是标题党!)
今儿看到 Ajay Ohri 那儿推荐了多伦多大学 S. Sayad 教授的关于数据挖掘的一个在线介绍。这个介绍包含了完整的数据挖掘过程,以及数据挖掘技术的分类,并且每一项都可以通过超链接到相应的分支。让人爱不释手,大赞之!
S. Sayad 教授在数据挖掘过程定义上同从比较流行的 CRISP-DM(Cross Industry Standard Process for Data Mining)有些区别:
- Problem Definition
- Data Preparaion
- Data Exploration
- Modelling
- Evaluation
- Deployment
而重头戏则是关于数据挖掘(统计分析)技术的两大领域
- 描述
- 推断
首先是——描述:


最后是 S. Sayad 教授的数据挖掘在线 intro,请猛击之!
再补一句:关于数据挖掘软件的介绍,没有 R,抱怨一下~~
附1:
标准的“商业”数据挖掘过程:
- Business Understanding
- Data Understanding
- Data Preparaion
- Modelling
- Evaluating
- Deployment