数据科学(Data Science)之路
数据科学是一门跨学科的专业,在「大数据」的背景(噱头)下,看起来很有前途
根据Drew Conway给出的数据科学的一个文氏图,可以看出数据科学是Hacking Skills, Math & Statistics Knowledge 以及Substantive Expertise的大交集。
![Data_Science_VD.png][2]
要学习数据科学,路上认为可以从上面的文氏图来推算应该的学习内容,它们应该包括:
Hacking Skills (计算机知识)
- 基本的编程语言和与数据处理相关的包/框架,例如python语言
- 数据处理框架,比如处理大数据的利器:Hadoop
Math & Statistics Knowledge (数理统计知识)
- 统计学(概率统计)
- (机器)学习理论
数据科学综合知识
- 数据挖掘等