从分子生物学到社交媒体,从可持续能源到医疗保健,科学,社会和商业领域几乎每一项活动都会产生了大量数据集。大数据时代的发展,人们对于数据的关注越来越看重,越来越多的企业投身于研究、分析数据,并把数据作为重要的决策参考依据。数据科学就是在这样的时代背景下逐步成为火热的专业。
数据科学是一门交叉的学科,涉及到数学、统计学、人工智能、机器学习、数据库、模式识别、可视化技术等多学科的知识。也就是研究从数据中提取和构建知识的计算原理、方法和系统,以及之后的应用。
首先,我们先来聊哪些背景的学生可以申请数据科学,前置课程又有哪些?大部分院校接受本科是CS,EE,AI,数学,统计,生物,物理,信息,经济,商科,以及心理学等专业。前置课程希望学生有学过高数(微积分),线性代数,统计概率论,以及Coding入门,比如学过python,R,JAVA,C,C++,SQL等其中的1-2门课。
还有重要的一点,在申请层面上,学校希望学生通过活动,实习,科研等方式来体现你的数理背景。所以,对于本科希望之后研究生走DS方向的学生,建议越早开始规划。
研究生期间,主要学习机器学习,数据采掘,数据分析,数据管理,可视化数据,计算机应用,统计建模等课程。因为DS将探索如何有效地在巨大的数据流中找到模式,当然许多研究领域已经解决了这个问题的一部分。而机器学习专注于发现模式,并从数据中做出预测;而要建立能扩展到大数据流的系统,需要来自算法和数据库的想法;当然围绕不同类型的非结构化数据(如文本、图像、传感器数据、视频和语音),这块独立研究领域也在发展。
所以,DS的课程,对于之后想在互联网,金融,快消品,咨询,医疗以及政府机关等行业下做市场分析员,数据分析师,业务分析师,数据架构师,数据工程师,数据科学家,统计学家等岗位。
第一梯队院校有斯坦福,哈佛,哥大,芝加哥,西北,宾大,杜克,JHU,对于学生GPA要求在3.5+,标化成绩,托福100+,雅思7-7.5,GRE325+,注意的是,有个别学校不接受雅思代替托福,比如斯坦福。所以学生在提前规划的时候,结合具体院校要求来选择。
第二梯队院校像康奈尔,莱斯,布朗,华大圣路易斯,南加州,罗切斯特等院校,对于学生GPA要求3.5左右,标化成绩托福90-100,雅思6.5-7,GRE325左右。
第三梯队院校如佛罗里达大学,东北大学,FORDHAM,伍斯特理工等学校,对于学生GPA要求3.0+,标化成绩托福90-100,雅思6.5-7,GRE320+。