- 关于我们
- 针对假冒留学监理网的声明
- 留学热线:4000-315-285
项目背景
大数据时代到来,数据成为企业及社会重点关注的战略资源。怎样才能在浩瀚的数据海洋中利用成熟的统计分析和数据挖掘技术,进行高效的商业分析以获取利益最大化?对数据挖掘而言,数据库提供数据管理技术,而机器学习和统计学则能够提供数据分析技术。项目将带领学生学习机器学习算法的基本问题和步骤、了解其在数据挖掘领域的应用,并充分利用所学知识解决客户细分及反欺诈等实际问题。
项目介绍
项目将带领学生学习监督学习与无监督学习、过度拟合、训练数据、测试数据、验证数据、线性回归和逻辑回归、决策树算法、提升树算法、随机森林、神经网络、支持向量机、聚类、维度诅咒、特征选择、正则化、主成分分析、拟合优度度量、数据准备、缺失值填充、异常值、特征工程、分类变量编码、模糊匹配等机器学习基础知识及数据挖掘经典算法,项目结束时提交项目报告,进行成果展示。
适合人群
大学生
对商业分析、商业统计、数据科学、数据处理、机器学习、深度学习、信息安全等专业和课题感兴趣,相关专业或希望在相关领域深入学习的学生 具备Python基础知识,数学逻辑良好的学生优先
导师介绍
南加州大学 正教授
Stephen导师任职于南加州大学马歇尔商学院,在数据科学专业教授欺诈分析和商业分析等课程。导师曾任ID Analytics(LifeLock和Symantec旗下的身份资讯保护公司)公司首席分析师及首席科学官,美国Casa Systems, Inc.(网络基础设施解决方案公司)联合创始人、摩根士丹利银行控股公司(Morgan Stanley)执行董事。导师研究方向为数据挖掘、身份反欺诈等。
任职学校
南加州大学(University of Southern California,USC)创立于1880年,坐落于美国加州洛杉矶市中心,是全球领先私立研究型大学,美国最具多元化学府之一,广受全球博才智杰推崇。南加州大学是美国大学协会(AAU;研究型大学联盟,会员门槛极高,被许多机构视为衡量大学学术研究和品质的基准)的成员,在2020年U.S.News全美大学综合排名中位列第22。
项目大纲
监督学习与无监督学习、过度拟合、训练数据、测试数据、验证数据、线性回归和逻辑回归 ML modeling basics; training/testing/validating data sets; linear regression
决策树算法、提升树算法、随机森林、神经网络、支持向量机 Nonlinear ML algorithms
聚类、维度诅咒、特征选择、正则化、主成分分析、拟合优度度量 Clustering, curse of dimensionality, feature selection, regularization, PCA, model measures of goodness.
数据准备、缺失值填充、异常值、特征工程、分类变量编码、模糊匹配 Data preparation
实操演练:机器学习、数据挖掘在客户细分及反欺诈等实际问题中的运用 ML applications, such as in marketing segmentation, fraud score
项目回顾与成果展示 Program Review and Presentation
论文辅导 Project Deliverables Tutoring
时间安排与收获
7周在线小组科研学习+5周论文辅导学习 共125课时
学术报告
优秀学员获主导师Reference Letter
EI/CPCI/Scopus/ProQuest/Crossref/EBSCO或同等级别索引国际会议全文投递与发表(可用于申请)
结业证书
成绩单