《商业统计分析和数据挖掘》课程教学大纲
课程基本信息(Course Information) 课程代码 (Course Code) *课程名称 (Course Name) 课程性质 (Course Type) 授课对象 (Audience) 授课语言 (Language of Instruction) *开课院系 (School) 先修课程 (Prerequisite) 授课教师 (Instructor) 所有本科生 AM068 *学时 (Credit Hours) 32 *学分 (Credits) 2 (中文)商业统计分析和数据挖掘 (英文)Business Analytics and Data Mining 公共选修课 中文 安泰经济与管理学院 概率论或统计学或大学基础数学课程 周志中 课程网址 (Course Webpage) 数据对管理决策的作用正迅速提高,这是因为获取和存储数据的成本不断变低、新的创新和商业模式也在源源不断产生大量的数据,如电子商务、网上银行、销售点终端机、扫码仪、DNA测序、射电天文望远镜、物联网等。这些数据存储于数据仓库或者数据集市中,成为巨大的数字矿山,为决策提供支持。 大数据是我国和全球各国新的发展战略,也是各行各业转型升级之利器。作为一种和资金、人力同等重要的商业资产,大数据引发的信息革命改变了现代管理决*课程简介(Description) 策的范式,支撑了新的商业业务模式的发展,提升了许多企业的核心竞争力。它已成为企业和社会趋之若鹜的决策工具和技术手段。 但如何从矿山中挖出宝藏,就需要用到数据分析和挖掘技术——这被定义为为广泛使用数据、统计和数量分析方法、解释性和预测性模型以及基于事实的管理方法来进行决策并采取行动。通过大数据分析和挖掘,我们可以从数据提取出指导企业决策及解决商业问题的真知灼见,将基于数据的管理决策转化成行动。大数据分析与挖掘已经成功用于信用评级、欺诈识别、市场营销、客户关系管理、股票投资和生物信息学等领域。 本课程使用R语言展示基本的数据分析和挖掘方法,并结合现实的商业问题和数据,展示如何使用恰当的商业统计分析和数据挖掘方法回答商业问题。本课程的重点在于掌握各种分析方法的基本概念以及如何将它们应用于商业实践中。 Data is becoming important for business decision marking. Due the lowering cost of getting and storing data, new innovation and business models are generating abundant data (e.g. E-commerce, E-banks, ATMS, scanners, DNA sequencing, radio telescopes, Internet of Things, etc.) The data is stored in data mart or data warehouse, becomes a huge mineral mountain of data and provides support to decision marking. Big data is a new development strategy of our country and many other countries in the world. It is also a sharp tool of industrial upgrading and reforming for many industries. As a business asset with the same importance as capital and labor, the big data triggered an information revolution, which dramatically changed the paradigm of modern managerial decision making, supported the development of new business models, improved the core competitiveness of many firms. It has become a tool and technology of decision making for many companies. But how to mine treasures from mineral mountains? We need to use techniques of data analysis and data mining – which was defined as widely using data, statistics and quantitative analysis, explanatory and predictive models, and fact-based managerial methods to make decisions and take actions. Using big data analytics and mining, we are able to extract business insight from data for firms to guide them to make decisions and solve business problems. Big data analytics and mining have been successfully applied in credit ratings, fraud detection, marketing, customer relationship management, stock investment and bioinformatics. This course will use R language to illustrate basic methods of data analysis and data mining. We will show how to use appropriate methods of data analysis and data mining to answer business questions based on real-world business data. The focus of this course is mastering definitions and algorithms of various data mining technologies, and applying them in business practice. *课程简介(Description) 课程教学大纲(Course Syllabus) *学习目标(Learning Outcomes) 本课程将介绍大数据的基本概念、挑战、技术及带来的新的商业机会,重点讲解从数据、建模、到分析、决策和展示的大数据分析和决策过程,为学员提供一个如何在大数据环境下寻找规律并做出科学理性决策的框架。在材料选取上即注重实用性,又强调其理论方法前沿,以及同后续其它课程的连贯性。 教学内容 学时 教学方式 作业及要求 基本要求 考查方式 *教学内容、进度安排及要求(Class Schedule & Requirements) 大数据挖掘简介、从网上抓取数据、数据导入、清理和可视化 线性回归、多项式回归、无参数回归、岭回归、LASSO回归、Logit回归 紧邻分析法(Nearest Neighbor Analysis)、朴素贝叶斯分类(Naive Bayes Classification) 多项逻辑斯蒂回归(Multinomial Logistic Regression)、线性判别式分析(Discriminant Analysis) 决策树(Decision Trees)、k-Means 聚类(k-Means Clustering) 、时间序列分析(Time Series Analysis) 购物篮分析(Market Basket Analysis)、因子模型和主成分分析(Factor Models and Principal Component Analysis) 信用评分(Credit Scoring)、推荐系统(Recommendation System)、生存分析(Survival Analysis) 遗传算法(Genetic Algorithm)、网页点击流分析(Web Click Stream Analysis)、股票市场分析(Stock Market Analysis)、文本挖掘(Text Mining) 4 课堂讲授 1次作业 4 课堂讲授 4 课堂讲授 1次作业 4 课堂讲授 4 课堂讲授 1次作业 4 课堂讲授 4 课堂讲授 1次作业 4 课堂讲授 *考核方式(Grading) 1 2 课堂参与和课堂小测验 平时作业 35% 30% 3 考试 35% 课程教材: 书号:ISBN 978-0-470-52682-8 书名:Data Mining for Business Intelligence: Concepts, Techniques and Applications 作者:Galit Shmueli, Nitin R. Patel, Peter C. Bruce 出版社:John Wiley & Sons, Inc. 出版时间:2010年 参考书目: 书号:7115241007, 9787115241009 书名:数据挖掘导论 作者:Pang-Ning Tan, Michael Steinbach, Vipin Kumar 出版社:Pearson 人民邮电出版社(中文版) 出版时间:2011年 书号:ISBN-13 978-0-471-66656-1, ISBN-10 0-471-66656-4 (cloth) 书名:Data Mining: Methods and Models 作者:Daniel T. Larose 出版社:John Wiley & Sons, Inc. 出版时间:2006年 书号:ISBN 0-470-84679-8, ISBN 0-470-84678-X (cloth) 书名:Applied Data Mining Statistical Methods for Business and Industry 作者:Paolo Giudici 出版社:John Wiley & Sons, Inc. 出版时间:2003年 其它(More) *教材或参考资料(Textbooks & Other Materials) 备注(Notes) 备注说明:
1.带*内容为必填项。
2.课程简介字数为300-500字;课程大纲以表述清楚教学安排为宜,字数不限。
因篇幅问题不能全部显示,请点此查看更多更全内容