软件开发与应用信息与电脑China Computer&Communication2018年第11期基于数据挖掘的学习推荐系统研究李孟杰(太原学院,山西 太原 030000)摘 要:在互联网的应用中,网络教学改变了传统教学模式,使得网络快速方便、无时间与空间限制、降低教育成本及提高教育质量等特性发挥得淋漓尽致。本研究主要以学习者为主,通过类神经网络(Neural Network)与数据挖掘技术(Data Mining)完成网络教学课程的推荐。本研究所提出的网络教学课程推荐机制主要可分为网络教学课程推荐前置处理和线上课程推荐处理两部分。将此课程推荐机制应用于国内某学校的网络教学做线上实际推荐,以验证本研究的可行性与应用性。关键词:网络教学;推荐系统;类神经网络;数据挖掘;关联式法则中图分类号:TP391.3;TP311.13 文献标识码:A 文章编号:1003-9767(2018)11-118-03Study of Learning Recommendation System Based on Data MiningLi MengjieAbstract: In the application of the Internet, the network teaching has changed the traditional teaching mode, making the network (Taiyuan University, Taiyuan Shanxi 030000, China)fast and convenient, without time and space restrictions, reducing the cost of education and improving the quality of education. This study is mainly based on the learners, through the Neural Network and data mining technology (Data Mining) to complete the recommendation of the network teaching course. The network teaching curriculum recommendation mechanism proposed in this study recommendation mechanism is applied to online teaching in a school in China to do online recommendation to verify the feasibility can be divided into two parts: the recommendation of network teaching courses and the recommendation of online courses. This course and applicability of this course.Key words: network teaching; recommendation system; neural network;; data mining; association rule1 引言者群对课程及课程对课程的课程推荐机制,并通过此课程推相较于传统教学,网络教学可降低学习成本、强化业务荐机制提供给学习者更具参考性的选课依据。反应能力、可依需求制作一致性的教材内容或量身订制个人化的内容、即时更新教材内容、随时学习与可建构群知识等[1]。2 学习推荐系统机制在网络教学环境下中存在丰富的课程内容,如何帮助学习者2.1 学习者分群模块选择合适的课程内容,对教学网站经营者与学习者而言是值学习者分群模块采用自适应共振理论网络(Adaptive 得研究的问题[2]。ResonanceTheory Network,ART)建构而成,以下将介绍本本研究的目的是建构一个以学习者为导向的网络教学课研究如何应用ART网络来进行学习者分群。程推荐机制,以协助学习者在网络教学的选课过程中,找到2.1.1 输入层(Xp)适合自己的课程。本研究整合类神经网络与数据挖掘技术,由于ART输入处理节点只能为{0,1}的二元值,因此,设计一套能对学习者进行分群,并依分群结果、个人学习兴先根据汇集的学习者个人数据制定出会影响学习者选课方向趣及其选课数据产生TOP-N/学习者群对课程、兴趣/学习的属性,并将这些数据转换为{0,1}二元值的型态,最后转作者简介:李孟杰(1997-),男,山西临县人,本科。研究方向:计算机。— 118 —信息与电脑2018年第11期China Computer&Communication软件开发与应用化为输入向量,用[X1,X2,…,Xp]来表示[3]。学习者基本数据是以国内一家学生教育训练转型为网络2.1.2 输出层(yq)教育训练的机构为对象,由其网络教学部门提供于2017年用以表现学习者输出的分群结果,其处理单元数目在学12月至2018年1月之间共14个月所开设的网络教学选课数习过程中最初只会有一个聚类,随着ART学习的推进会逐渐据,包括学习者个人数据及其选课记录共1 000笔,其中本增加群聚节点[4]。实验将单一学习者选多门课视为一笔交易数据,课程数据共2.1.3 网络连接(wb、wt)188,并将课程特性分成六大类,分别为保险类、财务类、网络的每一个输入层单元与输出层单元间均有两条网信用卡类、金融类、学生基本训练类、学生进阶训练类。络路径连接,用来建构学习者群网络,将前述兴趣属性向量Apriori算法的运算步骤为:步骤1先找出所有大型1-[X1,X2,…,Xp]输入ART网络,并借由不同的警戒值(ρ)高低,项目集,意指L1,接着在步骤2到步骤7,使用Lk-1来产生观察聚类的结果,选出较佳的聚类群。候选项目集Ck;步骤3调用Candidate_gen程序,将不满足2.2 数据挖掘模块Apriori性质的候选项目集从Ck中排除,在步骤4读取原始数据的每一笔类别t,将被包含在t的候选项目集的支持度加当ART网络将学习者分群完毕后,使用Rough Set算法挖掘学习者群与课程的关联法则,这些法则包括学习者群中1,在步骤6将所有满足最小的持个数的候选k-项目集组成一个大型项目集的集合,即L依选课热门信赖度的TOP-N/学习者群对课程推荐及依群中k;最后步骤8表示所有大型项目集的集合。学习者兴趣为主的兴趣/学习者群对课程推荐。而课程对课程的课程关联推荐则采用Apriori算法,根据历史选课数据库,3.2 推荐结果与讨论找寻出学习者选课的法则,其挖掘模式建构方式分述如下。本研究改良目前网络上的推荐技术,并针对目前网络教由上述数据挖掘模块挖掘出的课程关联推荐法则,将储存于学研究领域中较缺乏的课程推荐机制,提出一套网络教学课关联式法则知识库中,这些法则型态如下。程推荐机制,本研究也将所提出的网络教学课程推荐机制实(1)每个群中热门(TOP-N)的课程推荐法则。例如,例应用于国内某高校的网络教学的课程推荐。本文设计的课设求得N=3,则选出每个群前三大热门的课程,作为推荐的程推荐机制在具体应用中,有多个结果会对最后的结果产生课程依据。影响,具体的讨论如下。(2)每个群中依学习者学习兴趣为主的课程推荐法则。(1)利用ART网络进行学习者分群时,警戒值的设置例如,由学习者群中,将每个课程类别信赖度最高的课程作是影响分群结果的关键因素,过低的警戒值(如ρ=0.3以下)为以学习者学习兴趣为主的推荐。产生的学习者群将太少,群内学习者的特质不易辨识,丧失(3)每个学习者依其选课的结果产生关联性较高的课推荐的意义,而过高的警戒值(如ρ=0.8以上)产生的学习程推荐。者群太多,将不利推荐。而当警戒值为0.5时,所产生的学3 应用实例习者群较为合理,因此,本实验将警戒值设置为0.5,共产生7类的学习者群。3.1 实例介绍(2)利用Apriori算法挖掘关联法则时,必须要注意最为了验证所提出机制的可行性与实用性,以国内学校的小支持度与最小信赖度的设置。本研究所应用的实际案例中,线上教学选课数据进行实例应用。实例应用共分为网络教学此高校总共开188门的线上课程,学习者选课记录共计有1 课程推荐前置处理和即时线上课程推荐处理两部分。由于从000笔,同一个课程被越多的学习者选修,表示此课程的支数据库中获取的数据,可能存有噪音或格式不相容的问题,持度越高,因此,进行关联法则挖掘时,通过最小支持度的因此,必须做适当的前置处理,包括数据的清理、合并、设置,来产生课程的大项目集合。最小支持度设置越高,则转换等,将数据整理成适合分析的次数据集后,再放入所法则产生的越少,反之则越多。另外,当本研究由大项目集选择的算法进行分析。在网络教学课程推荐前置处理中,合所产生的法则,必须通过最小信赖度过滤所产生的法则,本研究采用Matlab 6.1版的Neural Network Tool的ART模最小信赖度越低,产生的法则越多,若最小信赖度设置越高,块进行学习者分群,并将分群结果使用Rough Set算法来产则产生的法则少。本研究依真实案例中的高校的选课状况,生TOP-N/学习者群对课程及兴趣/学习者群对课程的推荐,为了提高课程推荐广度,将最小支持度设置为3,最小信赖另外,使用Matlab 6.1版的数据挖掘外挂软件ARMADA度设置为50%。进行Apriori算法计算,产生课程对课程的推荐法则,其步 (3)由于Rough Set算法挖掘学习者群内的课程推荐 骤如下。 (下转第122页)— 119 —软件开发与应用信息与电脑China Computer&Communication2018年第11期3.2 试验结论4 结 语通过试验表明:本文通过分析空空作战场景和作战飞机具备的各任务分(1)嵌入式训练系统硬件工作正常,软件运行稳定、正常;系统,完成对各机载分系统和目标机预测系统的数学建模,(2)嵌入式训练系统各子系统能够实现设计功能;完成了嵌入式训练系统的验证试验,包括基本功能测试、动(3)嵌入式训练系统能够完成动态的中远距空空拦射态系统功能测试、性能测试等。试验结果表明,嵌入式训练作战任务;系统能够正常工作,能够完成空空作战训练任务,性能满足(4)嵌入式训练系统的目标机动预测功能正常。设计要求,说明了整个系统的设计是合理的、有效的。仿真结果表明,本文采用的算法具有较理想的运动预测效果以及较强的自适应能力。后续改进,可以根据预测需求,适当再调整算法中内部参数,以进一步改善运动预测偏差。参考文献嵌入式训练系统实时运行时间如下:[1]马潇潇,戴革林,李青,等.基于PC的低成本空战训(1)只进行对1个目标的发射1发导弹的训练任务,练系统研究[J].火炮发射与控制学报,2014,35(2):83-87.系统最大运行耗时3.7 ms;[2]丛伟,景博.美国空军空战训练系统的发展历程和启(2)进行对4个目标模拟、只发射1发导弹的训练任务,示[J].光电与控制,2011,7(18):55-59.系统最大运行时间5.2 ms;[3]Morrison J E, Orlansky J. The Utility of Embedded (3)进行对4个目标模拟、连续发射4发导弹的训练Training[J]. Utility of Embedded Training, 1997.任务,系统最大运行耗时13.7 ms。[4]钟华.贴近实战的外军军事训练[J].国防科上述结果表明,系统实时性满足设计要求。技,2014,35(4):104-106.(上接第119页)法产生学习者群,并使用Rough Set算法及Apriori算法,分关联法则时,课程推荐法则信赖度会因为可选择的课程多,别挖掘出TOP-N/学习者群对课程、兴趣/学习者群对课程学习者不易集中选修某些课程,导致推荐信赖度普遍不高,及课程对课程的课程推荐法则,最后依线上学习者所输入的为了解决此问题,本研究依学习者群内的选课热门度及兴趣信息,产生适当的课程推荐信息。分别产生TOP-N/学习者群对课程及兴趣/学习者群对课程法则推荐,使推荐课程更多元化。参考文献4 结 语[1]刘明吉,王秀峰,黄亚楼.数据挖掘中的数据预处理[J].随着互联网的蓬勃发展,利用网络来进行网络教学已成计算机科学,2015,27(4):54-57.为一个新兴的教育方式,然而网络教学的课程提供者如何提[2]邵峰晶,于忠清.数据挖掘原理与算法[M].供选课信息,使学习者能够选择适合自己的课程,进而在学DynoMedia Inc.,2016:68-81.习的过程中对网络教学的方式产生兴趣,是网络教学的课程[3]Han J, Kamber M, Pei J. 数据挖掘:概念与技术[M].提供者所要面对的问题。本研究结合了类神经网络与数据挖第三版.北京:机械工业出版社,2014:55-73.掘技术并针对网络教学的研究领域,提出一个以学习者为导[4]胡书晓.基于神经网络的股票K线特征图形预测研究向的网络教学课程推荐机制,此课程推荐机制以ART网络算[D].上海:同济大学,2017.— 122 —