您现在正在浏览:首页 > 职教文章 > 职教论文 > 数据挖掘技术及其在职业教育中的应用探讨

数据挖掘技术及其在职业教育中的应用探讨

日期: 2011-5-18 12:59:31 浏览: 0 来源: 学海网收集整理 作者: 匿名

摘要:文章阐述了数据挖掘技术的概念、分类、功能以及主要过程,探讨分析了数据挖掘技术用于职业 教育 的可能性。
  关键词:数据挖掘;职业教育;教育信息化
  
  目前, 计算 机技术已经渗透到社会生活的各个方面,对职业教育的教学也产生了重要影响。随着教育信息化进程的推进,产生了大量的、复杂的数据,面对如此巨大的数据资源,如何更充分、更有效地加以利用呢?将数据挖掘(Data Mining,DM)技术应用于职业教育中,可从大量的教育数据中发现隐藏的、有用的知识来指导教育、 发展 教育,改善职业教育中的教学效果,从而有效提高职校学生的职业与文化素质。
  
  数据挖掘技术
  
  随着信息技术的飞速发展及数据库技术的广泛应用,人们积累的数据越来越多,但是数据资源中蕴含的知识却未能得到充分的挖掘和利用,“数据丰富而知识贫乏”的问题十分严重。人们迫切需要一种新的技术将这些海量的数据资源转换为有用的知识,从而帮助人们 科学 地进行各种决策。学海网(www.xuehai.net)面对这一挑战,数据挖掘技术应运而生,并逐渐显示出其强大的生命力。
  
  (一)数据挖掘的概念
  数据挖掘是一个集统计学、人工智能、模式识别、并行计算、机器学习、数据库等技术于一体的交叉性学科研究领域。数据挖掘是一个从数据中发现知识的过程。数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、有用的信息和知识的过程。通过数据挖掘可以帮助决策者寻找 规律 ,发现被忽略的要素,预测趋势,进行决策。数据挖掘是对数据内在和本质的高度抽象与概括,是对数据从感性认识到理性认识的升华。它涉及对数据库中的大量数据进行抽取、转换、分析以及模型化处理,从中提取辅助决策的关键性数据,因此数据挖掘就是深层次的数据信息分析方法。
  
  (二)数据挖掘的分类与主要功能
  数据挖掘的分类方式很多,根据数据挖掘的任务可分为:分类或预测模型数据挖掘、数据 总结 、数据聚类分析、关联规则分析、序列模式发现、依赖关系或依赖模型发现、异常和趋势发现等。根据数据挖掘的对象可分为:关系数据库、面向对象数据库、空间数据库、时态数据库、文本数据源、多媒体数据、异质数据库、遗产数据库以及Web数据源等。数据挖掘具有预测趋势和行为、关联分析、聚类、概念描述以及偏差检测等主要功能。
  预测趋势和行为数据挖掘自动在大型数据库中寻找预测性信息,以往需要进行大量手工分析的问题如今可以通过数据挖掘迅速直接地由数据本身得出结论。
  关联分析数据关联是数据库中存在的一类重要的可被发现的知识。若两个或多个变量的取值之间存在某种规律性,就称为关联。
  聚类数据库中的记录可被划分为一系列有意义的子集,即聚类。聚类增强了人们对客观现实的认识,是概念描述和偏差分析的先决条件。
  概念描述概念描述就是对某类对象的内涵进行描述,并概括这类对象的有关特征。
  偏差检测数据库中的数据常有一些异常记录,从数据库中检测这些偏差很有意义。偏差包括很多潜在的知识,如分类中的反常实例、不满足规则的特例等。
  总之,数据挖掘所要处理的问题,就是在庞大的数据库中找出有价值的隐藏事件,并且加以分析,获取有意义的信息,归纳出有用的结构,作为决策者进行决策的依据。
  
  (三)数据挖掘的基本过程
  数据挖掘的基本过程包括:数据收集、数据整理、数据挖掘、结果评估、分析决策等,其基本与步骤如图1所示。从图1不难看出,数据挖掘的各过程不是一次就能完成的,其中某些步骤或者全过程可能需要多次的循环反复,才有可能达到预期的效果。
  
  数据收集大量全面丰富的数据是数据挖掘的前提,没有数据,数据挖掘也就无从谈起。因此,数据收集是数据挖掘的首要步骤。在开始数据挖掘之前,首先要消除噪声或不一致数据,广泛收集用户的各种信息,建立数据库与数据表,为数据挖掘做准备。数据可以来自于现有事务处理系统,也可以从数据仓库中得到。
  数据整理数据整理是数据挖掘的必要环节。由数据收集阶段得到的数据可能有一定的“污染”,表现在数据可能存在自身的不一致性,或者有缺失数据的存在等,从数据库中检索与分析任务相关的数据,确保数据能够真实反映待挖掘的对象,因此数据的整理是必需的。数据挖掘通过汇总或聚集操作将数据变换或统一成适合挖掘的形式,可单独利用也可综合利用各种数据挖掘方法对数据进行分析,挖掘用户所需要的各种规则、趋势、类别、模型等。
  结果评估数据挖掘的结果有些是有实际意义的,而有些是没有实际意义的,这就需要进行评估。这样对发现的规则、趋势、类别、模型进行评估,可以保证发现的模式的正确性。
  分析决策数据挖掘的最终目的是辅助决策。决策者可以根据数据挖掘的结果,结合实际情况,调整竞争策略等,并将挖掘结果以可视化的形式展现在用户面前。
  
  (四)数据挖掘的模型
  数据挖掘模型在本质上可分为预测型模型与描述型模型两类,其模型结构框图如图2所示。从图2中可以看出,每类模型下都包含一些需要用到该类模型的最常用的数据挖掘任务。预测型模型对数据的值进行预测,能够完成的数据挖掘任务包括分类、回归、时间序列分析和预测。描述型模型对数据中的模式或关系进行辨识。与预测型模型不同,描述型模型提供了一种探索被分析数据的性质的方法,而不是预测新的性质。聚类、汇总、关联规则和序列发现在本质上都通常被视为描述型模型。  
  
  数据挖掘技术的应用
  
  (一)教学管理方面
  职校学生的知识结构和学习风格是学校学生的基本特征。知识结构说明了学生对正在或将要学习知识的掌握情况,主要包括学生初始技能、当前技能和目标技能。学习风格包括学生的生理特征、心理特征和社会特征三个方面。利用数据挖掘功能分析学生特征,掌握学习者的状态,目的在于帮助学习者修正自己的学习行为。通过对学生特征分析结果和事先制定的行为目标标准进行比较,教师能够帮助学习者修正学习行为,提高学习能力,完善人格,因材施教,有利于学生各方面素质和谐 发展 。随着 计算 机在教学管理方面的广泛应用,学生和教师的学习、工作、奖励、处罚等信息被存储在教学管理数据库中。例如,学生入学后,在校学生管理数据库中存放有大量的学生档案,包括的内容有家庭情况、身体状况、入校前后的学习成绩、特长爱好、奖惩等信息。利用数据挖掘的关联分析和演变分析等功能,在学生管理数据库中挖掘有价值的数据,分析学生的日常行为,可得知各种行为活动之间的内在联系。
  
  (二)教学评价方面
  教学评价是世界 教育 科学 研究三大研究领域之一。教学评价的技术水平是衡量一个国家教育发展水平的重要尺度。教学评价就是根据教学目标和教学原则的要求,系统地收集信息,对教学过程中的教学活动以及教学成果给予价值判断的过程。其内容主要包括对学生“学”的评价和对教师“教”的评价。
  目前,职业教育评价指标主要包括学生综合测评指标和课堂教学评价指标,这些评价指标多数是 参考 国内外相关评价指标体系并结合实际操作中的经验和调查问卷等制定的,对于各项指标之间的关系、重要程度以及指标存在的合理性等方面很难作出判断,将关联规则和粗糙集理论应用于各评价系统,可以对指标进行排序、约简等,在一定程度上对评价指标进行优化,可以找到比较合理且简单易行的评价指标体系。另一方面,学习评价是教育工作者的重要职责之一。评定学生的学习行为,既可对学生起到信息反馈和激发学习动机的作用,又是检查课程计划、教学程序以至教学目的的手段,也是考查学生个别差异,便于因材施教的途径。评价要遵循“评价内容要全面、评价方式要多元化、多次化、注重自评与互评的有机结合”的原则。在教学科研 网络 普遍建立的今天,利用数据挖掘工具对学生的学习成绩数据库、行为记录数据库、奖励处罚数据库等进行分析处理,可以及时得到学生的评价结果,对学生出现的不良学习行为进行及时指正。同时,还能够克服教师主观评价的不公正、不客观的弱点,减轻教师的工作量。
  因此,将关联规则运用于教学评价数据中,探讨教学效果的好坏与教师年龄、职称之间的关系、学生各项素质指标之间的关系等,用来及时地对教师的教学和专业发展以及学生的学习和个性发展提供指导,这是非常有意义的。另外,教学评价在实施的过程中,更多的是注重评价的结果,以作为教师晋升、学生评优等的依据,很少考虑教学评价对教学过程的指导作用。
  
  (三)课程设置方面
  职业学校的课程设置有其一定的 规律 性,先基础,后专业,学习是循序渐进的。每学期要修的课程虽然有一定的规律,但也不是一成不变的。如何合理地设置每学期的课程,使之既顾全了大局,又兼顾局部需求是值得研究的问题。例如,同一年级在不同班级学习同一门课程时,学生的总体成绩有时会相差很大,利用学校教学数据库中存放的历届学生各门学科的 考试 成绩,结合数据挖掘的关联分析与时间序列分析等相关功能,就能从这些海量数据中挖掘出有用的信息,帮助分析这些数据之间的相关性、回归性等性质,得出一些具有价值的规则和信息,最终找到影响学生成绩的原因,并可在此基础上,对课程设置做出合理安排。另外,在通常情况下,学生可以正常地修完本学期的课程,不会影响学生的学习效果。但个别学期出现的特殊情况如果处理不好,就会影响学习效果。
  
  (四)教学过程与方法方面
  在教学过程中,教师通常采用多种教学方法完成对本门课程的教学任务,如讲授法、讨论法、案例法、多媒体辅助法、实验对比法、调查法、参观学习法等等。这些大量的教学班次实践过的经验存放于教学数据库中,可以用数据挖掘的方法来挖掘数据库中的数据,判定面临的教学班应该采取什么教学方法才能满足教学需要,更有利于学生对知识的理解和吸收。课程结束后将每个学生的成绩和对教学方法的评价进行综合,运用回归线性分析、关联规则的方法来判断本次教学方法适合哪一类学生,对于分类、分层次教学具有推广和指导意义。
  考试是对教学效果的检验,是教学中必不可少的环节之一,能否对教和学起到促进作用,在很大程度上取决于试题质量的好坏。因此,探索有效的方法来评价试题的质量在实际教学过程中有重要的意义。目前,大多数学校只是简单地根据学生的考试成绩画出成绩分布曲线,如果是正态分布则认为试题的难易度和区分度基本符合要求。这种评价方法给出的是对试题质量的粗略评价,对实际教学没有起到很好的促进和指导作用。将数据挖掘中的关联规则应用于试卷分析数据库,根据学生得分情况可以分析出每道题的难易度、区分度、相关度等指标,教师据此可以对试题的质量作出比较准确的评价,进而可以用来检查自己的教学情况及学生的掌握情况并为今后的教学提供指导。
  数据挖掘技术采用比较成熟和科学的分析方法,在将其引入教学时也必须充分处理好其他因素,比如调查问卷的合理度、反馈结果的真实度、数据量的大小是否足以进行挖掘、不同学科的课程特点及挖掘结果的可信度等等,这样才能更充分地挖掘学生的潜力,提高教学效率,优化教学策略和评估教学效果。因此,数据挖掘技术经过在教育领域中应用功能及技术的不断发展和完善,必将发挥越来越大的作用,并且随着人们对这一技术的关注,相信其在教育领域的应用范围会越来越广,其对教育的改革和发展必将起到巨大的推动作用。
  
  参考 文献 :
  [1]朱明.数据挖掘[M].北京: 中国 科技大学出版社,2002.
  [2]张玉林.数据挖掘技术在教学过程中的指导作用[J].西安通信学院学报,2006,5(2):38-40.
  [3]于承敏.数据挖掘(Data Mining)技术运用于教育领域之探讨[J].聊城大学学报,2005,18(2):79-82.
  [4]李红艳.数据挖掘及其运用于教学评价的设想[J].襄樊职业技术学院学报,2003,2(1):142-45.
  [5]林阳.数据挖掘在教育信息化中的潜在价值[J]. 现代 教育技术,2002,(1):65-69.

返回顶部