您现在正在浏览:首页 > 职教文章 > 教育教学 > 企业培训管理信息化的数据质量问题

企业培训管理信息化的数据质量问题

日期: 2015/10/21 浏览: 5 来源: 学海网收集整理 作者: 中石化股份天津分公司培训中心 贺天广

【摘要】本文针对近年来在培训管理中积累的数据质量问题进行一些力所能及的探讨,包括数据指标设计、有效数据统计、失误现象描述、客观原因分析、错误影响意义、可行改进建议等。
   【关键词】 培训管理 信息技术 数据质量 数据治理
  
   在信息技术应用中,信息管理系统无论怎样设计,其性能的充分发挥,都要取决于所录入和处理的数据在准确、完整、适用、及时等方面的质量特性,甚至可以这样认为:只要有可靠合用的数据,任何功能需求都能设计开发。不幸的是,由于数据来源的广泛性(包括缺乏统一格式或已经存在错误)、录入和使用者对数据意义的认同差异、人工录入或复制等操作的失误、引用或转录与更新的异步、以及形形色色的隐蔽性错误等等许多原因,导致数据质量是一个极难管控的问题。从类如金融、交通等行业的耗资巨大、设计严密的巨型信息系统,到中小企业的进销存及客户管理等小型信息系统,都在不同程度上深受数据质量问题困扰之苦。对于足够影响系统生存的致命问题,不得不投入大量的人力财力进行不间断的或定期的审查修订等维护(也称为数据治理),而对于非致命问题或没有能力维护的系统,则只好运行在性能降低或一定程度上不可靠、不可信的状态中。我们培训中心的培训管理系统在实际使用中也存在着严重的数据质量问题。
   本文针对近年来在培训管理中积累的数据质量问题进行一些力所能及的探讨,包括数据指标设计、有效数据统计、错误现象描述、客观原因分析、质量影响意义、可行改进建议等。本文假定读者对培训中心的培训业务及管理工作和培训信息管理系统有一定的了解。以下的探讨按培训管理系统的模块划分进行,但没有延循流程顺序,而是按照笔者认为问题较多或意义较大的模块,探讨其中的部分问题,包括学员注册、培训计划、师资队伍等几个方面。
  
   一、 学员注册
   学员注册是数据质量问题最多的模块,主要体现在学员基本信息的完整性缺失和准确性不足上。在系统的数据结构中,学员注册设计了十余项指标,有些指标对于不同性质的培训有不同的需要程度,其中单位/姓名/性别是必须的,设置了审查机制,无效数据不能通过;而生年和学历是要求审核时关注的,原则上只有特殊情况才允许空缺。下表是近三年的培训人次及部分有效数据统计表。
     2012年 2013年 2014年 合计
   天津公司 9622 7728 6884 24234
   改制关联 2660 4038 2380 9078
   中石化属 343 792 689 1824
   其他单位 837 1161 734 2732
   汇总 13462 13719 10687 37868
   有效生年 3944 4902 9470 18316
   29.3 % 35.7 % 88.6 % 43.4 %
   有效学历 8883 9018 9369 27270
   66.0 % 65.7 % 87.7 % 72.0 %
  
   学员姓名的问题多为具有普遍特点的失误,有的是按音拟字录入错误,诸如军君燕艳刚钢琴芹等,有的学员自己写名字也与身份证不符,这样的错误除了依赖认真个性和责任心、发现一个修正一个之外似乎也没什么好办法;学员单位的错误多数出现在非本公司的情况中,主要表现为相同单位在不同项目中名称不一致,虽然设计了规范的分类和名称,甚至为满足个别需要设计了允许指定等价名称的功能,但仍然不能杜绝问题,这与各方对单位名称用法习惯有关,暂时只能依赖对单位规范名称比较熟悉的人员定期(特别是汇总前)进行修订。对于本公司的学员数据,由于需要向送培单位反馈培训统计信息,必须对数据质量有较高的要求,单位/姓名/性别的错误以及个别的重复录入现象都会影响培训中心的形象和汇总决算等业务,有必要与人力资源部门建立密切的合作,获取相关查询权限。
   生年和学历首先是培训质量控制中对受训人群把握基本特点的重要数据,其次也是在没有特定身份标识的情况下区分是同名学员还是错误重复的辅助数据,尽管数据来源存在一定困难,但仍有必要坚持把好录入审核关。上表中2014年的学员生年数据有效率比往年大幅度提升,这与借助系统升级而加强了录入审核力度有直接的关系。顺便说明,表中均为管理系统中录入提交的数据,而正是数据质量问题的原因,致使有效数据有时仅仅是格式有效,不排除个别的手误甚至是随意的填写;比空缺或无效数据更可怕的是虚假数据(还好只是个别行为),认真踏实的录入风格应该受到普遍的提倡和尊敬。
   职技(职称或技术等级)和职岗(职务或岗位)数据是可选指标,只在部分重要培训或有认证考核的项目中有录入要求。问题出在录入的内容有的与指标意义不符合,这样的内容如果需要的话可以在备注字段中录入,对这一点还需要反复多次强调。
   不言而喻,如果学员注册信息完整可靠,其意义会是很大的,对培训项目在受训人群的年龄/学历/单位/职技/职岗等不同区段的分布统计和分析,可以在决策、开发、教研、理研等许多与培训业务相关的行为中发挥重要的作用。
  
   二、 培训计划
   培训计划是数据质量问题影响意义最大的模块,与培训信息发布、资源调配、内外师资实际任课情况、培训课时与活动工作量核定、培训评估、培训总量统计汇总等许多方面有直接的体现和决定关系,也是受到企业培训特点的影响最明显的部分,特别是近年来,随着培训理念更新和业务扩大,培训内容和形式更趋多样化,诸如培训的开发与实施、项目与班期、课程与活动、讲授与训练、分班与进度等许多早期成型的概念不断受到新的冲击,有时在来不及升级数据结构和系统功能的条件下就要采取临时性或代替性措施以应对各种情况。培训计划中的数据质量问题主要有以下几个方面:
   1.实际课程与设置不符
   在流程前端的课程设置中录入的开设课程及任课师资等信息属于办班申请期间的预计数据,而在培训计划中的实际开课情况可能会有所变动,这在管理系统中是允许的。如果实际情况并未变动,只是录入计划的课程数据与前面的设置有所不同,这种错误多数都是由于在录入培训计划时,并未使用系统预设提示界面,而是通过Excel表格直接导入数据,在手工制作或修改Excel表格时仅凭印象而没有严格对照已经录入的课程设置数据;此类错误约占同种数据的10%以内,比例虽然不高,却对后续各项引用和统计造成不小的困扰。改善的方法:一是加强审核,二是设计更加智能化的自动审查提示机制,而后者又与课程体系建设的推进和阶段性成果有密切关系。
   2.分班与学员注册不匹配
   培训计划与学员注册在流程中不分先后,而且都要录入分班数据。而在同一班期有分班授课情况的项目中,约30%左右的班期,其培训计划与学员注册的分班数据不匹配,有少数情况可归因于录入者在分别录入这二部分数据时疏忽了期间的变化,但更多是发生在多分班除共有课程之外还有因专业或岗位不同的跨班特有课程或分组实训课程等情况(这也是产生学员注册中重复录入学员错误的部分原因),在系统升级增加了分班之外的分组机制后,这种现象有所改善,但要彻底解决这个问题,还需要进行诸如加深对课程有关概念的理解、对分班分组操作功能的熟悉、对统计查询功能意义的认识等许多工作。
   3.日期时间场所等有冲突
   在培训计划的录入界面有很方便的资源冲突检查提示机制,但很多录入者更习惯于导入Excel表格,而提交时的资源冲突自动查退功能,又驱使一些责任心不强的用户随意填写数据过关,这样在培训实施过程中,只能依靠人工进行时间和场所的调整,而且极少反馈修订计划数据,这就使系统的冲突检查机制形同虚设,并且对系统的即时查询功能造成很大困扰。如果需要即时查询发挥应有的作用,必须考虑实现冲突检查和调整机制的自动化,应该在改善系统录入界面、资源调配与计划数据同步、加强审核、制定相应的制度或管理办法等多方面取得一种可行的平衡。
  
   三、 师资队伍
   师资队伍的数据质量问题较为严重,但表现却相对简单,就是师资的基本情况有大量的信息空缺。对于近三年录入到系统中的几百位外聘师资来说,如果查看基本信息,有效数据不足20%,也就是说,除了姓名之外,如果不是一无所知的话,也可以用二无所知来形容了,而实际情况并非如此。师资队伍建设是培训中心核心任务之一,对兼职培训师的培养及任用有相当完整的规划和十分可观的投入,培训部门和项目组对外部师资的聘用工作也是非常重视和熟悉的,这在培训方案、项目总结、师资队伍建设成果汇报等资料中都有详细的体现,可惜只限于报告书、论文等文档中,而没有录入到管理系统的师资信息库,究其原因,与录入者对此的重视程度不够、系统没有硬性审查要求等有关,也与系统没有为此设计导入转换功能,致使相关信息在已有文档之后的系统录入中成为带有重复性质的工作有关。有必要改变系统师资信息库与其他标准文档之间的先后依存关系,使系统中体系内的师资信息成为各类相关引用和查询的源头。
  
   据了解,许多知名的企业培训机构,都有切实的规划和较大的投入,以实现培训信息管理系统的建设和完善,在已经看到的企业培训管理信息技术应用方面,各家管理系统虽有名称术语方面的差异,但在基本功能方面都大同小异,同行之间肯定会有许多共同面对的问题,当然也包括数据质量管控的经验,可以互相交流,取长补短,更好地完善企业培训管理工作。

返回顶部