以下内容节选自常熟理工大学信息化办公室主任先晓兵老师于“高校数据治理与应用分析特训营”分享的“高校数据治理实践”报告中的部分核心内容。
高校大多数业务系统是网络数据库,但由于是各个部门在不同阶段、不同背景下各自建设的业务系统,因为是“你”的标准、“你”的数据规范,所以这些数据事实上是多个“信息孤岛”。
1、数据零交互
很多系统是单机版,还有很多数据是些非结构文件,比如说电子表格,大量电子表格是非常宝贵的数据,但表格之间数据却无法交互。
2、数据同步麻烦
学校拥有大量的数据,通过手工导入、电子表格以及API接口等方式进行数据同步,但仅有格式规范的数据可以通过同步工具同步,而文本文件的数据若需要完成手工数据同步,必要时还得写脚本,否则数据同步不仅麻烦且不及时。
3、数据标准不统一
数据标准包括:信息标准不统一、数据采集标准不统一,导致数据沉淀和数据交互均存在不少的问题,影响数据价值的发挥。
4、数据模型不成熟
高校很欠缺数据分析模型,这么多年一直在谈大数据怎么用?怎么构建应用场景?怎么利用场景解决问题?很多高校都有各自不同的亮点和特点,却都没有形成公认的模型,让大家有可参考性或者可模仿性去实现自己学校的建设。
打破现状,坚定前行
清晰的系统架构设计
左边是已有业务系统,包括新建业务系统、当然还有一些非机构化数据,如电子表格等。
中间是学校数据集成,包括数据编码标准、数据子集标准针对每类主题数据,建设了一系列多维数据集,包含:师资分析多维数据集、学生分析多维数据集、教学分析多维数据集、科研分析多维数据集、成绩分析多维数据集、消费分析多维数据集、就业分析多维数据集等多个分析主题域,其成熟度还在不断验证中。
右边是数据查询分析,围绕教学工作量主题域、科研工作量主题域、学生学业预警主题域等也可清楚表达,通过对主题域数据信息的抽取、加工、反馈让信息获取、利用更加完善。
数据治理,管理、技术一个都不能落下
在数据治理过程中,技术和管理同样重要。如何让领导打开报表时认为是真的而不是假的,是最新而不是去年的?首先让领导认可这数据,这非常重要,这就要求数据得非常规范。
数据治理是保证数据质量的必要手段,得注重技术手段和规范管理双管齐下,严格执行学校制定的数据治理规范。
一、建设学校“数据文化”,促进科学管理决策
在校领导、管理者及师生中培养与建立“拿数据说话”的习惯,养成收集数据、分析数据的良好工作习惯,建设学校“数据文化”。
二、领导深度参与,夯实规范与标准建设,推进学校数据治理
参照教育部标准,结合学校实际情况,在学校领导深度参与和推动下,依靠广大师生配合与参与,做了如下工作。
(1)制定了常熟理工学院数据编码标准;
(2)制定了人、财、物、教育、科研等多个主题对象的数据子集标准;
(3)制定了数据治理工作规范;
(4)成立了信息化办公室,组建了数据建设信息员队伍。
三、做好数据安全管理工作
除了在技术手段上部署了一系列数据安全与防范措施外,学校还在数据建设与使用过程中制定了一些数据安全工作规范,来确保数据安全。
(1)制定学校数据使用规范流程,使用数据前必须经过申请和审批,并严格按照规范测试和使用,防止开发测试及使用对数据的质量造成影响。
(2)对各类数据的访问进行严格的分级授权控制与管理,防范非授权访问各类数据主题域。
(3)制定“业务数据谁产生、谁负责”的规则,把数据安全责任落实到部门和个人。
(4)对数据建立和实施严格的备份机工作制度,实施数据的全生命周期管理,确保数据安全可靠。
具体到一些细节如下:
1、数据收集
标准建设数据收集的非常关键环节。
一开始的数据标准很难直接在高校落地,因为太大太宽,把所有信息化因素都考虑了;少数真正落实到高校的好多信息也用不到,如果不做任何过滤都展示出来,老师反而不知道怎么填,导致标准形同虚设,前面不会听后面也不填,那信息就没有统计和分析的价值了。
第一次数据收集是为了奠定后续数据可信、可靠的基础,所以方法和规范很重要。只有脚踏实地逐个敲定每个字段,如:学号、姓名、职称、职称级别等,针对每一个字段该填什么的规范都定得清清楚楚,才能收集正确且有效的信息。
简单总结数据收集流程:
(1)建立信息编码标准和数据子集标准;
(2)通过数据集成的工具、API批量导入数据;
(3)如果业务部门没有数据提供,只能采用人工导入的笨办法;学院不同,制定政策也会不一样,那标准也不一样。
2、数据更新
与其说学校信息化做得好还不如说学校管理做得好,如果没有一套工作规范、管理规范,数据更新维护规范根本无法构建。
以学校发布的数据维护工作规范为例,将全校各类数据责任到部门,由专人负责,即每个院系部门均有专任的信息员。对各部门数据的采集、处理、存储、传输和使用进行规范管理,确保数据唯一、可信、可用、准确、动态和及时。下表是我校出台的相关数据使用与维护规范---学生基本信息日常维护时序表,在该表中,明确了各个数据项的负责部门、负责人及维护时间频率。
根据业务系统数据特征制定数据更新频率、不同业务系统的数据维护规范、数据更新维护规范,虽简陋但执行非常有效。
【这里穿插一个小故事】
之前很多学校来我校调研考察,还坐在交流会议室交流呢,不到1小时交流考察的新闻已经发布出来,这就是我们的信息规范,这就是数据之所以可信非常重要的因素。针对数据管理工作规范,我们一直在整理也发过文,大家已经养成习惯,数据什么时候同步更新大家会自动完成。
3、数据管理
数据来源于各管理部门,必须各司其职,我们信息化办公室得做好数据监管职责,一旦发现数据有问题、质量不高,就要立即沟通整理整改意见。
(1)以协调会方式推进;
(2)成立信息员小组,小组成员来自每条线都是各个学院/部门兼职,这支队伍建设尤为重要;
(3)不定期组织老师开研讨会,沟通交流的同时增进感情,大量数据保障都从长期沟通开始的;
(4)需要创建制度规范,纳入管理执行,形成规范后领导带头监督,哪一块不准就找谁,各司其职就建立起来;
(5)制定业务考核机制;
(6)定期组织内部培训。
信息化队伍一定是多条线多维度的,光靠信息化部门远远不够,信息员队伍建设非常重要。
突出成效
1.服务学校领导,推动科学决策
通过数据治理平台与决策支持平台的建设,为学校在宏观、中观和微观管理决策上提供数据支撑,使得校领导能够“既见森林,又见树木”。采用逐层深入、分级浏览的方式,从不同层面为校领导管理决策提供支撑,在校级层面对师资结构、教学监控、科学研究、师生精细管理、资源配置等方面提供了强有力的数据分析支持。
2.瞄准管理“盲点”,解决管理“洼地”
以学生管理为例,随着社会转型和高校扩招,学生规模逐年增加,但专职学生管理人员的增比远低于学生规模的增比,使得管理工作的繁杂性和艰巨性大为增加。
如何通过信息化手段解决该矛盾就成了我校设计与建设学生综合信息与决策系统的初衷,充分利用系统每天所沉淀的数十万条学生各类活动的海量行为数据,如学习成绩、校园卡消费数据、考勤数据、借书信息以及网络认证数据,通过对海量数据的挖掘,实现了各类预警,如不在校预警、学业预警、网瘾学生预警、消费困难学生预警等。
同时,使学生管理工作者能够“一站式”地获取学生的所有在校相关数据,能快速全面掌握每个学生的详细信息和潜在动向,有助于管理层制定学生工作的管理目标和重点,帮助管理者及时做出反应,增加了管理的主动性。
3.以人为本,提升信息服务水平
信息时代,如何以人为本,利用一切手段来提升服务效率、服务水平也是我们一直在探索的主题,借助移动平台,实现了个人都通过个人手机扫描资产条形码进行盘点等功能,使得所有师生能同时参与盘点等相关工作,大大提高了资产盘点效率。
开发了基于共享数据中心的移动终端查询系统,方便了学生和家长快速、便捷的查询,比如:可以通过使用手机终端来快速查阅学生成绩、图书借阅、校园卡消费等相关信息。推动了业务部门的服务意识与服务效率。
4.培养和提升“数据文化”建设
我校在数据治理过程中,伴随着数据治理平台的推进,培养了学校数据文化习惯,克服了我们中国人固有的“重定性、轻定量”的文化习惯,在校园中推动和培养凡事“拿数据说话”的文化习惯。
未来,还需我们多努力
1、大数据的认识和实践
十三五大家都在提的一个概念或者一个方向——大数据,大数据已来,只是我们还未遇见,但是我认为大数据的应用可能需要我们自己创建和构建,有应用场景的大数据才有价值;
2、数据治理还需进一步推进
无论是大数据、还是小数据,数据质量是最重要的,因此数据治理是一直要坚持和持续推进的工作
3、加强移动互联网化后的数据认识
移动互联网化会对数据认识进行改变,如学生天天拿着手机,挂着wifi,怎样进行数据定位和挖掘;
4、服务的衍生
这是我们需要不断思考和探索的方向。
以上就是我的汇报,花了很长时间准备,但还是有许多不足,不对的地方请大家批评指正,希望有更多机会与大家探讨、交流高校信息化的未来及前行之路。