您的位置:首页 > 教育频道 >

焦点!大数据视角下高校数据治理体系研究与实践

来源: 中国教育新闻网-《中国高等教育》 时间: 2022-08-22 16:59:55

[摘 要]本文参考国内外高校数据治理研究成果与实践经验,分析当前高校教育数据治理工作面临的困境,将各类用户角色纳入数据生态体系,围绕教育数据全生命周期的业务逻辑,构建数据治理体系建设的三层次模型、递进式框架和分段实施路径,助力高校数字化教育转型和教育治理模式的现代化变革。

[关键词]大数据;数据治理;数据资产;智慧校园;数字化教育

数据是教育信息化创新发展进程中的核心资产,构建大数据视角下建设高校数据治理体系,支撑高校管理信息化向服务智能化转变和教育数字化转型已成为必然趋势。高校具有的数据体量更巨大、数据类型更复杂、数据交换更密集,数据治理的需求也更紧迫。从应用需求的角度出发,数据治理能科学精准地促进教育运行机制由管理迈向服务,并快速有效地驱动服务模式由被动转为主动,构建真正以人为本的教育教学生态环境。


(资料图片仅供参考)

高校数据治理的目标和任务

数据治理基础体系建设。建设一套完整的数据标准管理体系和数据全生命周期管理机制,强化数据标准的实际使用和执行情况的管理手段。对于内部主数据库和业务数据库之间出现的信息标准不一致或不同步情况,系统能及时检查并有良好的监控、反馈、维护机制。建设完备的从数据采集、清洗、存储,到维护、分析、显化以及应用等各环节的质量管理体系,有效管控数据处理流程的每一个步骤。

数据治理运维体系建设。建设数据治理服务体系,包括信息化需求调研、信息标准制定与迭代、代码标准制定与迭代、数据集成清洗转换、数据质量提升等方面,最终形成数据资产标准化,逐步完成数据集中管理阶段向数据资产运用阶段转变。建设数据分析与决策体系,在业务系统数据治理的基础上,进行多数据源、多数据类型、多模型关联的综合治理和创新应用阶段,拓展分析的维度和精准度。建设数据开放和管控体系,降低数据业务对接的难度,进一步实现统一融合的网上数据开放共享和全流程可信管控,确保数据服务与共享机制的可执行性和权威性。

数据治理技术体系建设。数据治理相关系统在某一时段集中进行数据采集、传输、查询、统计、分析等情况下,要具备高并发处理和计算支持能力。要充分考虑系统软硬件架构整个系统运行的安全策略和机制,以数据管理和数据服务为核心提供完整数据安全和隐私保护技术手段,包括数据脱敏加密和审核日志、操作日志、数据调用记录等留存回溯,确保数据的准确应用、合理共享与敏感数据安全。系统界面风格和页面流转设计坚持软件功能和人体工学统一,以用户为中心,结合视觉、交互、情感等综合感受,使软件系统更简易、更高效地适应用户的使用需求和习惯。

高校数据治理体系建设

对教育大数据进行高效组织与科学管理,将多源、异构、分散的数据转化成数据资产,基于“获取→处理→使用→服务→反馈→评估”的过程监管和“发现→监督→控制→沟通→整合→协同”的服务模式,构建数据治理与服务治理相结合的数据治理体系。

1.数据治理三层次模型

一是基础数据实体层。该层形成教育数据化实体,明确数据治理工作的目标、任务、要求、标准和工具。建立完备的数据共享、管理和服务机制,夯实数据的存储平台、交换平台、计算平台等基础设施,实现关联业务数据的交换与集成。基于规范的数据标准,选择合适的数据采集、清洗、存储、处理等应用工具,构建交付业务对象使用的数据实体化模型。

二是业务流程融合层。该层结合学校实际需要,依据各类业务流程逻辑和数据交换网络设计工作流引擎,实现数据的快速配置、高效实施以及横向、纵向关联业务权限、流程、信息的深度交互,促进松散耦合的业务流程之间相互融合。应用基础数据实体层的数据实体化模型重组数据信息并以服务再造业务流程,构建层次化、服务化的数据资产可视化管理体系。

三是服务创新应用层。该层重构教育数据服务架构,形成“数据→信息→知识→服务”的智慧演化路径。使用标准化的数据应用服务接口,将数据服务端与应用端实行解耦合,为业务主体提供准确可靠的数据统计和分析结果。建立数据服务驱动模型,强化教育数据可持续的循环利用,构建“生产大数据流程→存储大数据流程→应用大数据流程→生产大数据流程”的数据全生命周期闭环模式。

2.数据治理体系框架

在大数据环境下的高校数据治理面临的首要挑战是数据标准化、数据质量管理、数据安全与隐私保护等问题。为了更好地解决这些问题,需要重点关注对元数据管理、主数据管理、数据质量评估和数据安全监控等方面的治理。

体系架构方面,建立健全数据治理机制体制,构建机构运维的多元协同保障体系,围绕数据的全量采集、清洗转换、存储备份、交换共享、分析计算和应用服务等全周期流程,经数据标准模块、元数据模块、数据质量模块、数据资产模块、数据安全模块、数据集成模块的协同作用,发生数据无序到有序、量变到质变的增值效应。

规章制度方面,数据治理的制度在人员、技术、方法、管理等方面规范和指导各模拟工作的有序开展。相关政策与制度的制定应符合国家、高校、行业的长远发展规划和战略目标要求,要有利于整体统一管控和机构权限明晰,加快基础数据库、视图数据库、主题数据库的建设,有序推进数据集成与开放共享,完善数据共享交换机制、数据质量监督机制和数据安全保障机制。

机构职能方面,基于高校机构实际,明确数据治理项目的工作机制,按照各级角色岗位与权责分配机构职能,建立数据治理责任体系,自上而下划分为决策层、控制层、执行层、开发层。决策层包括校领导、校网信领导小组,负责统筹整体管理,提出总体建设目标,确定工作协同机制等;控制层包括校网信办公室、信息中心等,负责制定技术标准,架设平台环境,清洗集成数据,校审数据质量,保障数据安全等;执行层包括二级学院、业务部门,负责落实数据管理办法,提供业务数据,执行业务流程等;开发层包括系统开发商,负责执行数据标准,研发软件系统,定义数据字典,提供数据接口等。四层有机协同,确保各项规章制度、管理办法、工作流程等有序实施。

数据标准方面,严格遵循国家、行业现有的数据标准和相关规范,制定与学校长远发展相适应的数据标准管理办法和组织架构,构建工作体系、建设内容、流程路线、建设方案和评估考核等。数据标准是供数据治理体系内部进行数据交换、共享、挖掘与分析的基础,为教育数据的完整性、有效性、规范性、一致性、共享性、开放性提供规范要求,同时为构建教育大数据资产和形成数据价值提供坚实保障。

数据资产方面,通过全方位、多维度、深层次利用,实现管理的智能化和服务的微型化。开展有效的数据治理工作,逐步将教育数据转化为支撑各类业务应用的重要信息资源。围绕数据资产全生命周期进行科学管理,依照业务域规划数据资产目录结构、设计规范和纲要规划,将学校全量数据中心存储的数据资产定义标准结构后进行注册。为确保数据资产业务不断增值,需要上下联动、健康有序地开展系统运营与维护,迭代式持续优化数据资产质量。

数据集成方面,通过数据仓库工具(将数据从来源端经过抽取、转换、加载至目的端)或数据总线,将多源异构数据源集成到数据平台,完成数据的同步、清洗和转换。在数据集成的过程中,一是通过底层数据仓库工具和数据库配置捕获其状态和变化,二是通过标准化工具进行全过程管控。

数据安全方面,数据安全管理体系及执行策略为学校教育数据资产的可靠使用提供支撑,实现对数据生命周期各环节的全覆盖。科学运维管理是数据安全模块的核心,健全覆盖数据收集、传输存储、使用处理、开放共享等全生命周期的数据安全责任体制和数据分类分级管理制度,利用内容识别、检测、防护、加密、水印、脱敏、审计等防范手段,实现对数据生命周期多个环节的全覆盖。科学应用全量数据中心和数据平台的内部数据,不断加强各模块之间数据交换的安全管理,常态化开展数据安全监测和预警通报,形成体系化、层次化的数据安全防护能力和规范化、流程化的垂直监管体系。

高校数据治理的实践路径

围绕当前高校教育数据治理工作的困境、发展及目标任务,运用多层次模型和治理流程,在综合分析建设原则与内容的基础上,形成兼具可行性和示范性的实践路径。

1.明确数据治理服务

第一阶段是确定治理范围。项目建设初期,整体调研学校数据资源情况,整理现有的业务数据资源,明确其与职能部门的隶属关系,梳理并形成数据资源目录、系统业务及人员对数据的使用规范,定义出敏感数据。明确现有的业务应用需求、共享数据库、数据库结构、共享数据资源及主数据库与业务应用、部门职能的资源供需关系,汇总数据资源整体情况,编制治理工作实施方案。

第二阶段是系统业务梳理。结合前期资料分析与实地研究,围绕业务部门及与业务相关的系统单元与现场调研的采集结果,项目工作组撰写、提交数据资产调研报告,经项目负责人及校方网信管理机构确认后,完成系统调研阶段的工作。一是基于业务流程进行数据梳理,通过梳理业务流程,充分了解当前学校及各二级单位的数据现状和应用需求,有助于进一步理解与数据相关的业务含义和业务规则。二是基于信息系统结构进行数据梳理,通过梳理信息系统结构,明确数据在信息系统的分布情况,为后续进行数据职权、责权划分及数据关联关系的明确打好基础。三是基于数据流进行数据梳理,通过梳理数据流向及运行状态,充分了解数据的产生、采集、存储、加工、应用等多个环节,有助于建立完善的数据全生命周期管控体系。

第三阶段是建立校标体系。通过对数据和业务进行梳理,得到相关数据项标准、代码标准、编号标准等,基于系统对数据项进行重新组合,最终形成适用于校情的数据资源目录。有效利用现有的数据资产,建立真实有效的智慧校园数据标准。整体校标体系建设过程分三步进行:第一步将利用学校现有标准,对所覆盖的业务信息系统进行数据校对。在该阶段需要分析数据视图或最新系统导出的数据字典,重构原有数据标准,保证原有标准的可落地性。第二步为重新调研治理范围内的原标准没有覆盖的系统数据,通过调研数据结合相关标准,进行数据梳理与标准建立。第三步将现阶段的数据标准输入数据平台,进行标准与学校真实数据的关联匹配,并启动数据项校验,使系统常态化识别实施标准与现阶段学校物理数据的差距,实现标准的落地性检测。通过平台检测出的质量结果,对真实数据标准进行微调,再让数据标准跟真实数据进行关联,形成常态化真实校标。

2.健全数据治理制度

高校数据治理政策及制度的建设应遵循“统一管控、按需开放、充分共享、服务挖掘、安全可控”的基本原则,应包括但不限于以下两个方面的政策及制度:一是基于组织管理方面,制定《数据管理组织的角色权责及管理方法》《数据人员考核评估办法》等。二是基于技术方法方面,制定《数据管理办法》《数据信息标准规范》《数据质量管理办法》《元数据质量标准及评估指标体系》《数据安全分类分级管理办法》等。同时,针对各类数据质量问题,制定识别、监控、度量、预警、处理、反馈等一系列管理活动的闭环数据规范体系,保证学校数据治理与共享服务大数据系统的正常运行。

3.强化管理和运维体系

完善教育数据可视化管理和操作规范,包括角色、权限、元数据管理规范,建立大数据运维规范,包括数据质量监控、数据查询、数据调用等,规范学校相关部门管理人员对系统的管理和维护,具体包括规范业务数据维护标准、规范数据管理标准、建立数据字典、建立平台架构设计规范,通过引入数据标准规范,将数据安全和隐私标准进行规范化,包括提供数据共享与服务时,对数据的存储安全、传输安全、分析挖掘安全等方面进行标准化。

[本文为中国高校产学研创新基金(重点项目)“大数据视角下高校数据治理体系及方法论研究”(2020ITA02010),盐城师范学院教育教学改革课题“高校智慧教学空间建设研究与实践”(2021YCTCJGY030)的研究成果]

【作者:张辉 李健明 杨强,作者单位:盐城师范学院】

原载2022年第13/14期《中国高等教育》

标签: 大数据视角下高校数据治理体系研究与实践