【数字化战略】段凡丁:数字化来了,我们能够做什么?

27.10.2014  15:49

 

数字化革命

1946年,在美国宾夕法尼亚大学诞生了世界上第一台电子计算机ENIAC,可能发明者们自己也没有想到,正是这样能快速处理0、1数字的电子计算机及其后来的发展,在几十年后,竟然在世界上掀起了一场持续的数字化革命。数字化时代的到来,数码产品、QQ微博微信、互联网、电子商务、电子书籍影视、MOOC教学、物联网、云计算、大数据、智慧地球等等有形无形的新生事物和概念铺天盖地涌来,每个人或多或少地都感受到了数字化给人类带来的巨大影响和变革。数字化究竟是什么?它能够做什么?也给我们带来许多思考。

数字化或信息化基本上说的是同样的意思,信息是人类能够通过感官和身体对世界万物的感知和体验,如语言、文字、图形、图像、声音、物体、冷暖、味道、动作、行为、情感、思维等等都是基本信息元素。数字化就是用数字来量化表达信息、处理信息并提炼结果的过程。其中数字和信息的对应表达(即数字编码)是最为关键的一步,比如,用ASCII码来表示128个键盘符号摆脱了人们直接使用二进制的麻烦,汉字标准交换码表达了一二级共6763个汉字提供了国人使用计算机的便利,激光照排系统引发了印刷技术的变革,图像编码技术的发展便革了胶卷相机的命,同时也实现了影像资源的数字化网络化,用RFID芯片编码来表示世间物体就带来了物联网的大量应用,互联网的远距离传输信息也是依靠网络协议的双方对应表达约定等等范例都证实了数字和信息对应表达的可能性和创造性,每一项数字化成果都已改变或正在逐步改变了人们的学习、工作、生活、娱乐的方式和习惯。

还有更值得我们思考的问题是我们能找到用数字来表达味道、动作、行为等更有效的方法吗?数字能表达人类的情感吗?数字能表达智慧吗?是表达的程式智慧还是思维智慧?如果能够找到用数字来表达或部分表达上述问题的有效方法,那么更进一步的数字化又将给人们带来什么样的革命性变化呢?

大数据及 分析

大数据作为时下最热门的IT词汇之一,大数据究竟有何神秘的面纱?大数据是伴随着互联网的普及应用而生的,互联网给全世界的人们带来了前所未有的信息增长,然而当经历令人眼花缭乱的信息狂欢之后,人们也发现其实你往往找不到你自己真正需要的东西,互联网上也存在大量的数据垃圾!人们需要对互联网大数据进行收集、整理、提纯的有效方法。

大数据具有Volume(数据量大)、Velocity(高速处理)、Variety(类型繁多)、Value(价值利用)的4V特点。简言之,如何在类型繁多的海量数据中高效的提取有价值的信息,这就是大数据研究和应用要达到的真正目的。越来越多的政府、学校和企业,正逐步意识到大数据的重要,仿佛它就是解决一切信息需求之良方,因其重要甚至被比作“未来的新石油”,但我们要清楚,石油是随着开采而逐渐枯竭的资源,而数据却是随着挖掘应用而日益丰富的资源。

数据的表现形式可分为两类,一类数据是可以用二维表这样的统一结构来逻辑表达实现的如数字、符号、文字等信息叫结构化数据,而另一类不方便用数据库二维逻辑表统一结构来表现的数据即称为非结构化数据,包括所有格式的办公文档、文本、图片、图像、音频、视频信息等等。互联网存在的大量数据都是非结构化数据,因此,大数据的研究和应用就和传统的数据处理和数据挖掘方法有所不同。非结构化数据库主要是针对非结构化数据或半结构化数据来组织存储的,它需要突破关系数据库结构定义不易改变和数据定长的限制,支持重复字段、子字段以及变长字段,实现对变长数据和重复字段进行处理和数据项的变长存储管理,进而能够处理连续信息和非结构化信息并完成搜索、组织并有效检索展示。当前用于分析大数据的工具主要有开源与商用两大类。开源类主要有:Hadoop、NoSQL,membase、MongoDb等,商用类主要有:IBM PureData, Oracle Exadata, SAP Hana、EMC GreenPlum、QlikView等。

尽管从各种各样类型的海量数据中,快速获得有价值的信息是大数据技术的着眼点,但从实用、节省、高效的观点来说,大数据分析也可以根据本单位本行业的具体应用点的需求,采用以时间换空间(通过一定的计算从大数据中提出成品数据或半成品数据以减少存储空间)、以空间换时间(通过对应用点的具体需求限定大数据的搜索范围而提高计算速度)的策略灵活用之,不必求大求全但求实效。

数字化战略的支撑 保障

西南交通大学数字化战略是涉及学校教学、科研、学科发展、管理服务、文化生活等全方位信息综合利用发展的方略,事关学校生存和发展的全局性、方向性、基础性的战略大计,数字化战略将为西南交通大学的复兴升位提供强有力的信息服务和推动引擎。

数字化战略的支撑保障体系即信息化校园的基础设施建设,只有在支撑保障体系的基础上,才能向教学、科研、学科建设、管理服务和社会服务提供强有力的信息支撑和信息服务。支撑保障体系功能包含硬件保障、软件保障、数据保障三大部分的内容。硬件保障主要包括网络系统,服务器系统、存储系统、安全设备等硬件组成,为全校提供共享虚拟化硬件资源,实现基础设施即服务(IaaS)云计算服务功能。软件保障主要是数据库系统、操作系统、体系架构、应用系统、服务平台等系统软件,要向着平台即服务(PaaS)和软件即服务(SaaS)的云计算服务模式发展,为用户提供软件支撑服务。数据应该说是信息化校园或数字化战略的生命,必须逐步积累丰富完善,全力保障数据安全。

数字化战略的支撑保障体系架构目前可归纳为“三网二平台一数据”。“三网”指的是有线宽带网、无线网和园区物联网,我校从1995年开始建设的校园宽带网已经基本完善,但随着技术进步需要逐步升级换代。无线网需要较大的补充和完善,以便更好地支持移动互联应用。园区物联网包括地理信息、一卡通门禁、图书档案、智能楼宇、设备及节能、安全监控等许多内容,需要统一规划建设。“二平台”指的是管理服务平台和教育教学平台,这两个平台目前都有一定的数据应用基础,要大力推广应用和完善功能。随着数字化战略的推进和应用需求的扩大,平台还可以在此架构上扩充多个。“一数据”指的是学校的公共数据中心建设。数据中心从数据层面来看,要集中积累全校的数据资源,实现充分的数据共享并发挥以下三点作用:一是为全校的每一个信息系统应用提供畅通的共享数据,提升各个应用系统的能力和数据覆盖面;二是为全校师生提供信息查询和利用的快捷服务;三是对现有的数据资源进行数据分析和数据挖掘,为学校的发展提供决策支持。数据中心在数据积累到一定程度后要逐步向大数据的方向发展应用,也要对学校外部有关教育、科研、人才的数据进行收集研究分析。数据中心从基础设施层面来看,包括服务器、网络、存储、安全和整个运维服务,能够快速实施部署各种IT系统,为全校各种应用提供硬软件资源共享。

管理服务平台

信息平台相比信息系统,含义更加广泛:信息平台具有系统多元化、数据多元化、用户多元化的融合性,具有统一的信息格式、数据接口、文本协议、操纵环境等结构,确保横向和纵向兼容。信息平台也是一个开放的复杂系统,开放性是指信息平台的功能、结构、层次等系统结构要素本身是发展变化的,表现为融合系统功能的不断扩张,信息处理能力不断提高。

管理服务平台主要包含数据中心和应用及系统集成两大内容。

1、以共享数据交换平台实现数据中心以“学生、教师、资产设备”为主线覆盖全校的三大数据流建设,基于我校信息化建设现状,理顺数据流的关系,并逐步实现数据的整合服务主要有:

关于学生数据流:招生信息、学籍信息、学生管理信息、住宿医疗信息、一卡通业务、网络自助服务、电子邮件、图书资料、学费课程数据、教务教学信息、党团信息、就业信息、校友信息、档案信息、院系信息等。

关于教师数据流:入职信息、人事信息、党团工信息、财务信息、科研信息、办公信息、一卡通业务、网络自助服务、电子邮件、图书资料、医疗信息、设备管理信息、教学信息、考核信息、档案信息、院系信息、个人填表信息等。

关于资产设备数据流:财务信息、科研信息、资产信息、后勤信息、科技产业、图书资料、设备信息、规划建设、地理信息等。

学生、教师、资产设备这三大数据流并非完全独立,他们之间也是有一定关联的,研究并理清他们的关联,对数据整合更是大有好处的。

2、系统集成包含应用系统实现单点登录和信息门户两个方面。单点登录可实现用户一次输入用户名和密码登录后,便可使用他在校内的各种应用而不再需要去记住繁多的系统密码。信息门户则将全校更多的部门应用系统数据和信息服务前推到校园信息门户网站,实现学校信息的综合展示和服务的一站式办理,极大地方便师生员工的使用。学校各部门的应用系统是信息化校园的源头,一定要全校参与应用,人人参与应用,不留信息化死角。

图书信息应用也是学校信息化的重要组成部分,要实现电子资源的数字化和有效使用,引入自主化学习模式、中外文知识发现系统等应用,发展下一代图书信息服务平台。

大力建设校园物联网及应用,在地理信息、一卡通门禁、智能楼宇、设备及节能、安全监控等方面逐步实现智能化管理,为建设具有高度数字化和智能化水平的极大方便师生的“智慧校园”奠定基础。

应用推动——我们能够做什

计算机最基础的理论就是:多种数据经过模式化过程(程序)反复计算而得到所需的结果。这句话按照不同的侧重可理解为面向数据的计算和面向过程的计算。我们要充分利用数字化和计算机的思维、手段和方法应用到学校教学、科研、学科建设、管理服务、社会服务以及文化生活等全部活动,以客观的数据及分析结果来极大地提升主观活动的效率、能力、质量和成果。

信息化校园的硬件、软件和数据中心的基础支撑下,要实现数字化战略的目标的关键就在于应用,什么是应用?就是我们利用信息化的手段能够做什么和怎么做?是值得长期思考和探索的问题。无论信息化怎么发展,人永远是具有智慧的主人,只有我们结合工作学习的实际,找准应用及其细化的应用点,信息化才能为我们所用。

学校各方面的全部活动所包含的应用非常多,不一枚举,归结起来可分为几大板块的应用,前面介绍的管理服务平台是一大板块。还有教育教学、科学研究、社会服务、学科建设等板块是学校生存和发展的重要方面,这些板块的应用侧重点不同,信息化的思路也应该选用合适的方法和手段。个人以为:管理服务、社会服务、学科建设板块的应用需要大量数据的积累和分析,参与人之间的互动交流较少,适宜采用面向数据的计算模式。而教育教学、科学研究板块的应用除了基本的课程课件、人员信息、论文、资料、项目、成长、成果这样的数据管理和信息服务外,更多的是要让师生和科研人员全程参与教学、科研的全部活动,在每一项活动中有效的交流互动、思维碰撞、激发创新、总结经验、产生成果,其信息化的手段针对面向过程的计算模式效果更突出。

以MOOC为代表的网络在线教育平台怎么样才能和传统的广播电视大学及网络教学有本质上的提升?又怎么样和现有的大学课堂式教学相辅相存?主动知识学习和文凭社会的格格不入怎么样缓解?这些问题是信息化教学人才培养的最大挑战。教育教学平台要突破传统教学的时空限制,构建以教师为主导、学生为主体的自主开放贯穿教学全活动过程的信息化教学环境,在注册分组、课程发布、资料积累、自律约束、自主学习、解惑答疑、心理思维、作业测试、交流分享、成绩效果等一系列思想和心理活动过程充分实现信息化,进一步通过信息化的手段探索教育教学模式的体制机制创新与改革,促进创新能力和终身学习能力的培养。

信息化应用于科研,要与科研活动为主线。从信息技术理论的视角来看,科研的过程即是人员组织、思想交流、知识创新、经验积累、渐进成果的活动过程,科研活动迫切需要一个科研协同互动平台,在这个平台上,科研活动的过程信息化要满足大多数项目的应用需求,可实现大多数项目的科研活动全过程中的网络应用交互和仿真。在做好科研项目管理信息化的同时,科研信息化的重心是否考虑落在科研活动的全过程中,如项目立项、跨学校跨学院跨学科的科研人员组织、最新科技资料的收集和查询、团队协同、思想碰撞、设备利用、研究记录、成果验收、转化推进等等环节实现信息化支持,同样要利用信息化进行科研体制机制的创新和改革,这样才能真正有利于科研水平的提高。科研板块还要考虑建设能够满足大规模科学及工程计算的硬件软件共享平台。

社会服务、学科建设是典型的面向数据或面向大数据的应用平台,需要大量的数据收集、组织、整理、分析、挖掘和服务。如学科建设(包括行业、专业、应用、人才、机构、团队、项目、成果、影响力等许多因素,每个因素都可以作为应用点)在国内、行业内、国外所处的地位,进行历史、现时和将来的数据分析,找出学科优势、差距、努力方向等问题,提供相关人员参考和学校领导决策,更好更快的推动社会服务和学科发展。

个人观点,请参考指正。

 

个人简介:

段凡丁,信息网络中心高级工程师,最短路径SPFA算法发明者。