【数字化战略】陈庆春:大数据重新定义数字化校园

24.10.2014  10:52

 

作为这个时代的引领性技术,信息技术正在彻头彻尾地影响和改变着人们的生活、学习和工作方式。我们正处于一个以互联网和大数据为主旋律的新的科技革命时代,以互联网和大数据为代表的新的科技革命正颠覆性地冲击着各行各业的生存命脉,这是一个划时代的大事,怎么高估不为过的。在此背景下,我们有必要重新审视和定义在大数据时代的数字化校园技术。

数字化校园是以数字化信息和网络为基础,在计算机和网络技术上建立起来的对教学、科研、管理、技术服务、生活服务等校园信息的收集、处理、整合、存储、传输和应用,使数字资源得到充分优化利用的一种虚拟教育环境。数字化校园通过实现从环境(包括设备,教室等)、资源(如图书、讲义、课件等)到应用(包括教、学、管理、服务、办公等)的全部数字化,可以在传统校园基础上构建一个数字空间,以拓展现实校园的时间和空间维度,提升传统校园的运行效率,扩展传统校园的业务功能,最终实现教育过程的全面信息化,从而达到提高管理水平和效率的目的。显然,要实现数字化校园技术,其基础是互联网技术,但核心和关键是数据和信息服务。但在大数据技术发展的背景下,我们有必要重新审视和定义数字化校园的技术内涵,并适时地修订数字化校园建设和发展的目标。从短期目标来看,数字化校园建设是满足学校办学和管理随时随地在线的各类信息和数据服务,但其中,长期发展目标则应该设法瞄准区域、国家乃至世界性的教育、科学研究与数据中心。在此背景下,应该设法构建能够满足数字化校园应用长期持续发展的框架,而这个框架的核心正是依托于互联网和云计算技术之上的大数据技术。

大数据时代已经来临

得益于计算机的强大的存储、搜索和互联网所提供的互联能力,人类近年所积累的数据呈爆发式、指数级的增长,据统计,全世界每18个月所产生的数据总量几乎就等于人类过去所拥有的数据的总和,面对如此景象,一些学者敏锐地发现了一个人类再认识的数据宝藏。2008年计算社区联盟 (Computing Community Consortium)发表了一份有影响力的白皮书《大数据计算:商务、科学和社会领域的革命性突破》,该报告把大数据和革命性突破联系在一起,大数据被认为是继实验研究、理论分析和计算机模拟仿真之后的第四种科学范式,将取代还原论及传统的复杂性科学。

大数据所处理的是具有数据量增长速度极快,用常规的数据工具无法在一定的时间内进行采集、处理、存储和计算的数据集合。具体来说,大数据的第一个特征是数据量大,包括采集、存储和计算的量都非常大。第二个特征是种类和来源多样化。包括结构化、半结构化和非结构化数据,具体表现为网络日志、音频、视频、图片、地理位置信息等等,多类型的数据对数据的处理能力提出了更高的要求。第三个特征是数据价值密度相对较低,或者说是浪里淘沙却又弥足珍贵。随着互联网以及物联网的广泛应用,信息感知无处不在,信息海量,但价值密度较低,如何结合业务逻辑并通过强大的机器算法来挖掘数据价值,是大数据时代最需要解决的问题。第四个特征数据增长速度快,处理速度也快,时效性要求高。比如搜索引擎要求几分钟前的新闻能够被用户查询到,个性化推荐算法尽可能要求实时完成推荐。这是大数据区别于传统数据挖掘的显著特征。最后,大数据应该是永远在线的,是随时能调用和计算的,这是大数据区别于传统数据最大的特征。2011年5月,全球知名咨询公司麦肯锡(McKinsey & Company)全球研究院(MGI)发布了一份报告——《大数据:创新、竞争和生产力的下一个新领域》,该报告指出,大数据已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。尽管仍然处于快速发展演进的过程中,但目前普遍的共识是,大数据技术是一种新一代技术和构架,它通过快速的数据采集、处理和分析技术,从各种超大规模的数据中提取价值。大数据技术不断涌现和发展,让我们处理海量数据更加容易、更加便宜和迅速,成为利用数据的好助手,甚至可以改变许多行业的商业模式。

2011年2月,IBM的沃森超级计算机每秒可扫描并分析4TB(约2亿页文字量)的数据量,并在美国著名智力竞赛电视节目《危险边缘》“Jeopardy”上击败两名人类选手而夺冠。后来纽约时报认为这一刻为一个“大数据计算的胜利。”2012年3月,美国奥巴马政府在白宫网站发布了《大数据研究和发展倡议》,这一倡议标志着大数据已经成为重要的时代特征。2012年3月22日,奥巴马政府宣布2亿美元投资大数据领域,是大数据技术从商业行为上升到国家科技战略的分水岭,美国政府对数据的定义是“未来的新石油”,而在大数据技术领域的竞争,事关国家安全和未来。并表示,国家层面的竞争力将部分体现为一国拥有数据的规模,以及解释、运用的能力;国家数字主权体现对数据的占有和控制。数字主权将是继边防、海防、空防之后,另一个大国博弈的空间。2012年7月,联合国发布了一份关于大数据政务的白皮书,总结了各国政府如何利用大数据更好地服务和保护人民。这份白皮书举例说明在一个数据生态系统中,个人、公共部门和私人部门各自的角色、动机和需求:例如公共部门出于改善服务,提升效益的目的,提供了诸如统计数据、设备信息,健康指标,及税务和消费信息等,并对隐私和退出权力提出需求;私人部门出于提升客户认知和预测趋势目的,提供汇总数据、消费和使用信息,并对敏感数据所有权和商业模式更加关注。白皮书还指出,人们如今已经可以使用极大丰富的数据资源,包括旧数据和新数据,来对社会进行前所未有的实时分析。联合国还以爱尔兰和美国的社交网络活跃度增长被作为预示失业率上升的早期征兆,这些工作表明,如果能合理分析所掌握的数据资源,将能“与数俱进”,快速应变。

科学杂志编辑部认为,信息分析与模拟仿真技术和人脑工程将是未来最前沿的技术。而这些前沿最核心的技术现在看起来就是大数据的处理,数据处理能力被认为是一个国际竞争力的标志,数据决定成败。云计算加大数据再加互联网,将深深改变世界,一个新的时代开始了。人们未来希望就像今天我们用水用电一样,可以非常方便、随时随地可以获得所想要的信息,寻求解决方案。IBM的CEO彭明盛在金融危机之后对奥巴马说,在人类历史上第一次出现了几乎任何东西都可以实现数字化、互联化,还有什么信息不能被挖掘、分析、优化、决策到提供一个整体的解决方案。在这个逐步演进的过程中,充满了机遇与挑战,哪个行业落后都会被淘汰。借用中国工程院院士郭重庆在最近的2014年9月中国管理百人报告会上报告的表述,大数据是最接近映射真实世界的手段,云计算是社会化配置的计算服务工具,再辅以无所不在的互联网,将给各行各业发展提供难得的历史机遇。

与大数据俱进”的数字化校园技术

人类社会、计算机和物理世界的三元融合,特别是随着智能手机、平板电脑及移动互联网的兴起,人类真正开始进入了普惠计算的时代。每个人,只要手握着一个智能终端,随时随地可以从互联网上的海量数据中获得一个其所想要的解决方案。对高校来讲,所带来的影响是直接和深远的。从表象的影响上来看,大数据已经在影响着我们每个人。悄然之间,各个大学都不约而同地在人才培养环节上多出来了一项工作,那就是毕业季学生论文与各类资料库繁琐的比对查重工作。构建在各级各类数据库和互联网的专业数据(例如学术Google,CNKI、IEEExplore、ACM等)已经成为了科研、教学和人才培养仰赖的基石。那么作为学校数字化和信息化基础的数字校园技术,则必然需要与大数据时代与时俱进。

作为数字化校园的一个典型应用,在线教育一直被视为是下一波教育革命的浪潮。美国《国家利益》杂志认为,在线教育的发展会使上机模式取代上学模式。从上世纪90年代开始,高等教育开始涌现网络化浪潮,近年来以”慕课“(MOOC)为代表的开放式网络课程受到各个学校的高度重视。MOOC是Massive(大规模的)、Open(开放的) 、Online在线的)、Course(课程)四个词的缩写,指大规模的网络开放课程。目前国际上比较有代表性的MOOC课程平台包括EDX、Udacity和Cousera。很多人相信,MOOC开启了互联网时代在线教育的新模式。尽管在线教育发展前景看好,但是请并不像想象的那么一帆风顺。《金融时报》对此作了一个比较贴切的比喻,”你可以把马牵到水边,但你没法强迫它喝水“。从长远的观点来看,在线教育代表着未来,在线教育所遇到的问题是暂时性的,很大程度上问题都是由于大部分的在线教育还因为缺乏有效的大数据技术支撑难以真正满足学生对个性化、精准和有效的课程信息服务。由于通过一个比较长时间的积累,不同教学单位都在重复性地建设同一门课程的在线课程,例如如果大家通过必应(cn.bing.com)查询“计算机原理 在线课程”,所能查到的相似检索结果高达95万条。学生迫切需要大数据技术协助其找到真正适合其需要的优质的在线课程资源。另外在线教育的课程考核和社会的认可程度也在一定程度上影响和制约着在线教育的发展。但应该看到,全社会对在线教育模式的认可需要一个过程。大数据会让在线课程如虎添翼,学校教育可能出现颠覆性的革命。学生在上课倾听任课教师授课的同时,在大数据技术的辅助下,选择全世界同类最为优质的课程资源作为参照,这无疑会颠覆性地改变未来的传统教学方式。基于大数据、云计算和互联网技术,数字化校园的在线教育系统将在很大程度上消除传统课堂教学中教师、学生之间的信息不对称问题。如果能解决课程认证和课程教学质量管理问题,当语言不再成为障碍时,学生和世界顶级名校和学术大师的距离就差一根网线。从长远的发展来看,优质的互联网在线教育资源极有可能成为很多大学办学的标杆与参照,这对各个学校的提高办学质量是巨大的推动和促进作用。一个比较有名的实例是美国斯坦福大学Steven Boyd教授所主持的凸优优(Convex Optimization)以其严谨、准确、清晰和丰富的在线MOOC教学资源( http://web.stanford.edu/~boyd/cvxbook/ , MOOC课程编号CVX101),事实上已经成为了全世界各个高校面向研究生开设类似课程的一个基本标杆和参照,其在线课程平均年访问量已达一百六十万以上。对学生而言,享受全世界最优质和公平的教育资源将不仅仅再是愿景。

此外,与大数据俱进的高等学校数字化校园建设本身也可以为学校各个学科发展提供科学研究的对象和范本。以大数据、云计算和互联网技术为基石的新一代信息技术不单是信息与计算机学科的研究重点,也是高等院校所有学科和专业都必须面对和需要深入研究的颠覆性技术。有了大数据和云计算的有力支撑,互联网与商业的对接演化成为新的商业模式”电子商务“,也成就了阿里巴巴的辉煌;社交网络及微信变成了新媒体,新闻业的围墙正在坍塌,腾讯的微信应用已经抢走了中移动、中国电信和中国联通的大部分短信业务,并传统电信营运商的话音业务和其他流媒体主业也已开始构成威胁。互联网将掀开服务业和新的工业革命“工业互联网”的大幕,互联网正在重新定义制造业,互联网正在重新定义金融。在这个逐步演进的过程中,充满了机遇与挑战,也让传统优势可能在极短的时间内被颠覆掉。

当今世界,科技资源的配置已经全球化,一个企业的竞争力不仅取决于`其内生的科技资源,且同时取决于其整合社会化和国际化资源的能力,同样的道理同样适用于高等学校。依托大数据、云计算和互联网技术建设数字化校园,可以大大改变知识传输的方式,改变传统的教学模式,让学生学会自己去淘知识,体验想象力和创造力的魅力,培养更加富有创新和技术颠覆精神的青年人才这完全符合大学人才培养目标。依托大数据、云计算和互联网技术建设数字换校园,可以突破物理校园的屏障,创建物理校园之外的虚拟校园,并为优化和改进大学教学、科研和管理创造条件。显然,高等学校应当充分抓住互联网、云计算和大数据技术这三大助推器,站在更高的视角来优化顶层设计,制定不同阶段的演进目标。与大数据俱进应成为高等学校数字化校园建设的题中之意,符合高等学校自身发展的内在需要。高等院校应当积极通过数字化校园技术建设作为契机,从学生培养的角度可以有效提升课程建设质量,并最终积极融入到大数据时代下的国际课程教学体系;从学术研究和科研平台的角度,高等学校还应当积极准备参与相关专业或学科的国家乃至世界性的大数据平台和数据中心建设。后一点对一些配置资源有相对劣势的高校尤为重要,可能在一定程度上掌握住一个或多个类似的国家乃至世界性的数据中心其重要程度甚至不亚于建设国家级实验室或国家工程中心。

互联网与大数据时代与每一个学科的相融都会带来全新的变革,这即为知识和技术创新提供了非常宝贵的机遇,同时也为跨学科的学术创新提供很好的基础。归根到底,作为培养人才、科学研究为己任的大学,拥抱互联网、拥抱云计算、拥抱大数据是必然的选择。

 

个人简介:

陈庆春,重庆大学学士(1994)、重庆大学硕士(1997),西南交通大学博士(2004),美国哈佛大学访问学者(2009-2010),英国萨里大学访问学者(2014),IEEE高级会员,中国电子学会信息论分会委员,现为西南交通大学信息科学与技术学院教授、博士生导师。2006年入选教育部新世纪优秀人才。近年来主持国家自然科学基金3项,主持英国皇家工程协会RAE中英国际合作项目、教育部霍英东教育基金优选资助课题、教育部重点科学技术研究计划等省部级科研项目和产学研委托科研开发项目10项,主研国家973计划项目、国家自然基金重点项目、国家863计划等项目多项。在国际国内重要学术期刊和国际学术会议发表论文70余篇,申请中国发明专利15项,参编学术专著和教材各1部。长期担任IEEE多个学术刊物审稿人,并担任过多个IEEE国际旗舰学术会议(IEEE ICC, IEEE Globecom)Session Chair。个人研究兴趣:宽带移动通信技术、基于分布式存储的移动通信网络技术、面向大数据的移动互联网技术、基于压缩感知的信号获取与信息处理技术。