戴斌:应加强跨界旅游与旅行数据整合
作者:戴斌
12月19日下午,受国家旅游局委托,中国旅游研究院(国家旅游局数据中心)在全国旅游统计工作会上对来自全国31个省、自治区、直辖市的旅游委(局)近百名参会代表进行了旅游统计专题培训。中国旅游研究院院长、国家旅游局数据中心主任戴斌首先介绍了国家旅游局数据中心的建设情况,工作经验以及新一年的工作计划。
各位领导、同志们,
关于旅游统计工作的重要性和旅游数据建设的现实意义,上午的领导讲话和地方交流,特别是李金早局长的主题讲话《如何建设和发展旅游数据体系》,已经阐述得非常明白了。事实上就是历史学家黄仁宇先生所说的,中国欲现代化,须“数目字管理””,就是要有以统计为基础的量化管理。在旅游领域,我们从来不少关于发展阶段的定性描述,像黄金发展期、战略机遇期、井喷式增长、排浪式消费、社会热议、普通叫好等。这些判断有其历史意义和现实作用,但是只有定性描述显然是不够的,大众旅游、全域旅游、515战略已经倒逼我们再也不能满足于做整天开会、发文件的“华威先生”,在事关旅游经济发展的关键数据上,再也不能满足于做“差不多先生”。怎么办?杜江副局长上午讲话部署得很清楚,坚持问题导向,建设旅游统计新体系。
根据会议安排,我结合领导讲话和各地经验的学习体会,向同志们汇报国家旅游局数据中心的建设进展、工作经验和下一步的工作打算。
一、建设进展:建平台、打基础、急用先研
为适应新形势下国家战略与旅游产业发展的需要,经中央编办批准,国家旅游局于2015年12月3日正式成立数据中心,与中国旅游研究院全署办公,院长兼主任,受托负责旅游行业统计和经济核算, 推进旅游统计改革工作。机构初创,人才第一。没有符合素质和能力要求的人才队伍,再好设想也会落空。根据局党组的部署,在人事司指导下,我们通过内调、院聘、博士后招收和接受访问学者,组建了旅游统计与数据分析中心的内设专门机构,快速组建了由11名全职研究人员组成的旅游数据人才队伍,其中包括博士4名,硕士4名,博士后2名,访问学者1名,另有研究助理若干。有了这支专职队伍,再加上研究院原有的人才基础,组织平台算是搭建起来了。
盖了庙,请了和尚,接下来就是如何念经,念好经的问题了。建设初期,国家旅游局具体负责统计职能的政策法规司给予了大力支持和业务指导,包括统计处的三名干部到中心挂职工作一年。数据中心则根据专职人员的研究领域进行工作分工和学科整合,特别是增加他们与政府机构打交道的意识和工作能力。说实话,这并不是件容易的事情。为此,我们主动加强与公安部、统计局、商务部、外汇管理局等部门的相关司室的联系沟通,从学术和行政两个角度进行研商,确保机制转换后原有数据交换渠道畅通。我们还组织专职人员在培训的基础上,走访调研旅游实践一线的企事业单位,增强他们对数据的产业实感,及时对接各地旅游统计系统,了解地方旅游统计改革创新进展情况和相关诉求。通过高强度的学术训练和工作实践,这支队伍已经能够完成日常值守、数据采集、加工和生产任务,及时响应局领导对数据中心的工作部署。
人员之后是平台,就是沉下心来,扎扎实实地做好一些基础性的工作,稳步提升中心的数据采集和专业分析能力。数据中心的目标是国家级旅游统计工作平台、旅游数据分析平台、涉旅决策支持平台、相关产业引导平台和国际交流合作平台的建设。为此,我们首先建设了基础性数据资料平台。依托旅游经济实验室,建设了旅游经济数据采集与监测、国家旅游文献情报中心两大基础性项目,构建了电子数据、灰色文献、地方发展、企业创新、口述历史、旅游语料等六大核心数据库,为评估旅游发展、测算旅游贡献、接轨国际数据等研究项目和工作任务提供系统的第一手数据支撑。到目前为止,数据中心已经完成了120万页文献资料的数字化加工,采集全媒体旅业新闻和报告超过40万条,购置了一百余册新中国成立前出版的旅游类古籍善本。建设和推进跨界合作平台。为达到多元数据,特别是非统数据的相互补充和交叉验证目标,数据中心构建了广泛的外部合作平台,优化了数据交换机制。我们与国内排名领先的在线旅游企业及电信运营商签订了战略合作协议,与中国电信、携程旅行网成立联合实验室,实现数据交换共享,联合发布节假日旅游市场预测、乡村游发展等研究报告,推动旅游数据跨界整合和专业化挖掘。这些涉旅游大数据,加上与公安部、发改委、统计局、外管局等部门进行交换的统计数据,顺利开展了国内、入境、出境旅游市场的专项调查和统计工作。
依托“一体系两手册”,构建了基于既有手段和可得数据进行旅游经济测量的技术体系。长期以来,旅游统计、经济核算及其相关研究一直是政府部门和学术界关注的热点,但由于旅游业边界模糊的产业属性,以及统计数据的完善性和准确度不够,有些成果的技术路线、研究方法和数据选择经不起推敲,也无法为专业部门和旅游业界广泛接受。结合过去一年数据中心对旅游统计的系统思考,充分吸收旅游发达国家的国际经验和国内其他部门实践,编辑完成了《旅游统计工作手册》、《旅游经济核算手册》、《旅游统计指标体系》,并经主管司室和局领导审核,成为旅游统计核算的基础文件。据此,我们先后完成了旅游经济贡献测算、旅游就业贡献、校正旅游服务贸易收支统计等专项研究报告。接下来,我的两位同事,也就旅游统计工作的具体负责人,唐晓云博士和马仪亮博士将进行详细的汇报讲解。希望同志们多批评、多指导,经过一段时间的努力,全国旅游统计和数据中心建设尽快实现相对统一和共同认可的话话体系。
基础统计与专题研究同时抓,生产了一批有影响力的数据成果。信息化时代,用数据说话,用权威的数据说话,越来越成为专业交流和社会沟通的重要途径。从这个意义上说,数据已经成为一种新的生产力。为此,我们将“数据建设”做为2016年度工作主题,完成了《旅游统计调查制度》的修订,执行了重大节日旅游市场统计分析和数据报送,发布了《中国旅游统计公报告》、《中国旅游统计便览》、《中国旅游统计年鉴》[正副本]和《旅游抽样调查资料》。完成旅游服务贸易收支、旅游就业、旅游经济中长期预测等产业要报,创刊发行了《中国旅游大数据》,全年按计划出版了四期,得到了中央领导的关注和局领导的肯定。通过居民出游意愿调查、旅游企业家信心调查和访谈调研数据,完成季度旅游数据分析、年度旅游经济蓝皮书等专题报告,为国家旅游局的季度和年度经济形势分析提供有力支持。依托发改委批复的基建项目,建设了旅游数据采集与监测平台,通过整合运营商手机信令数据、OTA浏览及订单数据,和网络爬虫数据,研究了全国乡村旅游大数据算法并发布了相关报告。目前,节假日旅游、自驾游、都市游、城市度假舒适度、旅游价格指数、入境游客旅行轨迹等算法已经初步研制完成,明年将通过手机APP和PC端发布系统上线。我们还将继续对周边游、海洋旅游、避暑游、边境游等专项旅游市场进行算法开发。这些新指标和指数是通过目前的旅游统计系统无法掌握,但又是各级政府和社会各界普遍关心的,数据中心无论如何也要啃这块硬骨头,消除这个统计盲区。当然,这些创新指标和指数都是可以细化到省或市县地域级别,明年我们将从上报到数据中心备案的地方数据中心中选择条件相对好、代表性相对强一些的地方进行研发试点。
二、经验分享:靠组织、广合作、科学验证
数据中心组建所取得了阶段性的工作成果,离不开国家旅游局党组的正确领导和相关司室的大力支持。在事业编制和经费预算没有增加的情况下,如何办好数据中心,一直是党组关心的问题。为此,局领导数次听取听取旅游统计和数据中心建设的工作汇报,并给予了具体指导。李金早局长专门为《中国旅游大数据》撰写了发刊词。政法司本着“扶上马、送一程”的精神,除统计职能委托的相关手续协调和数据中心建设的业务指导外,原统计处的黄雅萍等三名干部到数据中心挂职一年,对数据中心的基础工作平台建设居功至伟。人事司、规财司、办公室等相关司室在人事调配、人员培训、经费拨付和数据交换等工作积极协助。依靠组织,理顺新时期的旅游统计工作机制是必要前提。
国家旅游局数据中心的组建、运营和发展离不开涉旅相关部门的共同支持。各地旅游委(局)对数据中心建设给予了高度关注,通过多种途径与我们保持日常沟通和业务交流,在旅游统计体系建设、旅游经济分析等方面提供了宝贵意见。目前,省、市、县三级地方旅游数据中心建设都在稳步推进中,杭州、四川、吉林等地通过与电信、银行和高校的合作,在统计改革、数据生产、发布和应用方面已经取得了明显成效。大型旅游集团、电信运营商、互联网企业、中国银联等市场主体企业积极参与旅游数据生产和成果共享,国际国内的高等院校、科研机构和行业媒体也在进入旅游统计研究、测算方法、人才培养和成果发布的知识网络。大数据时代,保持开放和共享才能适应市场需要。
旅游统计是一个世界性难题,产业边界界定、旅游统计、定量分析等难度较大,研究和发展的成果必须要经验得专业检验和社会质疑,才会有公信力。这一目标的实现须建立在高水平的专业团队和高质量的技术平台之上。参与数据中心建设的人员,不论多高的学历和职称,都必须深入到数据采集、数据交换和数据清洗的第一线,都必须全程参与到数据分析、经济核算和成果撰写的全过程,通过反复推导和交叉检验,以求更合理地评价旅游经济运行。以跨界大数据的创新旅游指标和指数研发为例,很多同志可能都遇到过电信运营商或者地图提供商的工作人员上门推销其数据的情况,可以提供某一个时间点或时间段在某省、某市外地人的总量和结构。这些数据看上去很美好,然而通过外地手机号捕捉的数据,如果不经过算法清洗是不能直接使用的,比如有很多人在本地工作却仍然保留其原先的外地手机号,也有很多人只是做火车或汽车路过你的城市,都需要专业团队的进行算法过滤,运营商是没有能力做这方面工作的。
数据中心的一些研究成果之所以得到业界关注,靠的是立足于扎实研究基础的技术优势。数据中心建设是一项需要长期推进的系统工程。结合多年的研究成果和当下旅游发展特征,在数据采集范围和渠道、数据清洗方法、统计指标动态更新、标准制定、分析模型优化等方面进行修正和创新,形成更完善的旅游统计和经济核算体系,成为旅游经济运行分析的坚实技术基础。
三、明年思路:深挖掘、拓专题、转移技术
2017年,数据中心将努力贯彻全国旅游工作会议、全国旅游统计会议精神,全面推进“五个平台”建设,坚持问题导向,深入挖掘旅游数据,拓展专题研究,更好地服务于政府、企业和和广大游客,推动已经成熟的技术文件向地方转移,同时加强业务交通与合作,共创旅游统计革命新格局。
进一步加强跨界旅游与旅行数据整合和专业化挖掘,更好地为政府决策服务,为产业发展服务,为游客满意服务。着力打通旅游者的全链条数据流:居民在家时,通过具有自主知识产权的居民出行意愿调查平台和分析模型,获取居民对旅游的潜在需求数据,包括但不限于出游目的地、出游时段、消费预算等消费指标。居民出游过程中,通过与携程、海航、同程、途牛等旅行服务商,中国电信、移动、联通等运营商,腾讯、百度等互联网运营商、中国银联、VISA等金融服务商合作,依据居民的位置信息和消费信息,经过脱敏后获取出行轨迹、旅游时长、消费结构等数据。辅以一定规模的抽样调查,对居民出游特征、区域游客规模、游客花费和满意度评价进行更深入的测算和分析。居民如选择旅行社等机构安排出行,我们依托与携程、同程、蚂蜂窝等众多企业的合作取得订单数据,经脱敏感后分析消费者的旅游偏好、旅游需求和旅游评价。通过各个环节的数据分析,我们努力取得多维度的旅游数据,对乡村游、自驾游、入境游等通过设定合理算法进行分析,为我们的宏观旅游市场分析、企业咨询服务、政府规划指导等诸多研究提供坚实基础。按照这个思路,我们还将稳步推进旅游投资、营业收入、成本、利税等供给侧的数据,以及与国际机构合作,开展对入出境旅游市场和产业数据有数据挖掘工作,为政府和社会提供更加全面、更高品质的涉旅数据。
进一步扩大对外合作范围,夯实技术基础,启动客流管理方面的算法研究。除了在全国范围进行数据整合,还要进行国际数据交换采集,我们将依托正在建设的国别库和国际机构库,构架世界旅游数据图谱,为今后构建旅游经济传导机制和影响途径的世界旅游经济模型,了解全球旅游流向、流量、消费结构和关联影响等方面的数据生产打好基础。在算法研究方面,目前的统计指标和指数多在于呈现某一个专项市场的静态规模,今后将结合OTA浏览和订单数据,进行游客分流方面的算法尝试。以宏观视野指导微观旅游数据生产,以微观基础补充完善宏观旅游数据体系,不断将数据中心建设工作推向前进。
进一步加大成型技术平台向地方旅游数据中心的转移力度,加快构建纵向交流、横向沟通的旅游数据网络,提供更多、更好的旅游数据公共服务。要实现旅游统计革命的战略目标,国家旅游局数据中心的现有的平台和资源是不够的,除了本部的专业人才引进、人才培养和平台建设以外,我们将在总结与杭州、成都、郑州等地专项合项的基础上,向更多地方提供相应的公共服务,开展多样化的项目合作。特别是在人才培养方面,除了定期的会议培训,还要利用信息化平台加强交流,还要加强国家与地方旅游数据中心的人员互访和挂职。这是一个用数据说话,用正确的数据说话的时代,这要求数据采集、数据生产过程必须科学可靠。科学技术最终是由人来掌握和使用的,这就要求我们努力构建旅游统计专业人才和旅游数据知识共同体,大家才能够在同一个平台上,用相互听得懂的话语交流和促进。相信一个开放与共享的知识网络,将会加快旅游统计革命的历史进程。
来源:中国旅游研究院(国家旅游数据中心)
责任编辑:周夏莹