大数据、“互联网+”等浪潮的兴起,表明了过去十年间,信息技术在我国社会生态系统中的飞速发展与迅速普及。信息技术的进步,使得数据的生成和获取日益普遍,而互联网不仅是一种能够让信息快速传播、实时互动、高度共享的传播媒介,还深深影响了社会的组织形态和运行模式。作为网络社会生态的一部分,政府信息服务模式在不断演化。同时,得益于政府自身公信力所赋予的权威性、可信性等天然优势,政府信息服务成为公众在网络上获取信息的重要源头。为适应互联网时代的特殊规律,充分发挥政府网上信息资源的影响力,全球各国和地区已纷纷制定相关政策和措施来促进提升政府信息服务能力和水平,这其中,迅速发展的大数据技术,为政府信息服务创新提供了全新的技术渠道。
从近年来欧美等发达国家关于互联网信息服务的实践可以看出,大数据技术已普遍被应用到政府在网络空间的信息引导工作中,国外政府较为注重应用大数据技术实时感知网民需求,以做到更加精准的信息服务推送。以美国2012年8月23日大规模爆发的西尼罗河病毒事件为例,在事件发生后美国相关部门通过精准的互联网数据监测分析,及时了解网民的需求和关切,并确保美国疾控中心和食品药品监督管理局网站上发布的信息第一时间出现在谷歌搜索结果第一页的醒目位置上,为澄清事件真相,引导社会舆论发挥了重要作用。从本质上说,大数据是随着人类数据量的剧增而产生的一种新技术,其不仅强调数据量之大、类型之多,更强调通过对海量数据的深度挖掘和多维剖析,发现数据背后所蕴含的有价值信息。当下,如何利用大数据技术和理念,确保网民能够获取到更多、更好的政府信息服务,已成为信息化条件下建设服务型政府,实现国家治理体系和治理能力现代化的重要内容。
然而,作为一种公共物品,政府信息服务存在供给缺乏弹性,而需求无法有效得到表达的特点,导致了政府信息服务供需脱节问题,妨碍了政府信息服务的健康发展。大数据技术为政府信息服务的供需平衡提供了技术手段,本研究在调查梳理大数据环境下政府信息服务创新研究现状的基础上,主要关注如何发挥大数据技术优势,促进重构政府在线服务的供求均衡和政府信息服务创新的实现,以逐步提升政府在线服务资源配置效率和服务水平。
2012年,美国政府发布了《大数据研究和发展计划》,在全球掀起大数据产业发展浪潮。在政府信息服务领域,大数据应用也成为各国政府关注的焦点问题。如美国政府成立了美国联邦政府网站管理者委员会网站量化分析分会,专门从事政府在线服务数据分析与优化。澳大利亚政府2013年发布了《公共服务大数据战略》。我国则于2012年组建bet36在线开户网络政府研究中心,建设“中国政府网站智能分析大数据中心”,面向各级各类政府网站开展用户行为分析工作。在各国政府的高度重视下,学术界对大数据环境下的政府信息服务创新问题开展了很多研究,具体包括以下三方面:
大部分研究者认为,大数据对于政府信息服务创新具有积极促进作用。首先表现在,大数据所强调的对海量数据的挖掘分析,有助于政府对信息服务用户需求的把握。如Rajagopalan, M.R.等认为,大数据分析能够帮助政府更加精细化地理解公民需求、行为和态度,指导调整公共政策与公共服务改进,重构政府行政过程,促进以用户为中心的下一代在线公共服务的发展1。二是,数据是大数据应用推进的前提,数据开放、共享与政府透明度息息相关,大数据技术在政府信息服务创新的应用,可以让政府公共信息更加透明化,促进其进一步演化为透明政府,促进电子政府最终演化阶段的到来2。三是促进政府信息服务的决策科学化。Clarke, A.等则认为,大数据极大提升了政府在线服务决策制定的科学性,从人们使用社交媒体、实时交易等行为中采集的大数据信息,能够反映人们在特定环境中的真实行为3,其代表了整个人群而不是样本人群的信息,这就使得相关领域的公共管理研究更加接近于物理或生命科学的研究范式。同时,在大数据时代,公众可以更好地参与到政府工作之中,与政府分享信息,形成政府和公众共同参与的政务决策机制4。社会公众可以通过社交媒体、公开出版物、博客等渠道分享他们的意见。大数据分析可以处理这些非结构化数据,并将更好的服务和方案传递给所需的客户群体。因此,在大数据背景下,任何政府都可以藉由政务大数据的采集分析和利用,不断推动优化政府自身运作流程和服务效能。
在看到大数据应用积极作用的同时,很多研究者也对大数据应用可能对政府信息服务带来的负面作用做了分析。首先,是大数据可能造成政府信息服务公平性的损害。如以基于大数据技术识别犯罪“热点”区域的信息服务为例,这类服务虽然大大提高了人们预测预防犯罪的能力,但对生活在这些区域的人而言,则因此会面临很多不便,甚至导致执法中不公平现象5。Henman, P.则认为,基于大数据的个性化信息服务,将政府信息服务用户从原来的单一社会群体被划分为若干个具有不同风险水平的子群体,从而破坏了政府信息服务的均等化原则,有可能导致对社会凝聚力造成潜在损害6。其次,是对大数据分析中意识形态倾向性问题的讨论。大数据本身没有倾向性,但在政策制定过程中,数据采集、解读和发布方式总是会受到操作者意识形态的倾向性,进而影响政府信息服务运转7。此外,政府信息服务中所应用的大数据分析还有可能导致对公民隐私权的侵害等问题。
数据是大数据应用的前提和基础,目前,政府信息服务研究者较为关注基于不同数据源的政府信息服务创新模式。从大数据的类型看,政府信息服务创新主要基于三种大数据展开:一是基于政府内部业务大数据的信息服务创新研究,这类研究最为常见。如Kim, G-H.等对欧美发达国家的24项政府信息服务大数据应用进行了案例介绍,并归纳总结了存在的问题8。Rajagopalan, M.R.等归纳了基于跨部门大数据集成创新政府信息服务的9种基本模式9。二是基于政府在线服务平台自身用户行为大数据的服务创新研究。Stacey Shindelar10指出,以用户为中心的服务方式需要基于对用户需求的充分挖掘,建立用户和政府之间服务效果反馈的有效通道,以用户熟悉的方式将服务内容推送给用户。近年来,很多发达国家在线服务平台均采用了类似的用户需求和行为大数据挖掘技术。于施洋等(2013)对联合国和12个主要发达国家调研发现,这些国家政府网站均部署有网站用户行为数据分析系统,通过对用户访问规律的动态监测,指导改进政府网上信息服务11。部分研究者基于类似数据开展了实证研究,如Joseph, R.C.等对美国联邦政府15个执行部门在线信息服务数据进行了分析等12。于施洋和王建冬(2014)对我国82家政府网站用户访问数据进行了分析13。三是基于外部互联网用户舆情大数据分析创新政府信息服务模式的研究。Harrison, T.M认为,通过分析互联网公众在社交媒体等渠道的观点诉求信息,可以判断网民对政府服务的需求和满意度,识别最重要的用户群体,从而有效改进政府信息服务14。实证分析方面,较有代表性的如Clarke, A.等对英国政府15,Liao, Z.P.对我国台湾地区网站16,以及于施洋等对我国中央政府门户网站应用互联网全网数据分析改进服务做法的介绍17。
除了对具体应用模式的介绍外,部分研究者还关注了在政府信息服务创新中应用大数据的实践模式问题。首先,是政府信息服务大数据应用技术框架的构建。如Joseph, R.C等提出政府信息服务大数据应用的四层模型,即数据透明层、数据细分层、过程重构层和自动化分析层18。Shindelar, S提出大规模政务大数据建设的四层模型,即数据采集层、平台应用层、数据展现层和安全与隐私保护层19。Rajagopalan, M.R.等提出了一个政务大数据应用框架,分为四个主要组成部分,即资源管理器、数据组织与管理、数据分析与知识发现,以及决策支持和可视化报告20。其次,则是对政府信息服务大数据应用障碍的分析,如Margetts对人才瓶颈问题的分析21,Kim, G-H.等对政府大数据应用决策机制复杂性的分析22,Milakovich, M.对政府部门数据孤岛问题的分析23,Harrison, T.M和Hrdinova, J.对政务大数据技术落后性的分析等24。
大数据时代的到来,为政府信息服务创新提供了新的机遇,但从国内外研究现状来看,我国在大数据环境下的政府信息服务创新探索实践起步较晚,对于这一问题的关注还较多地停留在理论探讨层面,且由于应用数据源规模偏小,研究应用往往不够深入,分析结论也多流于宽泛和表面化。大数据是全球数据自发式、爆发式增长以及数据处理高效率要求的综合体现25,如何有效识别和积极应对因数据资源爆发式增长带来的各项挑战,是大数据环境下政府信息服务创新实现的当务之急。基于国内外研究现状,本研究认为大数据环境下政府信息服务创新若从数据资源角度看,应着手解决以下关键问题。
数据是大数据技术应用的前提和基础,政府部门所拥有的信息资源状况决定了政府信息服务水平的高低,其在数量上的丰富程度直接影响到政府信息服务的广度,而在质量上的优化程度则直接影响到政府信息服务的深度。对于政府信息服务的数据获取,主要包括政府外部的数据开放、政府内部的数据共享等方式。近年来,西方发达国家陆续颁布国家大数据战略,并将数据开放作为国家发展战略。据统计,截至2014年4月,已有63个国家制定了开放政府数据计划。如美国奥巴马总统签署了《政府信息公开和机器可读行政命令》;欧盟颁布了对《公共部门信息再利用》指令的修订指令;八国集团签署了《开放数据宪章》等。而从目前全球参与开放数据运动的国家来看,我国政府数据开放的步伐还比较落后,须尽快制定法律法规界定政府数据开放工作边界,明确数据开放政府部门、研究机构、应用厂商、个人用户、平台方等各方的权利和责任,制定数据开放目录,说明数据开放领域和清单,加快推进政府数据开放。同时,在保证数据安全的前提下,可运用多种方式开放数据,以将原本由政府全部承担的公共服务职能通过市场化方式分散到全社会各个层面。
此外,大数据环境下的政府信息服务创新还要面对很多政府部门特有的挑战和问题,首先就是政府内部的数据收集26。受政府职能部门自身权力意志的影响,多数政府机构将所掌握的信息资源视为“个人资产”,阻碍信息共享实现,使得政府信息资源开发利用程度极低,能供公众访问和使用的数据只是“冰山一角”。此外,“信息孤岛”现象普遍存在,距离体系化、标准化、可进行综合比对和融合分析的政府服务供给“大数据”尚有较大距离。
大数据的概念,不仅仅是指数据总量很大,其更重要的是要从中所获取的价值很大27,这离不开大数据分析技术的运用。T.H. Davenport将大数据分析从内容层面归为三类,分别是描述性分析、预测性分析和定题性分析,其中,描述性分析指形成一些标准报告、应急性报告和报警性报告等;预测性分析,主要围绕预测和统计建模展开;定题性分析主要关注优化和随机性测试研究28。但与商业领域的大数据分析应用相比,政府领域的大数据分析还较多的停留在描述性分析层面,对于大数据分析技术的深层次应用还远远不够。Rajagopalan, M.R等29指出,目前大部分电子政务服务都只接受结构化数据,政府收集数的目的仅仅是为了基本的统计分析,并不能满足对政府服务质量优化的支撑需求。可见,推动大数据分析技术在政府信息服务中的深入应用,是实现大数据环境下政府信息服务创新的当务之急。
我国学者江信昱等从面向数据的视角,将大数据分析方法分为统计、挖掘、发现、预测及集成五个层次,并初步归纳出17种相关方法30。这些大数据分析技术的应用,如遗传算法、回归分析、情感分析等,有助于重构政府行政过程31,帮助政府工作人员更好地理解公众对政府的服务需求,形成更好的定制化服务。例如,美国国税局曾经重新设计其纳税申报流程,并应用大数据技术手段来提高对纳税欺诈和纳税不遵从行为的自动监测32。随着联邦政府各个机构对于大数据分析的应用,政府就可以在处理自身事务时花费越来越少的精力。政府信息服务应当以满足公众需求为导向,大数据分析技术能够实现对海量数据的细分和分析,并用来创建基于人口统计学或地域特征等指标的用户群体,从而帮助政府部门工作人员从不同视角解读数据,形成更好的定制化服务,更好满足用户需求。可见,大数据环境下政府信息服务创新实现的关键还在于大数据分析技术的优化与完善,加强大数据分析技术的基础研究,构建完善的大数据分析技术框架是实现大数据分析在政府信息服务创新中应用的前提条件。
数据隐私、数据安全与大数据发展并存,也是大数据发展面临的重要挑战。Joseph, R.C等33认为数据隐私保护是未来政府大数据应用的主要障碍之一。Amanda Clarke等34也提出数据隐私是政府信息服务中大数据应用的重要问题。2006年,AOL曾经公布了一批三个月左右的650,000名用户搜索日志数据。尽管是去除了用户名和IP地址的匿名数据,但仅仅过了几天,纽约时报就从这批被处理过的数据中人工识别除了一批精确的个人用户35。这一事件发生之后,对搜索引擎、论坛等公司再也不想研究者公布匿名的日志数据。很多评价者都在质疑大数据对公众隐私的威胁,认为聚合和分发数据容易造成对公众隐私的破坏。大数据并不是任意的数据,它基于人们的社会行为产生,与人们的日常生活息息相关,对这些数据的分享、使用和发布有可能造成对人们隐私的破坏。大数据在采集、存储、分析、传输、运用等过程中,面临着严峻的安全和隐私风险。这是因为,一些看似无害、与隐私无关的数据被大量收集、整合后,也有可能会暴露个人隐私。对于此,西方国家普遍通过法规政策强化大数据应用中对数据安全和隐私的保护,除沿用多年前的法规文件外,个别国家已经开始针对大数据特点制定专门的隐私和数据安全政策36。在大数据应用中,如何在中国现有的政策环境下,有效规避大数据应用可能带来的一系列隐私、安全、伦理等问题,是政府信息服务创新得以成功的关键。
大数据环境下政府信息服务创新并不是单纯的理论问题,需要从体制机制上,转变现有政府信息服务模式;并要不断发展技术框架,提供以用户需求为中心的政府信息服务;同时,还应在政策、法规等方面,注重大数据发展中的数据隐私与安全问题,构建良好的政府信息服务大数据环境。
随着大数据的发展,数据开始被视为有价值的资源,谁掌握了数据,谁就拥有了主动权。而且,数据的价值可以被挖掘,并不会因为使用而减少。对于大数据环境下,我国政府信息服务创新而言,首先应先从数据着手。在这个过程中,政府部门应不断改进信息服务流程和机制,探索适宜大数据发展潮流的政府信息服务模式。但由于长期以来政府内部间的条块分割,每一个政府部门都倾向于建设自己的数据仓库,而不愿与其他机构分享息,且每一个系统中的数据都独立于其他系统,这样一个“通天塔”式架构,进一步增加了跨部门数据整合、共享的难度37。这归根结底还是体制机制问题。如何破除部门壁垒,促进数据共享集成,改变以部门为导向的政府信息服务运行机制,是大数据环境下政府信息服务创新顺利进行的必要条件。为此,国家层面应明确一个牵头部门,组织各部门积极参与大数据环境下政府信息服务创新工作,做好大数据环境下政府信息服务创新的顶层设计,推进相关基础数据库及数据中心建设,完善政府信息资源共享的标准规范,加强相关保障机制建设。
大数据环境下,对用户行为数据的分析挖掘有助于捕捉用户的行为特征,大数据分析技术的应用是为了把握用户需求,根据不同用户的特点和需要,提供有针对性的、个性化的信息服务。Stacey Shindelar38指出,以用户为中心的服务方式是基于对用户需求和诉求的充分挖掘。只有将大数据应用建立在用户需求挖掘的牢固基础之上,并以用户所熟悉的方式提供给用户,政府信息服务才会真正有效。当前我国政府在大数据采集与存储维护、数据采集接口管理和大数据分析技术等方面普遍遇到瓶颈问题,构建适应大数据时代的政府信息服务技术框架十分必要。大数据环境下的政府信息服务创新的技术框架主要分为三层:一是基于政府业务数据的政府信息服务集成创新技术,包括在跨部门数据资源创新服务的整合集成基础上归纳共性数据源(如人口库、地理信息库等),以及基于所获取的核心业务数据集进行数据集成和融合分析,探索将不同业务领域数据按照同一粒度进行横向集成并提供服务的方法与模型。二是基于用户行为数据的政府信息服务界面创新方法。通过构建政府在线服务用户需求时空分布模型、需求满足度模型、页面点击行为模型、页面跳转行为模型、栏目关联度模型等web挖掘分析模型,构建基于用户需求改进服务内容、基于用户行为改进服务界面的方法体系。三是基于全网舆情数据的政府信息服务传递创新技术。采取中文信息处理、社会网络分析、新事件探测、情感分析等舆情分析方法,识别政府信息传播中的关键节点和传播时点,精准投放政府在线服务信息,提升政府信息的互联网影响力。
基于大数据的政府信息服务创新,首先应营造良好的大数据环境,制定符合目的的制度安排和支持政策。从西方大数据产业的发展来看,自2012年以来,美、英、日、澳等国已密集出台多项大数据发展扶持政策。从各国举措来看,政策扶持的着力点主要是增加大数据前沿及共性基础技术或关键核心技术的研发投入;部署大数据人才教育与培养专项;通过包括资金支持在内的多种途径培育大数据产业等三方面。与国外相比,我国大数据产业刚刚兴起,公共部门应用大数据技术提供公共服务的意识尚不健全,国家层面大数据发展战略刚刚出台。为稳步推进我国大数据技术应用,尤其是在政府信息服务创新方面,应在政策构建上,重点规划相关领域的大数据研究计划,布局前沿及共性基础技术的研究专项,强化大数据人才培养,完善大数据基础设施,在财税政策、采购政策等方面做好对大数据产业的扶持和保障等,以推动实现大数据环境下政府信息服务创新。
此外,在推动大数据应用逐步发展时,应加强对数据隐私和数据安全的重视。为此,首先应进一步完善现有法规政策,通过法规政策强化大数据应用过程中对个人隐私的保护和数据安全的保障,必要时可针对大数据特点和应用需求制定专项的数据隐私与安全政策。其次,应加强对数据隐私和安全的保障技术研究和应用,如通过数据清洗、数据脱敏等,去除数据中的敏感信息;应用数据发布匿名保护技术等,保护隐私数据;采用自主可控的国产设备,防控重要数据流失被窃等。
综上所述,大数据在政府领域的应用,已成为政府信息服务创新研究的主要热点。虽然大数据环境下政府信息服务创新还面临较多的问题待解决,但大数据技术为政府信息服务创新带来了更多的发展机遇,其对于用户需求的挖掘和掌握,将直接有助于政府信息服务中个性化信息服务的实现,为以用户为中心的政府信息服务提供了可靠的实现路径。本文在此方面的研究,希望可以为以后的研究者提供一些帮助。