《1.引言》

1.引言

随着中国工业化和城镇化的快速推进,城市人口、工业以及交通运输过度集中,导致了包括人口膨胀、交通拥堵、环境恶化、住房紧张、就业困难和安全隐患等问题在内的多种不同形式的“城市病”,以及由这些“城市病”引发的社会、经济、健康和居住等问题。这些问题严重影响了中国城市生态系统的健康和可持续发展[1]。事实上,“城市病”出现的原因在于城市基础设施所构成的物理系统和城市居民所构成的社会环境变得日趋复杂,并且人们没有充分认识到其复杂性,缺少对城市生态系统的高效管理。从根本上讲,城市已经从过去的二元空间升级为现在的三元空间。这里所说的第一元空间指“物理空间”,即城市所处的物理环境和城市所含的物质系统;第二元空间指“人类社会空间”,即城市人的行为与社会交往;第三元空间指“赛博空间”(Cyber Space),即计算机、互联网及其“数据信息”[2]。为此,急需新理念和新方法对城市生活的结构、经济发展以及其中出现的问题进行深入和系统地分析,从而确立新技术革命条件下城市发展的新方向。

“智能城市”和“大数据”的出现为解决“城市病”提供了新的可能。“智能城市”为传统的城市生态系统加上了一个神经层,而城市大数据从不同维度描述了城市的物理环境(如建筑、汽车和道路等)和居民社会生活的方方面面,即以虚拟形式反映真实的第一元空间和第二元空间,由此构成了城市的第三元空间——城市大数据。中国工程院的李国杰院士认为,大数据是典型的“蜜蜂模型”,即:蜜蜂的贡献不是它们生产的蜂蜜,而是其传粉过程带来的农业产出的增加[3]。城市大数据如同城市中的自然资源和人力资源,已成为“智能城市”发展的重要战略资源与战略方向。城市在信息化和智能化的过程中形成了大量的信息库和数据中心,将这些数据相互连接,便形成了城市大数据。通过物联网、云计算和人工智能技术对城市大数据进行深度的汇聚、挖掘和分析,有助于人们正确地认识和把握城市系统各层次的发展规律,辅助政府和社会的城市决策与规划,实现城市智能化管理的目标。同时,城市大数据也促使城市各行业的运作模式发生深刻的变革,加速传统产业的转型升级和新兴产业的培育发展。总之,城市大数据正在加速城市智能化发展,具体表现为:以互联网、物联网、电信网、广电网和无线宽带网等网络组合为基础,以信息技术高度集成和大数据综合应用为主要特征,以智能技术、智能产业、智能服务、智能管理和智能生活等为重要内容,构建一种致力于自我修正并及时解决城市经济、社会和生态等关键问题的城市发展新形态[2]

《2.城市大数据的概念》

2.城市大数据的概念

《2.1.城市大数据的概念与特点》

2.1.城市大数据的概念与特点

城市大数据是指城市的政府、公共机构、企业和个人利用新一代信息技术手段获取和汇聚的各类城市设施设备、个人和集体等主客体所产生的动态和静态数据。数据可被共享、融合、分析和挖掘,以使人们深入了解城市的运行状态,在城市管理方面做出更加明智的决策,优化城市资源配置,降低城市系统运行成本,推动“智能城市”安全、高效、绿色、和谐、智能地发展。除了大数据的一般特征(如海量性、高速性、多样性、真实性和重要性)之外,城市大数据还有其特殊性,包括:

(1)层次性:例如,电子病历按照医院或区域分类,而医学图象按照设备或医院分类。又如,健康数据可以分为个人、医院病人、社区或卫生防疫部门的健康数据。城市大数据的层次性深刻反映了城市物理系统和社会系统的组织层次性。

(2)完整性:城市经过长期的运行与发展,各系统的数据覆盖越来越广泛。例如,近年来中国城市环保数据的覆盖度正在迅速提高。由于这种数据完整性的迅速改善,城市大数据日益精确,具备了揭示城市的整体发展规律的能力。

(3)关联性:城市各类数据之间具有很强的关联性。例如,城市的物流信息既包含在物流企业的数据中,也包含在制造业、商业和运输业,甚至是金融业的数据中。这些关联性不仅可以用于相互印证,也可用于城市运行中的协同推理与规则挖掘。

由于城市大数据的普遍性与特殊性,在其应用中需要新的处理技术,即基于目标驱动方法的特定数据提取[4],这主要集中在从数据获取到数据处理,再到模型建立的整个数据流程的自动化[5,6]。首先,获取与存储原始数据,包括按照目标需求对从所需数据源中获取的数据进行模式抽取和集成,对采集的数据进行清洗和预处理(如数据填补、数据优化、数据合并、数据标准化、数据一致性检查以及多种数据属性的初步组织等),建立待处理数据集;其次,处理和分析数据集(包括线性分析、非线性分析、因子分析、序列分析、线性回归、变量曲线分析和双变量统计),通过利用支持向量机、朴素贝叶斯、随机森林和逻辑回归进行数据分类和数据与类别间的关系分析;然后,通过人工神经网络、遗传算法和跨媒体算法揭示分类数据间的内在联系,发现深层次的模式、规则及知识;最后,以交互式和可视化的方式解释变量间的关系,以更深入地理解结果。

《2.2.城市大数据的分类》

2.2.城市大数据的分类

就数据本身而言,城市大数据描述了各种城市元素的实时运行状态,包括建筑、街道、管网、环境、企业、金融、商业、产品、市场、物流、医疗、文化、教育、交通、公安和人口。文献[7]中提出,可将城市大数据分为5类:基于传感器系统的数据、用户生产数据、政府管理数据、客户和交易记录数据及艺术和人文数据。表1列出了此5类数据的类型、实例及相应的用户群体。

《表1》

表1  城市大数据的类型及用户群体

其实,城市大数据的分类方法不止一种。从本质而言,数据分类以树状结构最为有效,而城市数据信息为网状结构,所以城市大数据的分类需根据数据处理方法和应用目标而定。对于中国城市的大数据而言,经常使用以下三种分类方法:

(1)按城市功能的供给侧划分:此分类方法的基础是城市管理系统,也就是现有城市层次组织数据的聚集系统。这种分类方法具有组织促进力。

(2)按城市服务的需求侧划分:此分类方法按不同需求者划分(如居民、企业、事业系统和政府机关),并且可以进一步分类,因此会牵引出各种城市应用服务系统。这种分类方法具有应用促进力。

(3)按城市数据的发生原因划分:例如,城市大数据可被划分为基于城市物理系统的传感器数据,城市人口及组织的经济活动类数据,城市人口及组织的社会活动类数据,城市人口及组织的科教活动类数据,城市人口的生活类数据。

《2.3.城市大数据在城市发展中的应用》

2.3.城市大数据在城市发展中的应用

城市大数据的出现为深入研究城市的运行和发展提供了新的思路[8-11],已成为重塑城市竞争优势的新机遇[12]。在全球信息化快速发展的大背景下,大数据已经成为了每个城市重要的基础性战略资源。充分利用城市大数据的规模、质量和应用优势,挖掘和释放数据资源的潜在价值,提升大数据的社会价值和经济效益,能够有效提升城市竞争力。同时,大数据也已成为了推动城市经济转型发展的新动力[13]。具体地说,大数据在以下领域起到了重要的作用:①推动生产要素网络化共享、集约化整合以及协同化开发利用;②促进生产原料、技术、人才和资金的流动模式和商业模式的创新;③提高企业的核心价值和优势。大数据的应用不断催生新的业务模式和新的经济增长点,并且大数据为提升政府的治理能力提供了新的途径[14]。此外,大数据的应用还能够揭示传统技术方式难以展现的潜在关系,挖掘看似无关的知识间的相关性并汇聚成新知识,通过定性化判断和定量化分析实现对城市发展的诊断和评估,提升政府利用数据做出决策的能力,为有效处理复杂的社会问题提供新的手段。

本质上讲,利用城市大数据对城市模式和城市化进程的探索就是对城市大数据的分析、可视化和理解,以及对结构化和非结构化数据的解释,从而实现城市资源的动态管理、知识发现、城市模式和进程的深度分析、市民的有效参与以及合理的城市规划和城市政策的科学分析。城市大数据的目标、方法及应用之间的关系如图1所示。

《图1》

图1.城市大数据的目标、方法及应用的关系图。

《3.城市大数据助推城市智能化》

3.城市大数据助推城市智能化

“智慧城市”的概念由IBM公司于2008年提出,其内容主要侧重于度量、联通和智能[15],主要目的是将特定的信息技术系统应用到城市的管理过程中。这一概念比较适合于欧洲和北美的发达国家,因为这些国家已经完成了城市化、工业化和农业现代化。发达国家“智慧城市”建设的主要任务局限于政府管理与智能服务[16,17]。相比发达国家城市的市长,中国城市的市长需要执行更多的行政职能以及管理更多的事情。此外,中国正处于工业化、信息化和城镇化的高潮,遇到的困惑与问题在质和量上都有其独特性。所以,中国城市智能化发展路径必然与欧美等发达国家不同,如图2所示。显然,利用发达国家“智慧城市”的发展路线图来建设中国的“智能城市”,难以解决中国城市面临的诸多发展问题。因此,在中国使用“智能城市”替代发达国家的“智慧城市”是合适的。

《图2》

图2.中国与欧美发达国家在信息化、城市化和工业化发展方面的比较示意图。

城市智能化发展是“智能城市”建设的过程,目的是发展城市三元空间(包括城市物理设施、人类社会和城市数据),方法为基于从市民、企业和政府整合的情报的科学方法,关键是巧妙合理地调度城市综合资源,优化城市经济发展、城市建设和城市管理,持续改善城市发展与市民的生活水平,有效地满足市民当前与未来的需求[2]。城市智能化发展是一个从分到合、由浅入深的过程。以城市现有的数据为基础建立智能应用系统,是建设“智能城市”的合适起点。在此基础上,增强城市物理基础设施的自动数据化,逐步实现数据融合共享,开展城市大数据应用创新,实现宏观决策和微观服务的深入发展,带动产业升级换代。因此,城市大数据的应用能够推进城市智能化由局部水平到系统以及全局水平的发展,使城市智能化与“经济—社会—生态”发展相统一。城市智能化发展模型如图3所示,城市大数据包括基础支撑系统、应用系统、产业系统、指数系统和运维保障系统五部分。

《图3》

图3.城市智能化和大数据发展模型。

发展过程如下:①充分采集城市运行中产生的海量结构化和非结构化数据,并将其汇聚到统一的城市数据平台,形成城市基础数据库和综合数据库;②通过海量数据的关联、融合、清洗、处理、挖掘、分析和可视化,获取可反映客观规律且有价值的数据信息,满足城市政务、商业和城市管理的需求,提高决策能力、知识发现能力和流程优化能力;③促进其他产业的转型升级,带动数据采集、数据分析和数据交易等大数据产业的发展,加快城市的信息化和智能化发展;④提出适用于衡量城市大数据建设成效和发展水平的指数,建设大数据运维保障机制,确保城市大数据服务架构的稳定和可靠运行。

《3.1.城市大数据是城市智能化的基础和核心》

3.1.城市大数据是城市智能化的基础和核心

城市大数据来源于城市中众多物理设施运转和人群活动所产生的数据的联通和融合。采用适当的数据处理和分析技术,这些数据可被用于挖掘物理设施运转状态下的各种复杂的关系,产业与经济变化的趋势,以及居民健康、教育、科技和文化等方面的状态、关系和规律。因此,城市大数据不仅是系统地认识整个城市的信息基础,也是城市智能化的基础和核心。城市大数据基础支撑模型如图4所示。感知层通过物联网采集城市数据;网络层着重于网络统建和网络融合;数据层汇聚物联网和信息系统产生的大量数据,形成城市公共数据库;平台层主要包括各种云计算设施、公共信息平台和大数据分析处理平台。

《图4》

图4.城市大数据基础支撑模型。

推进由物理设施、人群社会和城市信息构成的三元世界的科学互动和可持续发展的核心是采用大数据思维和技术,统筹推进城市物理世界的信息化建设:打破信息壁垒,实现数据流、知识流和人类智慧的自由流动,完成对城市物理设施的科学调配,促进人流、物流、资金流和技术流的合理高效流动,有效解决城市发展与环境、资源和空间之间的矛盾,逐步建成满足市民、企业和政府需要的新型未来城市。

《3.2.城市大数据是城市智能化持续发展的不竭动力和智能源泉》

3.2.城市大数据是城市智能化持续发展的不竭动力和智能源泉

大数据的应用正在加速信息技术与各行业的交叉融合,孕育形成新型业态,进一步拓展信息技术产业的发展空间。同时,在城市智能化发展过程中,需要重新激活现有数据资源,充分利用大数据增量,才能持续提升城市智能化水平。城市大数据在揭示城市典型问题的本质关系、分析复杂系统、开展经验性城市研究以及感知城市合作方面有着重要的作用。城市大数据的应用是破解各类“城市病”的重要抓手。在城市规划方面,通过对城市的自然信息(包括地理、气象、环境)和社会信息(包括经济、社会、文化、人口)的挖掘,城市大数据为城市规划提供了强大的决策支持,强化了城市管理服务的科学性和前瞻性,这方面的应用突出体现在基础建设、交通管理、公共设施和社会安全领域[18,19]。城市智能化使数据共享成为可能,政府各个部门的既有数据库可被高效地互联互通,极大地提高了政府各部门间的协同办公能力和办事效率,大幅降低了政府的管理成本[20]。大数据奠定了未来人们享受“智慧”生活的基础,使人们可以建立个性化档案,智能化管理日程事务、个人健康、安全起居、购物以及旅游。同时,大数据的应用可增强公共服务同个体生活之间的联系,在医疗卫生、教育培训、交通和安防等领域为个体提供信息查询、内容分发和移动支付等应用体验。如此,大数据将人们“简单平面”的生活转向“多维”化[21,22],让城市智能化真正服务于民生。城市大数据被广泛地应用于一系列城市问题的研究和破解,并正在迅速成为促进中国城市智能化发展的重要桥梁和技术。

《3.3.中国城市大数据发展面临的问题和挑战》

3.3.中国城市大数据发展面临的问题和挑战

当前,中国多数城市已经经过了前期“数字城市”和“智慧城市”的建设,在信息通信网络基础设施、政务信息资源整合共享平台和智能应用体系建设方面取得了一定成效,并发展了信息经济,积累了大量城市数据资源,为城市智能化的进一步发展奠定了良好的基础。然而,城市大数据的发展也面临着一些问题与挑战,主要有:①现有的操作机制给数据资源的整合和共享带来了一定的困难;②与信息安全和共享有关的标准法规体系亟待建立;③技术创新滞后于大数据的发展;④不清晰的商业模式影响大数据的可持续发展;⑤人才资源的供应不足制约大数据的发展。

《4.城市大数据发展重点》

4.城市大数据发展重点

中国积极鼓励大数据的发展和“智能城市”的建设,地方政府高度重视信息经济的发展。在这种背景下,需要正确处理城市大数据发展中统与分的关系,坚持统筹规划和分工建设、技术驱动和需求拉动相结合。为此,加强城市大数据顶层设计和确定城市大数据建设重点成为当前推动我国城市智能化发展的关键。基于中国城市智能化发展模型,本文提出城市大数据发展的重点基于四个方面,即基础支撑、城市治理、城市服务和经济发展,如图5所示。

《图5》

图5.城市大数据重点建设内容。

《4.1.统一大数据基础支撑体系》

4.1.统一大数据基础支撑体系

城市应建立一个公共设施物联网平台。该平台以“一体化服务平台+积木式应用模块”的技术架构和“专业化运营+开放式服务”的管理体系为核心,实现对城市基础设施(如道路设施、水电气设施和地下管廊)波动变化的动态感知,对城市运行状况和特征的全面、及时掌握,对城市要素发展趋势的准确预测,以及为城市发展提供有力的决策支持。为此,城市应该调研和梳理全市政务数据资源(包括类别、规模、增长速度、能否共享与开放、数据源头和所属权)现状,以确定能够优先分享或优先开放的数据目录和数据字段,明确涉密或涉及公共安全和个人隐私的数据。此外,城市还应建立一个政务数据架构体系,以对城市政府数据的清洗、处理、整合、挖掘和共享为主线,建立城市数据共享和交换服务中心。该服务中心以分层数据服务为主体、工具平台为支撑、机制建设为保障,实现全市范围的政务数据资源和有关数据资源的整合、共享与服务。最后,城市应建立一个政务数据统一开放平台,以完善政府数据资源的管理规范,建立政务信息资源开放目录体系和服务体系,逐步向社会开放如信用、交通、医疗、卫生、就业、社保、地理、文化、教育、科技、资源、农业、环境、安监、金融、质量、统计、气象及企业登记监管等民生保障服务相关领域的政府数据。

《4.2.推进大数据在城市治理领域中的应用》

4.2.推进大数据在城市治理领域中的应用

城市治理包括社会安全管理、城市规划与建设、市场监管及环境保护等领域。因此,要推动大数据在城市治理中的应用。基层社会治理大数据应用平台涵盖多个行业的数据资源,如城市人防、能源、电力、环保、卫生、交通、城管、水利、通信、安监、气象和地震等。加强数据资源的挖掘、分析和应用可快速识别、及时预警以及顺利解决社会管理问题,提升基层社会治理能力。为达到“多规融合”和跨部门协作,城市需建立完善的国土资源“一张图”数据库以及时空大数据和不动产登记信息管理平台,以开展国土资源大数据分析,建立统一的国土资源大数据服务体系,建成支撑跨部门协作管理的城市规划大数据应用平台,为城市规划的编制、审批和实施等全流程提供有力支撑。此外,城市还应加强对市场主体的信用体征监管,建立公共和个人信用数据库,以获得有关覆盖全部信用主体(以企业为核心,以个人、政府为补充)和所有信用信息类别的信用大数据,增强社会成员的诚信意识,营造优良的信用环境。之后,城市需完善城市环境质量监测网络布局,建立综合监测水、土壤、垃圾及大气污染的大数据实时汇聚与分析平台,以全面、实时、准确地掌握城市环境质量和污染源信息,为环境保护提供决策支撑。最后,城市需构建大数据能源管理体系,以提高能源的使用效率,完善资源的价格机制和创新能源的消费方式。

《4.3.加快大数据在城市服务领域中的应用》

4.3.加快大数据在城市服务领域中的应用

 城市服务包括交通、医疗、教育、社会福利和文化旅游等领域。城市应建立交通大数据应用平台,以使城市居民及时获得交通信息(包括实时公交、实时路况、出租、公共交通设施和道路管养等信息)。该平台还可以提供各种增值服务(如出行信息服务和交通指南),辅助优化交通规划,提高公众出行效率以及改善用户交通体验。城市还应建立汇集和整合人口信息、电子健康档案和电子病历的统一健康大数据应用平台,并开发覆盖公共卫生、医疗服务、医疗保障、药品供应和综合管理等业务的医疗健康管理和服务大数据应用体系。此外,城市也应鼓励有关企业和事业单位开展医疗健康大数据应用创新示范,丰富和完善医疗健康服务。考虑到社会福利,城市应建立城乡一体化的社会救助、社会福利和社会保障大数据平台,加强相关部门之间的数据对接和信息共享,支撑城市大数据在劳动用工和社保基金监管、医疗保险对医疗服务监控、劳动保障监察、内控稽核、人力资源和社会保障相关政策制定及其执行效果跟踪评价等方面的应用,为社会公众提供更为个性化和更具针对性的服务。最后,城市应整合数字图书馆、档案馆、博物馆、美术馆、群众文化馆和科技体验馆中的数字文化资源,建立文化传播大数据综合服务平台。为促进旅游业发展,城市应推进旅游信息资源共享,整合旅游相关的数据资源(如公安、交通、环保、商务、航空、邮政、电信和气象),与主要网络搜索引擎以及在线旅游服务商合作,建立旅游大数据资源库。

《4.4.促进大数据在经济与产业领域中的应用》

4.4.促进大数据在经济与产业领域中的应用

城市应鼓励大数据在产业、跨境电子商务、物流、技术与知识服务等领域中的应用。为推进不同产业的发展,应采取以下措施:①建立重点行业云服务平台,促进大数据资源在研发设计、数据管理和系统营销等领域的应用;②引进“云+网+端”的物联网云工程和云服务企业,发展可提供一体化的云工程产业,如全流程整体设计、装备制造、软件开发、系统集成、工程安装和网络运维服务;③完善各行业统计标准,提升相关产业大数据资源的采集和利用效率,充分发掘数据资源背后的产业价值和潜力,为研发体系创新、生产管理方式变革以及产业价值链体系重构提供有力支撑。在电子商务方面,城市应大力发展“生产商直接面对消费者(M2C)”和“生产商直接面对经销商(M2B)”的服务,加强跨境电子商务平台建设,构建支持数据采集、数据清洗、数据融合、数据分析及数据展示的跨境电子商务服务体系,为跨境电子商务平台及其基本的物流仓储、信誉评级以及综合信息服务提供有力支撑;城市还应发展面向“网上丝绸之路”沿线国家的电商营销和比价系统,为全球客户提供便捷、快速的购物体验。此外,城市应建立物流大数据平台,按照统一标准整合物流数据(如商品信息、交通路网、货物运输和货物周转),通过对物流车辆、线路以及货物等数据的全面分析,为物流企业提供最优化的运输线路,提升物流效率。物流大数据的应用有助于及时了解仓储库存信息以及各商品门类的动态需求,确保库存和仓储配套的优化以及物流和仓储资源的动态调整。最后,城市应通过鼓励公众和企业发掘利用开放数据资源,探索新技术,研究数据挖掘、分析和应用模式,营造大众创业、万众创新的良好氛围。公众还应推动大数据发展与科研创新、技术发展以及政府和市场需求的有机结合,形成大数据驱动型的创新模式,推动开放创新和联动创新。

《5.结语与展望》

5.结语与展望

城市大数据是城市智能化发展的核心。城市智能化发展对中国而言,是一个极好的抓手。随着人口与经济逐渐在城市集中,城市的成功发展标志着国家主体的成功发展。所以,城市智能化在中国大有用武之地。目前,中国工业化与城市化的环境和政府结构非常有利于城市大数据的发展。对可被成功管理以及开放的城市大数据的应用能够促进城市知识服务的发展,创造新的市场和新的企业,进一步推进城市智能化的发展。当前,中国具备天时、地利、人和的独特优势,应充分借助城市大数据,促进中国城市智能化向更高水平发展。

《致谢》

致谢

本研究获中国工程院重大战略咨询项目(Nos.2012-ZD-6,2014-ZD-01)和中国工程院重点项目(No.2015-XZ-14)的资助,作者感谢来自上述项目的所有专家对本文的贡献。

《Compliance with ethics guidelines》

Compliance with ethics guidelines

Yunhe Pan, Yun Tian, Xiaolong Liu, Dedao Gu, and Gang Hua declare that they have no conflict of interest or financial conflicts to disclose.