《一、前言》

一、前言

随着信息技术(IT)的发展,人类社会从以互联网为代表的 IT 2.0 时代进入以万物互联为代表的 IT 3.0 时代 [1]。自 2015 年 7 月《国务院关于积极推进“互联网 +”行动的指导意见》发布以来,一方面,政务、教育、医疗、零售、金融、能源、农业等各行各业与互联网进一步深度融合,诸多典型新应用涌现并在多个城市全面铺开,如智慧政务、智慧医疗、智慧交通等;另一方面,第五代移动通信(5G)、人工智能(AI)、区块链、边缘计算等技术不断发展,推动“互联网 +”进入新阶段,具体表现为 5G、区块链技术开始进入商用阶段,边缘计算技术方兴未艾,AI 在语音识别、人脸识别等领域得到大规模应用等。

2020 年 3 月,我国提出加快 5G 网络、数据中心等新型基础设施建设的要求。新型基础设施建设的本质是强化信息化的基础设施,为社会治理、产业升级和未来数字经济发展打下坚实基础。一方面,网络用户和网络连接设备的数量仍将持续增长,数据量也会随之增长,而这要求网络不断提升带宽和数据处理吞吐量;另一方面,“互联网 +”使消费互联网向产业互联网渗透和转变,促使工厂生产、企业经营管理转向无接触化、协同化、智能化,实现大规模生产设备的互联、更精准的实时控制以及海量数据的整合和利用,成为我国诸多企业转型升级的迫切需求。尤其是在新型冠状病毒肺炎疫情防控期间,远程办公、远程协同、在线教育以及远程医疗等特定场景对海量数据和网络传输的高吞吐、低时延需求更显迫切。

无论是从应用需求角度,还是从技术推动角度来看,当前我国“互联网 +”技术发展都已进入新阶段,涌现出一系列新需求和新变化。一个城市如何构建“互联网 +”新型基础设施以适应新需求和新变化,是具有鲜明研究价值的课题。本文在分析需求和发展现状的基础上,概括并提出构建城市“互联网 +”新型基础设施的典型建设路径,如城市数据中台建设、“信息高铁站”建设,同时给出了促进我国城市“互联网 +”新型基础设施发展的对策建议。

《二、城市“互联网 +”新型基础设施的需求分析》

二、城市“互联网 +”新型基础设施的需求分析

构建城市“互联网 +”新型基础设施的核心是应对万物互联时代的数据处理需求和智能化需求,如海量设备互联互通互操作的需求,海量数据融合、共享与流通的需求,海量请求高通量处理、实时性响应的需求。

《(一)海量设备互联互通互操作的需求》

(一)海量设备互联互通互操作的需求

随着越来越多的设备接入到移动网络,新的服务和应用层出不穷,数据流量也不断增加,这给网络带来严峻挑战。5G 的发展正是为了应对这一挑战。在 5G 网络中,数据传输速率最高可达 10 Gbit/s,比第四代移动通信(4G)网络快 100 倍,同时网络延迟和响应时间低于 1 ms。5G 将真正开启万物互联的新时代。根据全球移动通信系统协会(GSMA)研究报告显示,2019 年全球物联网总连接数达到 120亿,预计到 2025 年全球物联网总连接数规模可达 246 亿 [2]

《(二)海量数据融合、共享与流通的需求》

(二)海量数据融合、共享与流通的需求

万物互联时代带来的挑战不仅是数据量的爆发式增长,更重要的是如何管理好、治理好、应用好这些大数据 [3]。根据国际数据公司预测,2025 年全球数据总量将高达 175 ZB,其中中国的数据量将达到 48.6 ZB,成为全球数据量最大的国家 [4]。随着我国大数据产业的不断推进,数据作为生产要素成为推动我国经济高质量发展的新动能。2020 年 4 月,《中共中央、国务院关于构建更加完善的要素市场化配置体制机制的意见》中明确指出,要发挥数据对其他要素的倍增作用,培育发展数据要素市场。数据蕴含着丰富的经济和商业价值,但是数据只有流动、融合、共享、挖掘和应用,才能发挥其价值。解决数据共享、重复建设、“数据孤岛”等难题,成为一个城市面临且必须克服的挑战。

《(三)高通量处理和实时性响应的需求》

(三)高通量处理和实时性响应的需求

随着 5G、物联网、智慧城市的不断发展,整个社会的数字化程度进一步提高,数据的产生方式、产生量、处理方式也发生变化。数据流通速度、使用成本、汇聚能力和驾驭能力将成为衡量各行各业发展能力和竞争力的决定性因素 [5]。智能驾驶、远程医疗、工业控制等城市新型应用需要实时性保证和精准控制,传统的大数据中心或云计算中心面临着巨大的承载压力,无法满足万物互联时代大数据处理的高通量、高并发、强实时性和高安全可靠等要求。

《三、城市“互联网 +”新型基础设施建设的发展现状与面临问题》

三、城市“互联网 +”新型基础设施建设的发展现状与面临问题

《(一)发展现状》

(一)发展现状

1. 5G 进入商用阶段

当前,5G 在我国已进入商用阶段,北京、上海、福州、合肥等 40 多个城市已进入首批试点。2019 年 6 月,工业和信息化部正式向中国电信集团有限公司、中国移动通信集团有限公司、中国联合网络通信集团有限公司、中国广播电视网络有限公司发放 5G 商用牌照。2019 年 10 月,中国电信集团有限公司、中国移动通信集团有限公司、中国联合网络通信集团有限公司分别公布了 5G 商用套餐,并于 11 月正式上线 5G 商用套餐,标志着中国正式进入 5G 商用时代。根据预测,2025 年中国 5G 商用将直接带来经济总产出 10.6 万亿元,间接拉动经济总产出 24.8 万亿元 [6]

2. 云计算模式成熟,AI 应用广泛

经过多年发展,云计算已成为一种成熟的模式,得到广泛部署和应用。云计算具有按需服务、可计量、资源池化、弹性等特点,在政府政务和企业管理中得到普遍应用。阿里云、腾讯云、华为云、浪潮云等都取得了快速发展。同时,随着计算能力的提高、数据量的增多和深度学习能力的增强,AI 开始广泛用于工业生产、政务服务、金融、教育等多个领域,如从人脸识别到语音助手,从智能辅助决策系统到多场景交互系统等。

3. 边缘计算方兴未艾

随着传感器、智能设备的增多以及各行各业信息化程度的提高,网络数据量不断增长。这对数据传输的带宽、速率提出了更高的要求,对数据传输的高精度、实时性响应也提出了更高的要求。然而,当前依托云计算的智能服务模式存在实时性和延时抖动的问题[7],在城市“互联网 +”新型基础设施发展的同时,亟需解决海量终端和智慧应用直接接入云端的方式问题。而边缘计算可在更接近网络边缘侧实现局部的数据存储、处理,对简单的请求进行本地化的处理和响应,构建“局部智能生态”,弥补云计算服务的不足 [8]

4. 智能驾驶、智能工厂等新型应用出现

随着 AI、大数据等技术的飞速发展,无人驾驶和车联网日益兴起,目前重庆、武汉、长沙、北京、上海等城市都已有无人驾驶路段的规划和测试。持续的车–路–人协同需求,使一辆无人驾驶汽车 1 min 内收集的数据量超过 100 Gbit。另外,智能工厂机器设备间的高效信息互联,可以实现生产设备、物料、人员相互间的动态实时数据感知,满足工厂 24 h 监测需求,完成能源消耗优化、生产决策自动判断等任务,满足个性化定制、柔性化生产的需求。操作人员可远程掌握生产的实时动态,参与生产过程的指挥或协同。

《(二)面临问题》

(二)面临问题

1. “数据孤岛”问题仍显突出

由于城市的信息基础设施建设统筹规划力度不够,或多主体利益协调机制不成熟,或信息系统建设标准不统一,使我国不少城市的政府部门之间、企业之间、政府和企业之间的公共平台和共享渠道缺失,存在城市数据“不愿共享、不敢共享、不知如何共享”的问题 [9],而已共享或开放的数据也因格式标准不统一、数据质量不佳而无法进行关联融合,仍然表现为一座座“数据孤岛”。

2. 城市本地化数据处理亟需加强

随着万物互联时代的到来,城市信息基础设施和海量设备产生的数据量快速增加,带来了更高的数据传输带宽需求;同时,智能驾驶、远程控制与协同等新型应用也对数据处理的实时性和精准性提出了更高要求,而传统云计算模型已经无法有效应对 [7]。大量数据和应用需求亟需在本地进行处理和实时响应,未来一座智慧城市在很大程度上需要配备一个本地化的具备高效处理能力的大数据中心。

《四、城市“互联网 +”新型基础设施的典型建设路径》

四、城市“互联网 +”新型基础设施的典型建设路径

建设城市“互联网 +”新型基础设施是一项系统工程。从基础设施角度看,建设内容涵盖智能终端、骨干网、5G 基站、数据中心、云平台、智慧应用系统等;从大数据全生命周期看,涉及设备互联到数据采集、数据汇聚到数据融合、数据共享到数据流通、数据处理到数据应用等。建设城市“互联网 +”新型基础设施的目标是解决持续增长的海量数据的汇聚、融合、共享和应用问题,提供保证安全可靠、具备高效处理、能够实时响应千亿量级网络应用请求的平台。而数据中台可以高效应对城市数据暴增并促进数据的有效利用;“信息高铁站”则可以作为数据中台的底座,提供高通量、高品质的服务。

《(一)数据中台:城市“互联网 +”的核心基础设施》

(一)数据中台:城市“互联网 +”的核心基础设施

城市构建“互联网 +”基础设施的核心是在满足高效互联互通的同时,汇聚并应用好城市的大数据。为破解数据共享、“数据孤岛”、数据治理和数据利用难题,当前我国多个城市已着手进行数据中台建设。

目前数据中台的概念尚未统一。思特沃克公司(ThoughtWorks)提出,数据中台是介于快速变化的创新型前台系统和记录型后台系统之间的能力平台,是聚合和治理跨域数据,将数据抽象封装成服务,提供给前台以实现业务价值的逻辑概念。付登波等 [10] 认为,数据中台是一套可持续“让数据用起来”的机制,是一种战略选择和组织形式,是依据特有的业务模式和组织架构,通过有形的产品和实施方法论支撑,构建的一套不断将数据变成资产并服务于业务的机制。

建设数据中台的出发点是解决核心数据模型变化较慢而应用需求变化较快的问题。通过搭建数据中台,对数据进行统一的搜集和汇聚,将数据标准化、资产化和服务化,是满足用户需求多样性和支撑应用变化性的有力措施。通过数据中台建设,做好城市公共数据沉淀和共享服务,可以快速响应用户千变万化的需求,支撑前台应用。另外,数据中台的可靠性和稳定性更好,并且在标准化、时效性、效率等方面更有保障。数据中台的总体技术架构,如图 1 所示,具体分为以下几个模块 [10]。

《图 1》

图 1 数据中台的总体技术架构 [10]

(1)数据汇聚。采集和汇聚整个城市各行各业的数据,如政务系统各部门的数据,采用实时接入或离线批量导入,汇聚大量异构、多源数据。

(2)数据开发。主要面向数据开发人员,对数据进行加工处理以及算法建模,如提供标签库给业务系统使用。

(3)数据体系。经过汇聚和加工,数据已经具备应用的条件,构成了基础性的数据仓库。数据的基本体系包括标签数据、贴源数据、应用数据、统一数据仓库。

(4)数据资产管理。将数据进行资产化管理,包括数据资产目录管理、元数据信息收集、数据血缘探查、数据生命周期管理、数据质量、数据标准。

(5)数据服务体系。将数据转化为一种服务能力,对数据模型按照应用要求进行封装,形成数据服务。在数据服务体系中,向应用系统提供数据应用接口、服务创建、服务授权、调用管理等功能。

(6)数据运营体系和安全管理。数据中台的核心是将数据加工后封装成一个公共数据产品或服务。数据运营体系和数据安全管理是数据中台持续运转的基础。

城市数据中台的整体架构图如图2所示。贵州省是我国大数据发展先行先试示范区之一,贵阳市作为省会城市,在政府数据开放、大数据发展应用等方面走在全国前列。该市目前正在开展块数据(城市)综合服务平台建设,其中以数据中台建设为核心。数据中台作为应用前台和业务信息系统后台的中间层,包括数据资源平台、算法平台、计算资源平台,既支撑了千变万化的前台应用系统,又高效稳定地汇聚了整个城市的异构多源数据,助力实现数据的资产化、标准化、服务化。

《图 2》

图 2 城市数据中台建设的整体架构

贵阳块数据(城市)综合服务平台,通过建设数据中台,整合了政府数据共享交换平台、第三方数据平台以及医疗、教育、城管、公安、应急、生态等城市政务系统和实时数据,面向政府、企业大数据场景应用提供城市人、事、物全要素数据和全时空数据,构建形成全市统一的数据服务平台和数据资产管理平台。

《(二)城市“信息高铁站”:支撑数据中台的底座》

(二)城市“信息高铁站”:支撑数据中台的底座

在万物互联时代,“人–机–物”三元世界深度融合,智能处理技术在能耗不增加的前提下,需要提升上千倍的计算能力 [11]。以文字为主的结构化数据正逐渐被以图片和视频等为主的非结构化数据所取代,这也是促使数据流量快速增长的重要原因。为了应对新的需求,城市新型数据中心的信息处理能力需要支撑起新增的千亿级终端及海量的信息处理请求。“信息高速公路”已无法满足 5G 时代万物互联的大数据计算需求,基于此,中国科学院计算技术研究所提出了“信息高铁”计划,其核心是面向“人–机–物”三元融合的计算需求,提供更高通量的、更有实时性保证的、高安全可靠的信息服务,满足万物互联时代大数据获取、传输、处理的全局可控且高效处理需求。“信息高铁”计划的内容是建设稳定可靠的云–网–边体系完备的“互联网 +”新型基础设施,采用高通量核心芯片、高通量云服务器、智能路由器、超级基站、智能测调系统等核心芯片、设备和基础软件,在全国建设“信息高铁”网络和计算枢纽,实现从核心芯片到应用场景的全链条覆盖。其中,“信息高铁站”建设是“信息高铁”计划的核心内容和首要任务。

1. 发展“信息高铁”的意义

(1)“信息高铁”契合我国国情

美国在 20 世纪 90 年代启动了“信息高速公路”计划,带来了互联网在美国乃至全世界的繁荣。类比于美国的高速公路,我国用高铁解决了十几亿人的运送问题,其关键在于集中式的高吞吐量和传输速率。基于同样的国情,为满足我国的信息化和智能需求,亟需建设“信息高铁”。“信息高铁”的核心特征是高通量计算和高品质服务,前者追求计算又快又多又稳,后者则追求像高铁一样有保障的计算和网络。

(2)“信息高铁”适应 5G 时代的万物互联场景

高通量计算在数据中心的应用主要面向互联网、物联网等 5G 时代的万物互联场景,其特点是:任务多样、计算量不大,但是任务的并发数量及数据规模巨大,且处理要求实时性 [12]。与传统高性能计算以峰值速率或高速度为目标相比,高通量计算的核心是追求高通量,即“算得多”,包括高吞吐、高利用率和低延迟 3 个核心要素 [13]。高吞吐指单位时间完成的任务数或者响应的请求数要多;高利用率指系统核心部件(如中央处理器、存储、网络等)的利用率要高;低延迟指用户请求响应的时间要短。

(3)“信息高铁”构成城市数据中台的底座

城市数据中台汇聚融合了一个城市方方面面的数据,支撑了大量的应用系统,且随着应用需求的不断变化,未来城市公共算力设施需要面对千亿级别端口设备带来的新需求,需要提供更高通量、更高智能、更高确定性、更低延迟和更低功耗的计算与传输能力。

当前,城市公共算力设施以超算中心和云计算中心为主(见表 1)。超算中心的特点是“算得快”,交通工具类比于飞机,价格昂贵、速度快、完成时间短。云计算中心的特点是“算得省”,交通工具类比于汽车,普惠大众,在大多数出行场景中实现低成本出行。但这两种方式都存在一个明显的缺陷,一旦交通负载快速上升,就容易造成拥塞,导致任务完成时间急剧增长,难以保障服务质量。高通量中心就是要突破上述局限性,在高负载的情况下实现“算得多”,交通工具类比于高铁,在高负载、高利用率前提下依然能有效保障用户服务质量 [14]。

《表 1》

表 1 城市公共算力设施与交通工具的类比 [14]

总之,“信息高铁站”作为支撑城市数据中台的底座(见图 3),可以有效应对城市数据量激增、大规模互联互通、实时响应、精准控制等的服务要求,满足未来城市“互联网 +”新型基础设施建设在安全、有序、可控等方面的综合需求。

《图 3》

图 3 城市“信息高铁站”建设

2.“信息高铁”关键技术与实践案例

“信息高铁”关键技术体系包括:高通量核心芯片、高通量云服务器、智能路由器、超级基站、智能测调系统等核心芯片、设备和基础软件,以及构建稳定可靠的云–网–边体系。其中高通量众核体系结构和高通量片上数据通路是关键的核心技术。针对高通量计算高吞吐、低延迟、高利用率的特点,体系结构需要从“速度导向”转为“通量导向”。例如,采用易扩展的片上网络支持能耗感知和拥塞感知实现高并发场景下的片上网络均衡,以及采用细粒度可配置的片上存储适配高通量场景下复杂的数据访问模式等。

我国“信息高铁”首站——盐城高通量计算中心于 2019 年 7 月 31 日启动建设,旨在打造融合高通量计算技术和实际应用场景的高通量服务平台,提供以响应用户服务请求能力为目标的高吞吐数据处理解决方案,为地区经济社会的发展提供高吞吐能力的、低延迟的、高确定性的新型信息技术基础设施和服务。盐城高通量计算中心拥有 1000 个计算与存储节点,30 000 个处理器核,每秒钟能处理 1000 万路视频流,而功耗仅为 750 kW,在实际应用中展现出超高能效比。支撑的应用和服务包括 5G 网联车、视频大数据、网络安全信息处理、大图计算、AI 数据处理、高并发物联网处理等。

《五、对策建议》

五、对策建议

《(一)前瞻布局,顶层规划》

(一)前瞻布局,顶层规划

在万物互联时代,未来城市智能化发展的趋势是互联设备持续增多、数据量不断增长、应用生态更加繁荣。因此,城市“互联网 +”新型基础设施的规划应具有前瞻性,既要有稳定性、连续性,也要有较强的可扩展性,避免由于无法满足未来高带宽、低延迟、强实时、高可靠性、高品质的服务,而陷入“推倒重来、重复建设”的怪圈。

《(二)因城施策,体系化构建》

(二)因城施策,体系化构建

数据中台和“信息高铁站”作为未来城市“互联网 +”新型基础设施的核心和底座,是支撑未来城市信息化、网络化、智能化广泛应用的生态体系。由于每个城市信息化基础不同,产业生态千差万别,应用需求也各不相同。各地应根据实际情况构建“互联网 +”新型基础设施体系,可采用“1+1+X”建设方案,即 1 个信息高铁站,1 个数据中台,若干个行业云计算中心或超算中心等。

《(三)灵活运用多种建设和运营模式》

(三)灵活运用多种建设和运营模式

数据中台和城市“信息高铁站”都是“重型”信息基础设施建设,需要较大规模的投资。同时,作为城市基础设施,其运营又关系到相关产业未来的发展和生态。因此,各个城市可以结合实际情况,采用不同的建设模式。例如,政府投资、企业建设和运营,政府和企业共同投资建设、共同运营,企业投资和运营、政府购买服务和监管等。

《六、结语》

六、结语

随着 5G、物联网、AI 等新技术的推动以及在线应用、协同办公、远程实时控制等新需求的拉动,我国“互联网 +”的发展进入了新阶段。为应对“互联网 +”新阶段城市万物互联和海量数据融合应用的发展需求和远程办公、远程协同等应用的高并发、实时响应的挑战,本文提出了构建城市“互联网 +”新型基础设施的典型建设路径。一方面,构建城市数据中台将城市数据有效汇聚融合,使数据资产化、标准化、服务化,支撑应用需求的千变万化;另一方面,建设城市“信息高铁站”满足高通量、高品质的数据处理需求,安全、有序、可控地作为数据中台的底座,共同推进我国“互联网 +”行动纵深发展。未来,随着“数据中台”“信息高铁站”的广泛建成,我国城市“互联网 +”新型基础设施必将再上一个新台阶。