《1. 引言》

1. 引言

近年来,产业界、媒体、政界等都对人工智能产生了浓厚兴趣,人工智能的研究与应用在国内外迅速升温。

产业界首先对布局人工智能展开行动。根据美国风投数据公司 CBInsight 2016年7月的报告[1],从2011年以来的5年中,美国谷歌、微软、Twitter、 Intel、 Apple 等IT巨头收购了约140家人工智能领域的创业公司。仅2016年上半年,资本市场对人工智能方向的投入就已经超过2015年全年。200家与人工智能相关的公司在股市上筹集到了15亿美元。

大量的并购与资本的涌入加速了人工智能技术更紧密地与应用结合,更快地向经济转化。以谷歌为例,2013年,当谷歌高价收购由多伦多大学的教授GeoffreyHinton创办的只有3位员工的神经网络公司 DNNresearch 时,曾引起轩然大波,如今 Geoffrey Hinton发起的深度学习,已经成为产业界最热门的技术,帮助谷歌切实提升了图像搜索的准确度,成为谷歌眼镜、谷歌无人车等项目的核心支撑。2014年,谷歌又以4亿英镑收购了DeepMind公司。2016年,DeepMind 研制的 AlphaGo 战胜了围棋世界冠军而崭露头角。谷歌自称正在从一个移动优先 (Mobile first) 的公司进化到人工智能优先 (AI first) 的公司。

人工智能与产业需求的结合也催生出服务模式的重大转变,如微软开发的小冰聊天机器人,正在引导传统使用方式从“图形界面”向“自然语言和情感理解交互界面”转变。微软在2016年6月以262亿美元收购社交网站LinkedIn[2],准备利用人工智能技术来重建互联网社区。IBM开发的 Watson 系统,已经在医院运行,包括快速筛选癌症治疗史中的150万份患者记录、诊断疑难白血病、提供治疗方案的建议,正在改变肿瘤治疗与临床诊断的运作模式。中国的百度公司也因在机器翻译、自然语言理解和智能汽车的布局,被评为“最聪明的公司”。

这一系列引人瞩目的突破与转变,也提升了大众对人工智能技术的预期,尤其近期谷歌 DeepMind 研发的 AlphaGo 引起了媒体的高度关注。AlphaGo结合深度强化学习和自我博弈策略训练得到策略网络与价值网络,并结合蒙特卡洛树搜索 (Monte Carlo Tree Search, MCTS) [3]来学习与运用围棋知识,于2016年3月,以4:1战胜了围棋世界冠军李世石。李世石在赛后表示,AlphaGo有两点让他感到震惊:一是其初期布局能力;二是在他感觉双方都很难落子的情况下机器往往出手干脆。AlphaGo 所表现出来的超越人类智能的行为,引发了世人的震惊与思考。法新社报道说:英国物理学家霍金表示,人工智能的完全开发“可能导致人类的灭绝”[4],“从现在起的一百年内,计算机将比人类聪明”[5]

2016年6月,《科学美国人》发表题为“人工智能觉醒”[6]的专题报道,其副标题为“人工智能,曾经被认为是过时丢弃的技术,如今正在强力复苏”。本文下面将分析提出,这种看似的复苏实质上正预示着一次人工智能的技术飞跃。

《2. 人工智能60年发展历程》

2. 人工智能60年发展历程

从诞生至今,人工智能已经经历了60年的发展。这60年的成果是丰富的,历程也是坎坷的。回顾其中的经验教训,能使我们进一步看清人工智能的发展趋向。

《2.1. 人工智能的诞生》

2.1. 人工智能的诞生

1956年,斯坦福大学 McCarthy 教授、麻省理工学院 Minsky 教授、卡内基梅隆大学的 Simont 和 Newell 教授(以上四位皆为图灵奖获得者)以及贝尔实验室的 Shannon (信息论提出者)、IBM公司的 Rochester 等学者在美国达特茅斯 (Dartmouth) 学院首次确立了“人工智能”的概念[7],即让机器能像人那样理解、思考和学习,即用计算机模拟人的智能。

自20世纪70年代以来,人工智能形成了如下典型研究领域:机器定理证明、机器翻译、专家系统、博弈、模式识别、机器学习、机器人与智能控制等。在探索这些领域的过程中,发展了大量技术,从中又形成了符号学派、连接学派、行为学派等多个学派。

《2.2. 人工智能的三次低谷》

2.2. 人工智能的三次低谷

然而人工智能的发展并非一帆风顺,60年中经历了三次大低谷。第一次挫折发生在1973年,英国发表了 James Lighthill 报告[8]。该报告主要评判人工智能基础研究中自动机、机器人和中央神经系统,并得出结论:“自动机和中央神经系统的研究有价值,但进展令人失望。机器人的研究没有价值,进展非常令人失望。建议取消机器人的研究。”遭此打击之后,人工智能进入严冬 (AI Winter)。现在看来,当时的人工智能尚属婴儿期,其实很难对其进行准确的评判。

人工智能的第二次挫折是由日本智能(第五代)计算机的研制失败导致。日本通产省1982年开始了第五代计算机的研制计划,希望计算机具备能直接推理与知识处理的新型结构。该计划的目标是:构成一个具有1000个处理单元的并行推理机,连接10亿信息组的数据和知识库,具备听说能力。到1992年,该计划耗资约8.5亿美元,因没能突破关键性的技术难题,最终以失败告终。这次的失败说明:驱动人工智能的发展主要靠创新的知识和软件,硬件的作用是支持其运行。

人工智能的第三次挫折开始于1984年,斯坦福大学试图通过专家人工的方式,来构建一个包含人类常识的知识百科全书Cyc[9],并期望基于此实现类人的推理能力。截至2015年11月,虽然Cyc已包括23万多个概念、实体和200多万个三元组,但因为搜索引擎开始崛起,互联网和大数据更显威力,实际上,Cyc在20世纪90年代后期就开始衰败。虽然Cyc后来也开始链接外部知识库( 如 Dbpedia[10]、 Freebase[11]、 CIAWorldFactbook[12] 等),但已无法挽回颓势。这次挫折的教训是:海量知识不能靠专家人工表达,要从环境中自动学习。

《3. 人工智能走向2.0》

3. 人工智能走向2.0

回顾人工智能发展历程中的主要挫折,我们不难发现,当它与信息环境的变化趋势不符时,往往就会导致失败。促使人工智能变化的动力既有来自人工智能研究的内部驱动力,也有来自信息环境与社会目标的外部驱动力,两者都很重要,但相比之下,往往后者的动力更加强大。

当前,随着互联网的普及、传感器的泛在、大数据的涌现、电子商务的发展、信息社区的兴起,数据和知识在人类社会、物理空间和信息空间之间的交叉融合与相互作用,人工智能发展所处的信息环境和数据基础已经发生了巨大而深刻的变化,这些变化形成了驱动人工智能走向新阶段的外在动力。与此同时,一系列的技术萌芽也预示着内存动力的成长。

《3.1. 促进人工智能走向2.0的外在动力》

3.1. 促进人工智能走向2.0的外在动力

促进人工智能2.0形成的外在动力至少来自四种外部环境的变化:

第一,21世纪的信息环境已发生巨大而深刻的变化。随着移动终端、互联网、传感器网、车联网、穿戴设备等的流行,感知设备已广泛遍布城市,计算也与人类密切相伴,遍布全球的网络正史无前例地连接着个体和群体,开始快速反映与聚集他们的发现、需求、创意、知识和能力。与此同时,世界已从二元空间结构 PH (Physics, Human Society )演变为三元空间结构 CPH (Cyber, Physics, HumanS ociety)。CPH 的互动将形成各种新计算,包括感知融合、“人在回路中”、增强现实(AR)、跨媒体计算等。

第二,社会对人工智能的需求急剧扩大。人工智能的研究正从过去的学术牵引迅速转化为需求牵引。智能城市、智能医疗、智能交通、智能物流、智能机器人、无人驾驶、智能手机、智能游戏、智能制造、智能社会、智能经济等应用中的新目标、新问题,都迫切需要人工智能的新发展。为此,很多企业和城市已主动布局,进行人工智能新研发。

第三,人工智能的目标和理念也在发生大的转变。人工智能的目标正从过去追求“用计算机模拟人的智能”转化为:①用机器与人结合成增强的混合智能系统;②用机器、人、网络结合组织成新的群体智能系统;③用人、机器、网络和物相结合而成的智能城市等更复杂的智能系统。

第四,人工智能的数据资源也在发生大的改变。人工智能的基本方法是数据驱动的算法。今后会更多地涌现出大数据驱动计算、传感器和网络驱动计算、跨媒体驱动计算。因此,大数据智能、感知融合智能、跨媒体智能的发展均为不可避免的趋势。而传统的以字符为基础的机器智能测试图灵方法[13]将受到挑战。

上述种种环境的巨变,将促成人工智能技术的重大提升,为人工智能2.0的形成与发展创造了切实的外部环境。同时,一系列新智能技术已处萌芽阶段。

《3.2. 人工智能走向2.0的技术萌芽》

3.2. 人工智能走向2.0的技术萌芽

在新的外部环境下,若干新的技术变化已初露端倪,并表现在近几年来的人工智能技术的前沿中。

3.2.1. 大数据智能

大数据的知识化,以 DeepMind 的 AlphaGo 技术为一大热门。与传统博弈人工知识不同,AlphaGo深度强化学习发展了“直觉感知”(下一步在哪)、“棋局推理”(全局获胜机会如何)和“新颖落子”(想人所不敢想)等能力,并将记忆人类棋局和自我博弈积累棋局结合了起来。此外,DeepMind 的软件还控制着 Google 数据中心的制冷系统、风扇和窗户等120个变量,使其用电效率提升了15%,几年内共节约电费数亿美元[14]。中国的诸多数据中心也需类似改造。据统计,它们的总能耗相当于三峡水电站的发电量[1]

在此领域中,目前深度学习技术很重要,但其缺陷是不可解释、不够通用。解决此类问题,将形成大数据智能的发展。

3.2.2. 互联网群体智能

基于网络的群体智能技术已经萌芽。今年,Science 的“群智之力量”的论文[15],将群体智能计算按难易程度分为三种类型:实现任务分配的众包模式 (Crowdsourcing),较复杂、支持工作流模式的群体智能(Complexworkflows),以及最复杂的协同求解问题的生态系统模式 (Problem solving ecosystem)。事实上,大规模个体通过互联网参与和交互,可以表现出超乎寻常的智慧能力,是新的智能系统。普林斯顿大学 Connectome项目开发了 EyeWire游戏[16],让玩家可以对显微图像中单个细胞及其神经元连接,按功能进行涂色[17]。来自145个国家的 165000多名科学家(及志愿者)参与了这个游戏,从而第一次详细描述了哺乳动物视网膜的神经组织如何检测运动的结构功能关系[12]。类似的还有Wiki百科、百度问答、知乎问答等研发的项目。

群体智能计算能极大地提高人类社会的智能水平,有广泛而重要的用途,目前其理论和技术尚在初期阶段。它的发展将提供一种前所未有的人工智能。

3.2.3. 跨媒体智能

人类智能的重要特点之一,是综合利用视觉、语言、听觉等各种感知所记忆的信息,从而完成识别、推理、设计、创作、预测等功能。中国科学家据此提出“跨媒体计算”概念[18]。2010年,Nature 的“2020 Vision”一文中,Norvig等[19]指出:文本、图像、语音、视频及其交互属性将紧密混合在一起,即为“跨媒体”。2014年,Lazer等在 Science 上发表的论文指出,多源融合及具有知识演化和系统演化特性的智能分析方法,是解决“大数据傲慢”(big data hubris) 的必要手段[20]。蒙特利尔大学的Yao等[21,22]提出了一系列从视频中生成文本描述的方法。风靡全球的“精灵宝可梦GO”[23]游戏,是利用跨媒体的增强现实技术,将3D图形与手机实时视频有机结合起来。

近年来,随着计算机网络、多媒体以及移动终端的不断发展,全球数据呈现多媒体爆炸式增长的特性。跨媒体智能是实现机器认知外界环境的基础智能,在语言、视觉、图形和听觉之间的语义贯通,是实现联想、设计、概括、创造等智能行为的关键。

当前的跨媒体智能,尚处于发展萌芽状态,可望形成新一代人工智能的重要领域。

3.2.4. 人机混合增强智能

人们经常会提出的问题是:机器智能会超过人类智能吗?人工智能专家的回答多数是:在专用领域,是的;对通用智能,至少在下一个60年内不会发生。

人的智能是自然生物的智能,它和人工智能各有不同的优劣。用计算机来模拟人的智能固然重要,而让计算机与人协同,取长补短成为一种“1+1>2”的增强性智能系统则更为重要。当前,各种穿戴设备、智能驾驶、外骨骼设备、人机协同手术纷纷出现,预示着人机协同增强智能系统将有一个广阔的发展前景。

3.2.5. 自主智能系统

从人工智能诞生之时起,机器人就列入其目标领域,仿生学自然也成为重要的发展方向。但60年来所出现过的各种仿生机器人,多数已在实用中败下阵来。最著名的是四腿负重行走的“机械骡”,美国陆军试用后放弃,转用无人战车。另一类耳熟能详的例子是无人飞机和无人汽车,其发展之迅猛,已远远超过了机器人。

越来越多的例子说明,对机械装备进行智能化和自主化的升级,往往比类人机器人更加高效。因此,自主智能系统将成为新一代人工智能的重要发展方向。把握这一趋势,对中国制造业的升级尤为重要。

《3.3. 人工智能2.0的核心理念》

3.3. 人工智能2.0的核心理念

综上所述,可以给出人工智能2.0的初步定义为:基于重大变化的信息新环境和发展新目标的新一代人工智能。其中,信息新环境是指:互联网与移动终端的普及、传感网的渗透、大数据的涌现和网上社区的兴起等。新目标是指:智能城市、智能经济、智能制造、智能医疗、智能家居、智能驾驶等从宏观到微观的智能化新需求。可望升级的新技术有:大数据智能、跨媒体智能、自主智能、人机混合增强智能和群体智能等。

人工智能2.0技术将具有如下显著特征:一是从知识表达技术到当今大数据驱动知识学习,转向数据驱动和知识指导相结合的方式,其中,机器学习不但可自动,而且可解释,应用更广泛;二是从处理分类型数据,如视觉、听觉、文字等,迈向跨媒体认知、学习和推理的新水平;三是从追求“智能机器”到高水平的人机协同融合,走向混合型增强智能的新计算形态;四是从聚焦研究“个体智能”到基于互联网的群体智能,形成在网上激发组织群体智能的技术与平台;五是将研究的理念从机器人转向更加广阔的智能自主系统,从而改造各种机械、装备和产品,引领其走向智能化的道路。

人工智能2.0是人工智能发展的新形态。它既区别于过去60年来出于某个流派或领域的一系列研究,也不同于现在的针对某种热门技术而延展的改进方向[16]。人工智能2.0的目标是结合内外双重驱动力,以求在新形势、新需求下实现人工智能的质的突破。相比于历史上的任何时刻,人工智能2.0将以更接近人类智能的形态存在,以提高人类智力活动能力为主要目标。它将紧密地融入我们的生活 (跨媒体和无人系统),甚至成为我们身体的一部分 (混合增强智能),可以阅读、管理、重组人类知识(知识计算引擎),为生活、生产、资源、环境等社会发展问题提出建议 (智慧城市、智慧医疗),在某些专门领域中的博弈、识别、控制、预测等智能接近甚至超越人的水平。

人类在人工智能2.0的辅助下能进一步认识与把握复杂的宏观系统,如城市发展、生态保护、经济管理、金融风险等;也有利于进一步提高解决具体问题的能力,如医疗诊治、产品设计、安全驾驶、能源节约等。

《4. 中国应当促进人工智能走向2.0》

4. 中国应当促进人工智能走向2.0

《4.1. 中国发展人工智能2.0的需求与可能》

4.1. 中国发展人工智能2.0的需求与可能

中国正值工业化、城镇化、信息化、农业现代化和绿色化的发展高潮,迫切需要发展人工智能技术来改善人民日常生活水平,解放社会生产力;优化城镇发展结构、提高资源利用效率,支持可持续发展;加快解决教育、医疗、贫困、环境、资源等一系列紧迫问题。

中国工程院近年来在研究“智能城市”“大数据”“智能制造”“创新设计”“数字创意产业”和“知识中心”等有关中国发展战略的项目时,深切感受到人工智能的重要性。而且,中国人工智能的市场需求和社会需求已经迅速扩大。如在2014年,搜索引擎已达 600亿元[24],2015年,智能语音产业达到 46.8亿元[25],工业机器人销量猛增54%,达5.6万台[26]。全国已有400余个城市建设“智慧城市”,市场规模估计达 800亿元[27]。联合国教科文组织 (UNESCO) 在2014年于中国工程院启动了“国际工程科技知识中心”,从而开始了首个大数据和知识服务的国际合作中心。

值此新一代人工智能恰需整体布局、及时推进之际,我们应当勇于创新、有所贡献,予以前瞻性研究,尽快布局实施。在布局实施人工智能2.0时,须与先前积累的发展成果相互动,如电子政务、电子商务、快递物流、智能社区、分享经济、智能手机、家用电器、制造业升级和新型城镇化等。而创新设计、跨媒体计算、图像编码、中文识别、知识中心、智能城市及其大数据等先行理念或技术成果也应予以结合。

《4.2. 发展人工智能2.0的建议》

4.2. 发展人工智能2.0的建议

4.2.1. 大数据智能

大数据智能研究从数据到知识、从知识到智能行为的能力,打穿数据孤岛,形成链接多领域的知识中心,支撑新技术和新业态的跨界融合与创新服务。为此,需要研究面向CPH三元空间的知识表达新体系,链接实体、关系和行为。研究数据驱动与其他技术相结合的知识挖掘、自主学习和动态演化等知识计算新方法、新软件。建议应用于智能医疗、智能经济、智能城市等。

4.2.2. 互联网群体智能

互联网群体智能研究群体智能的形成理论、管理方法和组织技术;研究群体智能在互联网上的协同、秩序、安全、演化、学习与进化的机理及平台;研究群体智能的各种产业生态。该方向的应用为群体智能科研、群体智能知识库、分享经济等。

4.2.3. 跨媒体智能

跨媒体智能研究跨媒体感知、学习、推理和创造;研究综合逻辑与形象的工作机理,以语义相通相容为媒介,实现跨媒体分析、推理、类比、联想,建立“耳聪目明”和“融会贯通”的智能新技术。这一方向的研究工作包括建立语言、视觉、图形、听觉等多媒体感知分析和语义相通相容的理论和模型;建立和研制智能感知、跨媒体自主学习与推理的新理论、新方法、新软件、新硬件。其示范应用有智能安全、创新设计、数字创意等。

4.2.4. 人机混合增强智能

人机协调增强智能研究生物智能系统与机器智能系统的紧密结合、协同工作,形成比两者都更高的智能水平。实现人机、脑机协同的环境/情境理解、问题求解、调度与决策。其应用包括穿戴式设备、新型机器人、辅助教育及人机一体化的新产品。

4.2.5. 自主智能系统

自主智能系统研究各种自主智能载运平台、自主生产加工系统和智能调度监控系统,深入研究自主智能系统的技术、架构、平台和设计标准。其应用为无人车、无人机、各种服务设备、机器人和智能工厂等。

《4.3. 建议推动人工智能2.0研究的国际合作》

4.3. 建议推动人工智能2.0研究的国际合作

鉴于人工智能2.0技术对人类发展的重要影响,建议中国推动全球各国科学家与智库开展合作,共同推动人工智能技术沿着正确的方向升级。

《致谢》

致谢

感谢徐匡迪和周济院长,没有他们的帮助,本文不可能在今天完成。

感谢李未、高文、郑南宁、吴澄、李伯虎、陈左宁、陈纯等院士和庄越挺教授,很多概念是在与他们的讨论中才得以完善。

感谢李仁涵、吴飞、汤斯亮教授,他们为本文的形成提供了很多重要的资料。