《工程(英文)》 >> 2024年 第34卷 第3期 doi: 10.1016/j.eng.2023.07.006
通智测试——基于动态具身物理社会交互环境的通用人工智能测试
a National Key Laboratory of General Artificial Intelligence, Beijing Institute for General Artificial Intelligence, Beijing 100086, China
b Institute for Artificial Intelligence, Peking University, Beijing 100871, China
c Beijing Key Laboratory of Behavior and Mental Health, School of Psychological and Cognitive Sciences,Peking University, Beijing 100871, China
d School of Intelligence Science and Technology, Peking University, Beijing 100871, China
e School of Computer Science, Peking University, Beijing 100871, China
下一篇 上一篇
摘要
随着生成式预训练Transformer模型系列的发布,通用人工智能再次被推到了人工智能领域最受瞩目的前沿。然而,如何定义和评估通用人工智能的问题仍不明确。本研究提出,对于通用人工智能的评估应植根于动态物理和社会互动的具身环境(DEPSI)。具体而言,本文提出了定义通用人工智能的五个关键特征,提出以通智测试作为通用人工智能的评估系统。通智测试描述了一个以价值和能力为导向的测试系统,该系统通过动态物理社会具身交互环境,划分了通用人工智能五个级别的里程碑,致力于构建无限测试任务。本文将通智测试与经典的人工智能测试工具进行了多方面的对比,并提出了一个系统化的评估体系,以促进人工智能的标准化、定量化和客观化的基准制定和评估。