老年人智慧医疗领域语音生物标记物应用研究

韩舒羽 ,  王文霞 ,  杨宇帆 ,  王小萌 ,  张雯敏 ,  单锶楷 ,  陈思烨 ,  王志稳

中国工程科学 ›› 2024, Vol. 26 ›› Issue (6) : 56 -64.

PDF (657KB)
中国工程科学 ›› 2024, Vol. 26 ›› Issue (6) : 56 -64. DOI: 10.15302/J-SSCAE-2024.06.003
我国人口老龄化与医学卫生健康事业发展

老年人智慧医疗领域语音生物标记物应用研究

作者信息 +

Application of Vocal Biomarkers in the Field of Intelligent Medical Care for Older Adults

Author information +
文章历史 +
PDF (671K)

摘要

在我国人口老龄化形势严峻、老年人健康问题具有普遍性和复杂性的情况下,应用人工智能技术推动老年人智慧医疗领域发展成为重要趋势。本文聚焦语音生物标记物在老年人智慧医疗领域中的应用和发展问题,系统梳理了语音生物标记物在医疗领域中的典型应用、国际上对语音生物标记物发展的支持情况和我国语音生物标记物研究与应用面临的挑战,总结了老年人智慧医疗领域语音生物标记物的6个重点研究方向,包括明确并构建老年人语音生物标记物指标体系、研发语音生物标记物设备和工具并制定相关研究规范、深化老年人语音特征和语音生物标记物关联健康结局机制的基础研究、加强语音生物标记物相关健康变量预测模型的研究、推动语音生物标记物辅助疾病诊断和临床决策的研究与应用、建立语音生物标记物大型人群队列及数据平台。研究建议,鼓励语音生物标记物相关法律研究及行业标准制定,注重跨学科人才队伍建设,在保障数据安全的前提下推进数据共享,优化语音生物标记物大型人群队列及数据平台的管理,以促进老年人智慧医疗领域语音生物标记物的技术探索、应用研究和产业升级。

Abstract

Under the circumstances of severe population aging as well as prevalent and complex health problems among older adults, applying artificial intelligence technologies to promote the development of intelligent medical care for older adults has become a significant trend. This study focuses on the application of vocal biomarkers in intelligent medical care for older adults. It summarizes the typical applications of vocal biomarkers in medical care, international development support for vocal biomarker application, and challenges faced by the research and application of vocal biomarkers in China. It also proposes key research directions for vocal biomarkers in the field of intelligent medical care, including (1) clarifying and establishing an indicator system for vocal biomarkers of older adult; (2) developing equipment and tools for vocal biomarkers and formulating relevant research standards; (3) deepening basic research on the mechanisms by which vocal characteristics and vocal biomarkers are associated with health outcomes of older adults; (4) strengthening research on prediction models of health outcomes related to vocal biomarkers; (5) promoting the research and application of vocal biomarkers in assisting disease diagnosis and clinical decision-making; and (6) establishing a large population cohort and data platform for vocal biomarkers. Furthermore, the following development recommendations are proposed: (1) encouraging legal research and industry standards formulation related to vocal biomarkers, (2) focusing on the construction of interdisciplinary teams, (3) promoting data sharing while ensuring data security, and (4) optimizing the management of the large population cohort and data platform for vocal biomarkers. This study is expected to provide a basic reference for the technology exploration, application research, and industrial upgrading of vocal biomarkers in the field of intelligent medical care for older adults.

关键词

人口老龄化 / 智慧医疗 / 健康管理 / 语音生物标记物 / 跨学科融合

Key words

aging population / intelligent medical care / health management / vocal biomarker / interdisciplinary integration

引用本文

引用格式 ▾
韩舒羽,王文霞,杨宇帆,王小萌,张雯敏,单锶楷,陈思烨,王志稳. 老年人智慧医疗领域语音生物标记物应用研究[J]. 中国工程科学, 2024, 26(6): 56-64 DOI:10.15302/J-SSCAE-2024.06.003

登录浏览全文

4963

注册一个新账户 忘记密码

一、 前言

我国正处于快速向深度老龄化迈进的阶段,根据第七次全国人口普查数据[1],全国60岁及以上、65岁以上人口分别达2.6亿人、1.9亿人,居民人均预期寿命达78.2岁[2],高于世界平均人均预期寿命(73.3岁)[3]。然而,我国老年人长寿不健康问题日益凸显,中国健康与养老追踪调查(CHARLS)指出[4],约有86.23%的60岁以上老年人至少患有1种慢性疾病;并且老年人共病现象普遍,高达65.14%的老年人同时患有2种及以上的慢性疾病,老年人总体抑郁水平达到37.9%。因此,在老年群体越来越庞大以及老年人健康问题具有普遍性和复杂性的形势下,进一步满足我国老年人对医疗和健康管理的需求成为亟需解决的重要问题。

随着人工智能(AI)的飞速发展,应用AI技术推动老年人智慧医疗发展成为一大趋势[5],其中,利用智能语音技术的语音生物标记物具有广阔的应用前景。语音生物标记物指从人的语音中提取特征性的声学、语言学和副语言等信息作为一种数字生物标记物[6]。作为一种非侵入性的数字技术,语音生物标记物具有低成本优势,能够提供包括呼吸、内分泌、神经和循环等系统在内的丰富人体信息[7~10]。例如,帕金森病对患者言语功能的影响明显,包括发音功能减退和构音障碍等[11],而语音生物标记物可作为一种客观工具来识别和量化相关症状,并评估疾病治疗的效果。

借助AI技术,推动语音生物标记物在老年人智慧医疗领域的应用,将有助于提高老年人健康管理的效率和精确性。本文围绕语音生物标记物在医疗领域的典型应用,分析国际上对语音生物标记物的发展支持情况,总结我国语音生物标记物研究和应用面临的挑战,进而提出语音生物标记物在我国老年人智慧医疗领域的重点发展方向和发展建议,以期为语音生物标记物的技术探索、应用研究和产业发展等提供参考。

二、 语音生物标记物在医疗领域的典型应用

(一) 认知功能

老年人因身体机能衰退,出现认知功能下降和认知功能障碍的概率较高。语音生物标记物作为能够反映认知功能的重要信号,在预测和诊断老年人认知功能变化方面具有良好的应用前景。以阿尔茨海默病为例,在疾病初期,患者的自发语言基本流畅,无发音错误,遵循基本语法原则,但句法复杂度明显降低,出现找词困难[12];在疾病中后期,患者的语言产出和理解能力进一步减退,语音错误增加,口语流利性显著下降,停顿次数增加且时间延长,语速缓慢,话语重复,有效信息量大幅减少,会话和话题控制能力逐渐降低,甚至丧失交流能力[13,14]。目前,已有多项研究表明,语音生物标记物在筛查阿尔茨海默病方面具有广阔前景。例如,运用深度学习框架构建基于语音生物标记物的阿尔茨海默病患者和正常认知功能人群的区分模型,模型的灵敏度、特异度和准确度均较高[15]。通过语音认知任务(包括阅读段落、图片描述、持续计数和自由交谈)收集和分析语音生物标记物数据,构建基于机器学习方法的区分模型,对区分主观认知障碍与阿尔茨海默病、混合型痴呆、轻度认知障碍等疾病的准确度均较高[16]

(二) 生理症状

语音特征的变化与机体健康状况相关,在预测和分析生理症状(如衰弱、疼痛、疲劳等)方面,语音生物标记物有较广阔的应用前景。衰弱是老年人常见的生理症状。研究表明,老年人的平均零交叉数、局部峰谷变化、第一和第二共振峰频率变化、频谱能量比等声学特征与衰弱具有显著的相关性[17];可量化的语音生物信号特征,如音高、强度、谐波音比等与疼痛强度具有显著的相关性[18]。疲劳会影响个体的语言模式、语速、音调和发音清晰度,而语音生物标记物在检测疲劳状态方面已有初步应用,如通过测量飞行员录音中犹豫、无声停顿、最后音节的延长和音节发音率等语音生物标记物数据可以检测飞行员的疲劳与嗜睡情况[19]

(三) 心理症状和心理障碍

语音生物标记物在心理症状和心理障碍识别方面,具有能够识别难以掩饰的状态、直接表达情感与思想、通过运动和声学变化间接反映神经调节、跨文化适用性等独特优势。鉴于老年人心理症状的发生率高,语音生物标记物在老年人智慧医疗领域应用前景广阔。研究表明,抑郁症患者的基频水平及其范围通常会降低,典型的表现为单调语音;此外,随着抑郁程度的加深,其他声学特征,如颤音、闪烁以及基频的变异性也会增加[20]。对于创伤后应激障碍患者而言,其语音呈现出更加单调、缓慢和平淡的特点,在用语音生物标记物进行分析时,会呈现元音空间调性降低和基频变异性减少等特征[21,22]。针对双相障碍患者的研究发现,患者在躁狂期间长停顿时长和全停顿时长的中位数较健康人群降低,浊音片段率升高;抑郁期的语音表现则相反[23]

(四) 疾病诊断和预后预测

语音生物标记物可以从声学特征、语言学特征和副语言特征等角度挖掘丰富的信息,用于老年人智慧医疗领域的疾病诊断和预后预测。例如,可以创建健康人群和心衰患者的语音数据库,通过提取梅尔频率倒谱系数、声门特征等参数,构建基于不同机器学习算法的心衰诊断模型,其中基于前馈神经网络算法的诊断模型准确性达到0.82[24]。对慢性心衰患者进行声学特征提取,并据此分为4个类别,在随访20个月后发现,4个类别的患者住院风险和死亡风险均有显著差异,表明语音生物标记物在预测心衰患者住院和死亡风险方面具有较大应用前景[25]。通过收集不同呼吸系统疾病患者及健康人群的语音数据,构建疾病诊断模型,提取样本信号的小波包能量、Shannon熵值特征,结果显示基于支持向量机、BP神经网络算法构建的疾病诊断模型准确度分别达到0.84、0.72[26]

三、 国外促进人工智能技术及语音生物标记物在医疗领域应用的情况

(一) 美国

美国重视语音生物标记物的发展,提供了较为明确的政策倾斜和支持。2023年,美国国家科学基金会(NSF)发布了“智能健康与生物医学研究在AI和先进数据科学时代的应用”计划的项目指南,其中包括推进AI/机器学习建模中的公正和可信度,应用AI技术着重满足人们对支持或自动化增强健康、延长寿命、减少疾病、增强社交联系和减少残疾的需求,鼓励研究具有显著计算能力和物理复杂性的机器人系统等内容[27]。2021年,美国国立卫生院(NIH)发布了“Bridge2AI”数据生成项目[28],目的是建立与健康信息相关的大型人类语音数据库,改善患者的健康结局。为此,美国和加拿大的研究人员建立了Bridge2AI语音研究联盟,联盟成员包括临床医生、数据工程师、AI专家、生物伦理学家、语言病理学家、声学工程师和教育工作者等。该联盟聚焦5种疾病类型的数据收集工作:疾病导致的声音障碍,如喉癌、声带麻痹、喉良性病变等;神经退行性疾病,如阿尔茨海默病、帕金森病、中风、肌萎缩性侧索硬化症等;情绪和精神障碍,如抑郁症、精神分裂症、双相情感障碍等;呼吸和循环系统疾病,如肺炎、慢性阻塞性肺病、心力衰竭等;儿童语音和语言障碍,如语音和语言延迟、自闭症等。除对上述疾病类型进行数据收集外,NIH也力求与其他大型团队合作,以获取不同人群的大规模语音数据作为对照。

(二) 日本

日本注重加强对医疗辅助系统和医疗健康数据的监管,希望借助AI技术来改善人口极度老龄化的社会现状。日本发布的“AI战略2022”强调,促进AI驱动的医疗诊断系统研发,开发评估诊断可靠性强的系统。未来,日本将深入推进医疗领域统一数据基础设施的建设,确保数据质量,推动数据合作和标准化,降低数据偏差和AI技术滥用的风险。在促进AI技术的社会应用方面,重点开发保密分布式处理技术,研究多模态联合和跨模态AI技术[29]。《日本复兴战略2016》[30]和《科学技术创新综合战略2016》[31]中提到,关注利用AI开发医疗治疗支持系统,实现健康、医疗、公共服务等的产业结构变革。虽然近年来的政策文件没有具体提及语音生物标记物在医疗领域,尤其是老年人智慧医疗领域应用的问题,但强调了语音AI的通用应用场景以及医疗领域的AI应用和推广。

(三) 德国

作为对德国联邦政府AI战略的更新,德国在2023年发布《人工智能行动计划》,旨在将德国AI发展提升到更高的质量水平[32],其中强调的11个迫切需要采取行动的领域就包括促进AI在医疗领域中的应用,推动其成为惠及全民的社会效益。“德国高技术战略2025”明确提出了未来三大领域的12项使命,其中包括“发展智能医学,用数字联结研究与医疗”“推动AI应用”两项使命[33]。2018年,德国发布“联邦政府AI战略要点”并强调,在数据利用方面,加强政府和科研界数据的开放性并用于AI研究;制定明确的法律框架,重新规范数据的获取与使用;支持国家和私营企业进行数据合作;扩大医疗卫生行业中数据系统的互操作性;支持数据平台之间的互操作,扩大硬件和云服务领域的基础设施建设规模[34]

(四) 澳大利亚

2023年,澳大利亚卫生部宣布将通过“国家关键研究基础设施计划”资助19个项目,旨在推动新兴医疗技术的开发和应用以及医疗卫生前沿研究设施的建设或升级。其中,有8个项目涉及AI技术、大数据、数字健康等[35]。2022年,澳大利亚卫生部发布了2022—2023财年健康与医药领域的预算,其中“医疗研究未来基金”获得的预算经费最多,以用于执行其第二轮10年资助计划[36],涉及的资助方向包括建设和扩大用于健康与医药研究的关键基础设施、开发数字化疗法、可穿戴设备等AI健康干预策略及技术,并促进临床转化等。2021年,澳大利亚工业、科学、能源与资源部发布了AI行动计划,战略目标是推动澳大利亚在开发和采用可信、安全与负责任的AI方面成为全球领先国家[37],其中,在“以前沿AI技术解决澳大利亚面临的各种挑战”重点领域中,涉及资助医学研究相关的AI项目。

四、 我国语音生物标记物研究和应用面临的挑战

(一) 语音保护存在法律空白

使用语音生物标记物的目的是开展与健康变量和结局相关的研究,然而,个体的语音作为一种生物特征,具有听觉上的可识别性,并且与指纹、虹膜、脱氧核糖核酸等生物特征类似,具有较高的稳定性。此外,语音数据采集方便、成本低廉、适用范围广、收益高,这会带来通过语音数据破解个体其他信息的风险。智能语音技术的法律风险包括3个方面[38]:① 技术误差的法律风险。语音数据的挖掘和应用离不开AI算法,而任何技术都不是完美的,依靠生物特征进行比较和识别的算法也存在误差概率。当误差达到一定程度时,相关算法在用于技术侦查、保险认证、税务管理等社会公共事务时,将会对公众造成不必要的骚扰和伤害。② 破解身份认证的法律风险。深度伪造、合成等技术的应用带来了破解身份认证信息的风险。若不对此进行规范,身份认证信息盗用导致的侵权事件将显著增加。③ 信息泄露的法律风险。除智能语音技术的提供方、使用方有意泄露信息之外,还可能存在因技术不完善、计算机存储系统漏洞或被黑客、病毒等入侵而泄露信息的风险。因此,智能语音技术的发展可能使社会治理的风险加大。然而,面对顺应科技进步而来的智能语音技术,我国尚无专门的法律规定;语音生物标记物的医疗领域应用问题也存在法律空白,亟需加以补充。

(二) 语音生物标记物存在伦理和数据安全问题

伦理和数据安全问题是语音生物标记物在老年智慧康养领域应用与发展过程中面临的重大挑战。① 从伦理角度来看,在获取和使用语音生物标记物数据时,需要个体的知情同意。这意味着在收集数据之前,必须向受试者明确解释数据的用途、潜在风险和权益,并获得其明确同意。然而,在实际操作中,确保每个受试者都充分理解并同意这一过程,可能是一项艰巨的任务。② 由于老年人各项身体机能下降和衰弱的特殊性,语音生物标记物的应用还需要考虑数据完整性和可靠性问题。老年人存在的听力下降、口音变化等情况可能会使语音生物标记物数据的准确性受到影响,因此,在收集和使用老年人语音生物标记物数据时,需要采用先进的技术和方法,确保数据的完整性和可靠性。③ 语音数据具有较高的稳定性,隐含身份识别和隐私泄露的风险。随着老龄化问题的加剧,未来养老机构的数量不断增加,语音生物标记物数据的规模将不断扩大,这使得数据泄露和滥用的风险也随之增加,带来数据安全的隐患。④ 语音生物标记物不是单一的变量,从声学特征、语言学特征以及副语言特征等维度解读时,可以解码丰富的信息。这一方面对帮助预测和诊断多种健康问题提供了丰富的数据,另一方面也有可能导致数据滥用,从而对伦理和确保数据安全带来巨大挑战。

(三) 语音生物标记物研究和应用面临人才短缺的挑战

生物标记物在老年智慧医疗领域中的应用面临人才短缺的严峻挑战。语音生物标记物技术的复杂性和精细度要求从业者具备广泛的知识背景和专业技能,涉及医学、老年医学、声学、语言学、AI、大数据等学科和技术,然而,目前缺乏具备这些跨学科知识和技能的复合型人才。语音生物标记物在老年智慧医疗领域应用的潜力广阔,但由于跨学科之间的交流和合作相对较少,使得相关人才的培养和引进变得异常困难。与此同时,语音生物标记物技术的专业性和复杂性使得人才培养周期长、标准更为严格。我国面临着技术应用型人才和科技转化型人才的双重缺口,尤其是前沿语音生物标记物理论研究方面的高层次人才明显缺乏,再加上高校的相关学科设置尚不完善,以至于无法满足社会对这类人才的需求。此外,语音生物标记物技术的研发和应用需要有一批具备相关法律知识与实践经验的专业人才来支撑。随着语音生物标记物技术的不断更新和迭代,医疗行业从业者需要具备持续学习、快速适应新技术和新知识的能力。然而,现有医学教育体系在这方面存在明显不足,导致培养的医学人才难以跟上技术发展的步伐,无法满足老年智慧医疗领域对人才的需求。

(四) 优质、公开的语音生物标记物数字资源稀缺

目前,已有众多语音相关的公开数据资源,如北京希尔贝壳科技有限公司开源的中文普通话数据集AISHELL-1、Voice Bank语料库、DNS Challenge语音和噪音库、NOISEX-92噪音库等。然而,现有语音相关的公开数据库多用于开展语音识别和分析领域的基础研究,如语音识别技术、语音和噪音处理等,鲜有语音数据库共同收集个体特征、健康相关变量及其结局等数据,使研究者难以从语音生物标记物的角度进行语音数据与健康结局的关联规则挖掘。此外,生物标记物数据受文化情境的影响较大,如在欧美文化情境中训练的语音模型可能在我国文化情境中并不适用。因为受谦逊和内敛文化的影响,一个认知功能正常的中国人其语音输出的词频和词汇量在欧美文化情境中的语音模型可能被诊断为轻度认知障碍。因此,即使国际上可以获取语音生物标记物相关的医疗健康领域公开数据库,仍需要构建我国本土的语音生物标记物医疗健康公开数据库,以帮助解决语音生物标记物研究跨文化效度不佳问题。

五、 老年人智慧医疗领域语音生物标记物的重点研究内容

(一) 明确和不断发展老年人语音生物标记物指标体系

语音生物标记物已在老年领域和其他人群领域开展了丰富的原始研究,但语音生物标记物的指标体系范围尚没有明确界定。语音生物标记物的指标通常包括声学特征、语言学特征和副语言特征。声学特征常用的指标包括梅尔频率倒谱系数、梅尔滤波器组、感知线性预测系数等;语言学特征包括总词汇量、词性数量与比例、语法和句法等;副语言特征包括语速、停顿频率、沉默持续时间等。此外,随着新技术和跨学科融合的发展,语音生物标记物的指标体系也会不断发展。未来,需加强跨学科合作,包括但不限于声学、语言学、老年医学、AI等学科,制定语音生物标记物的指标体系,鼓励挖掘和更新语音生物标记物指标体系。

(二) 重视语音生物标记物的设备和工具研发,制定相关研究规范

精准收集语音生物标记物的设备和工具是提高语音生物标记物数据准确性与同质性的重要前提。高校、科研院所和企业需加大对相关设备及工具的研发力度,推动技术创新和产品升级。同时,提高语音生物标记物设备的灵敏度和准确性,准确捕捉老年人的语音信息,并兼顾适老化设计,方便老年人携带或佩戴,为后续数据分析提供可靠的数据来源。此外,规范的研究设计是确保研究内部真实性的重要前提,鉴于目前语音生物标记物领域尚无研究设计和报告规范,未来需加强这方面的研究,制定语音生物标记物相关原始研究的设计清单和报告规范,厘清老年人智慧医疗领域语音生物标记原始研究的特异性条目。

(三) 深化老年人语音特征和语音生物标记物关联健康结局机制的基础研究

充分发挥语音生物标记物在老年人智慧医疗领域中的作用,需要深入研究老年人的语音特征。高校、科研机构和优势企业应加强不同类型老年人语音特征的基础研究,对比分析不同年龄段、不同疾病老年人的语音数据,揭示老年人语音特征与健康状况之间的关系,为语音生物标记物的应用提供理论基础;推动老年医学领域各种疾病的病因学研究,将语言生物标记物纳入老年人疾病和健康问题的诊断标准;通过跨学科研究,探索语音生物标记物关联健康结局潜在机制,包括但不限于脑电、免疫、内分泌等学科。

(四) 加强语音生物标记物相关的健康变量预测模型研究

语音生物标记物可以作为预测变量之一进行与诸多健康结局关联的规则挖掘,如认知功能、生理症状、心理症状、社会功能等。基于机器学习方法开展语音生物标记物多健康变量和结局预测研究,鼓励高校、科研院所和企业合作,共同研发基于语音生物标记物的预测模型,为老年人提供个性化的健康管理建议,并为医疗资源的优化配置提供决策依据。此外,当研究者应用多模态数据共同预测老年人某一健康结局时,可以联合面部表情图像数据和语音数据构建老年人的抑郁症状预测模型、联合步态特征数据和语音数据构建老年人衰弱预测模型等,也可以考虑开展多模态数据融合算法研究,帮助提高预测模型的性能和计算效率。

(五) 推动语音生物标记物辅助疾病诊断和临床决策的研究与应用

语音生物标记物的收集具有成本低廉、操作简单、非侵入性、变量和信息丰富等优势,因此,在辅助疾病诊断方面具有广阔的临床应用前景。医疗机构与研究机构加强合作,共同推动辅助疾病诊断技术的研究与应用。通过收集和分析老年人的语音数据,结合其他临床信息,提高疾病诊断的准确性和效率,为老年人提供更加及时、有效的医疗服务。此外,在临床决策过程中,医生需要综合考虑患者的各种信息,包括病史、检查结果、症状等。基于语音生物标记物的辅助临床决策系统可以为医生提供更加全面、客观的患者信息,帮助医生做出更加科学、合理的决策。行业管理部门和企业需共同推动辅助临床决策系统的研发和应用,完善其功能和性能,为医生提供更有效的支持。

(六) 建立语音生物标记物大型人群队列及数据平台

大型公开数据库对提高研究内部真实性和外部真实性,以及节约研究资源具有重要意义。目前,国际和国内在构建大型语音生物标记物医疗健康公开数据库方面均存在明显空白,应重视构建我国语音生物标记物医疗健康大型人群队列及数据平台。国际上提倡在构建大型公开数据库时遵循“FAIR”原则,即从可发现(Findable)、可访问(Accessible)、可交互(Interoperable)、可重用(Reusable)方面指导和评估科学数据管理实践[39]。国内现有的医疗健康大型队列,如CHARLS、中国慢性病前瞻性队列等可为语音生物标记物队列的构建和维护提供经验。数据平台的构建需要多学科专家团队的参与,因此建立跨学科研究合作平台和机制是推动建立和应用数据平台的重要基础。北京大学医学部通过打造青年科技创新发展平台,便利研究人员在平台上发布研究专长、研究资源、科研合作需求等信息,促进不同学科背景的研究者结成“科研搭子”[40],为语音生物标记物数据平台的构建、维持和充分应用提供参考。

六、 老年人智慧医疗领域语音生物标记物应用的发展建议

(一) 鼓励语音生物标记物相关法律研究及行业标准制定

建议加大对生物识别信息现有立法的解释与完善。《中华人民共和国民法典》第1023条第2款首次规定,对自然人声音的保护参照适用肖像权。至于如何适用该准用性条款,立法者有意对立法作出预先安排,而非法律漏洞。声音作为智能语音技术的研究对象,与肖像相比,长期处在边缘地位。然而,随着智能语音技术的发展,与声音相关的法律问题将增多,亟需从体系化角度解释这一条款以适应智能社会的需求,从而更好地利用和规范智能语音技术,促进语音生物标记物在医疗领域的发展。

建议坚持和守好智能语音技术的法律底线。由于个人生物信息的识别信息敏感度较高,行业管理部门的风险监管应更严格。对智能语音技术发展过程中出现的未知风险,应采取谨慎措施,建立并健全公法与私法一体化的保障体系,提高智能语音技术为人类发展所带来的福利,树立有利于信息社会发展的安全底线。

鼓励行业管理部门和相关社会团体发布语音生物标记物相关的卫生信息行业标准与团体标准,以应对语音生物标记物应用和发展过程中出现的伦理与数据安全问题。完善团体标准的管理机制,如决策机构制定团体标准的规划以及相关政策文件,管理协调机构开展团体标准工作中的管理协调,标准编制机构负责具体团体标准的起草编制等。实现团体标准制定程序的可操作性,根据社会团体的组织架构、行业特点,明确总体原则、划分工作阶段,确定每个阶段的工作主体、工作内容与要求、工作流程、进入下一阶段的条件等。规范团体标准的编制工作,在具备一定的组织机构和相应制度保证的基础上,按照GB/T 1.1以及相关的基础性国家标准的要求,将技术内容转变为标准化的文本。加强团体标准的推广,鼓励相关行业协会进一步转变职能,主动提升适应市场竞争环境的能力和水平,准确把握市场主体的需求。

(二) 注重跨学科人才队伍建设

促进语音生物标记物在医疗领域,尤其是老年人智慧医疗领域的应用,需要声学、语言学、AI、临床医学、老年医学等多学科团队的共同努力。多学科团队的组建和合作需要强有力的激励机制与合理的利益分配作支撑。跨学科人才队伍的建设需要建立完善且覆盖各层次的培养机制。本科层次的教育需增加跨学科通识教育,如医学本科生培养增加AI概述、语音生物标记物在医疗领域中的应用前景等内容,计算机科学本科生的培养增加多模态数据的处理与分析、AI在医疗领域中的应用前景等内容,培养本科生跨学科研究的兴趣、意识和视野。硕士研究生和博士研究生的教育增加必修课中跨学科课程学分的要求,如对拟开展AI与医学交叉研究的医学研究生在培养方案中明确修AI学院专业课的学分,计算机科学的研究生在医院进行一定时长的实习等。增加开展跨学科研究工作的博士后研究岗位,对博士后候选人与博士后合作导师属于不同一级学科背景的情况设置奖励机制,如奖励研究的启动资金等。

(三) 在保障数据安全的前提下推进数据共享

保障语音生物标记物的数据安全,需在遵守法律法规和行业标准的同时,建立严格的数据管理制度,开展规范的伦理审查,强化监管和执法力度,加强技术保障和风险防范,大力发展联邦学习以平衡数据隐私保护和数据共享。联邦学习最早由谷歌公司于2016年提出,用以解决数据隐私保护与机器学习训练之间的冲突[41]。联邦学习作为一种交换模型,可以使多方能够在不交换本地数据的情况下共同训练机器学习模型。此外,在联邦学习中,参与者进行本地模型训练需要消耗本地的计算资源和通信资源,若没有合理的激励机制,参与者可能不参与、消极参与、中途退出。因此,激励机制研究是将联邦学习应用于医疗领域以促进资源分配和管理的重要基础。跨机构联邦学习的激励机制研究往往从高隐私性、数据异质性以及公平性3个方面考虑[42]。鼓励联邦学习平台构建及其激励机制研究,不仅有助于应对AI高速发展时代数据隐私安全的隐患,也有助于对抗数据覆盖人群特征不全面导致的算法偏见。

(四) 优化语音生物标记物大型人群队列及数据平台的管理

2021年发布的《科技计划形成的科学数据汇交 技术与管理规范》(GB/T 39912—2021)强调,推动政府预算资金资助的各级科技计划(专项、基金等)项目将科学数据汇交至我国的20个国家科学数据中心,规范数据汇交管理,促进科学数据的共享和重用。在此背景下,可充分借助国家科学数据中心平台的影响力,促进语音生物标记物大型数据库的使用。语音生物标记物可以在诸多健康变量、结局预测和辅助诊断等方面发挥作用,建议依托和融入国家人口健康科学数据中心的相关平台。语音生物标记物队列需要统一的声音采集设备以保障数据质量,而设备和语音数据收集需要较高的人工成本,这也决定了语音生物标记物数据库需要稳定、充足的资金支持。对数据平台和数据库的资金来源与投入,建议开放多种渠道,在政府资助外,对企业招标、各种基金会和学术组织资助以及社会募捐等其他途径均持积极开放的态度。

参考文献

[1]

国家统计局‍‍. 第七次全国人口普查公报 [EB/OL]‍. (2021-05-11)[2024-05-12]‍. https://www‍.‍gov‍.‍cn/guoqing/2021-05/13/content_5606149‍.htm‍.

[2]

National Bureau of Statistics‍. Bulletin of the seventh national census [EB/OL]‍. (2021-05-12)[2024-05-12]‍. https://www‍.gov‍.cn/guoqing/2021-05/13/content_5606149‍.htm‍.

[3]

中华人民共和国国家卫生健康委员会‍. 2021年我国卫生健康事业发展统计公报 [EB/OL]‍. (2022-07-12)‍[2024-05-12]‍. https://www‍.gov‍.cn/xinwen/2022-07/12/content_5700670‍.htm‍.

[4]

National Health Commission of the People's Republic of China‍. Statistical bulletin on Chinese health care development in 2021 [EB/OL]‍. (2022-07-12)[2024-05-12]‍. https://www‍.gov‍.cn/xinwen/2022-07/12/content_5700670‍.htm‍.

[5]

World Health Organization‍. Life expectancy at birth (years) [EB/OL]‍. (2020-07-20)[2024-05-12]‍. https://data‍.‍who‍.int/indicators/i/90E2E48‍.

[6]

中国健康与养老追踪调查 [EB/OL]‍. (2024-03-20)[2024-05-12]‍. https://charls‍.pku‍.edu‍.cn/‍.

[7]

China health and retirement longitudinal study [EB/OL]‍. (2024-03-20)[2024-05-12]‍. https://charls‍.pku‍.edu‍.cn/‍.

[8]

向运华, 王晓慧‍. 人工智能时代老年健康管理的重塑与聚合 [J]‍. 武汉大学学报(哲学社会科学版), 2020, 73(2): 101‒112‍.

[9]

Xiang Y H, Wang X H‍. On the aggregation and reshaping of health management for the elderly in the age of artificial intelligence [J]‍. Wuhan University Journal (Philosophy & Social Science), 2020, 73(2): 101‒112‍.

[10]

Sara J D S, Orbelo D, Maor E, et al‍. Guess what we can hear—Novel voice biomarkers for the remote detection of disease [J]‍. Mayo Clinic Proceedings, 2023, 98(9): 1353‒1375‍.

[11]

Tracey B, Patel S, Zhang Y, et al‍. Voice biomarkers of recovery from acute respiratory illness [J]‍. IEEE Journal of Biomedical and Health Informatics, 2022, 26(6): 2787‒2795‍.

[12]

Hamdan A L, Jabbour J, Nassar J, et al‍. Vocal characteristics in patients with type 2 diabetes mellitus [J]‍. European Archives of Otorhinolaryngology, 2012, 269(5): 1489‒1495‍.

[13]

Hajjar I, Okafor M, Choi J D, et al‍. Development of digital voice biomarkers and associations with cognition, cerebrospinal biomarkers, and neural representation in early Alzheimer's disease [J]‍. Alzheimer's & Dementia, 2023, 15(1): e12393‍.

[14]

Hartley A, Khamis R‍. Voice biomarkers: The most modern and least invasive tool for coronary assessment? [J]‍. Mayo Clinic Proceedings, 2022, 97(5): 816‒818‍.

[15]

Dashtipour K, Tafreshi A, Lee J, et al‍. Speech disorders in Parkinson's disease: Pathophysiology, medical management and surgical approaches [J]‍. Neurodegenerative Disease Management, 2018, 8(5): 337‒348‍.

[16]

李妍, 周爱红, 赵丽娜, 等‍. 轻度阿尔茨海默病患者自发语言特点研究 [J]‍. 中华神经科杂志, 2019, 52(3): 177‒183‍.

[17]

Li Y, Zhou A H, Zhao L N, et al‍. Features of connected speech in patients with mild Alzheimer's disease [J]‍. Chinese Journal of Neurology, 2019, 52(3): 177‒183‍.

[18]

刘红艳‍. 阿尔茨海默症患者语言障碍研究现状和进展——基于病理语言学的实验研究综述 [J]‍. 外语电化教学, 2020 (5): 11, 72‒78‍.

[19]

Liu H Y‍. Studies on Alzheimer's patients' language impairments—An overview of experimental studies within the framework of pathological linguistics [J]‍. Technology Enhanced Foreign Language Education, 2020 (5): 11, 72‒78‍.

[20]

黄立鹤, 杨晶晶‍. 汉语阿尔茨海默病患者口语非流利性研究 [J]‍. 当代语言学, 2022, 24(2): 192‒207‍.

[21]

Huang L H, Yang J J‍. An analysis of oral non-fluency of Chinese DAT patients [J]‍. Contemporary Linguistics, 2022, 24(2): 192‒207‍.

[22]

Ahn K, Cho M, Kim S W, et al‍. Deep learning of speech data for early detection of Alzheimer's disease in the elderly [J]‍. Bioengineering, 2023, 10(9): 1093‍.

[23]

Konig A, Satt A, Sorin A, et al‍. Use of speech analyses within a mobile application for the assessment of cognitive impairment in elderly people [J]‍. Current Alzheimer Research, 2018, 15(2): 120‒129‍.

[24]

Lin Y C, Yan H T, Lin C H, et al‍. Predicting frailty in older adults using vocal biomarkers: A cross-sectional study [J]‍. BMC Geriatrics, 2022, 22(1): 549‍.

[25]

Tsai F S, Weng Y M, Ng C J, et al‍. Embedding stacked bottleneck vocal features in a LSTM architecture for automatic pain level classification during emergency triage [C]‍. San Antonio: 2017 Seventh International Conference on Affective Computing and Intelligent Interaction (ACII), 2017‍.

[26]

de Vasconcelos C A, Vieira M N, Kecklund G, et al‍. Speech analysis for fatigue and sleepiness detection of a pilot [J]‍. Aerospace Medicine and Human Performance, 2019, 90(4): 415‒418‍.

[27]

Kiss G, Vicsi K‍. Mono- and multi-lingual depression prediction based on speech processing [J]‍. International Journal of Speech Technology, 2017, 20(4): 919‒935‍.

[28]

Marmar C R, Brown A D, Qian M, et al‍. Speech-based markers for posttraumatic stress disorder in US veterans [J]‍. Depression and Anxiety, 2019, 36(7): 607‒616‍.

[29]

Xu R, Mei G, Zhang G F, et al‍. A voice-based automated system for PTSD screening and monitoring [J]‍. Studies in Health Technology and Informatics, 2012, 173: 552‒558‍.

[30]

Guidi A, Schoentgen J, Bertschy G, et al‍. Features of vocal frequency contour and speech rhythm in bipolar disorder [J]‍. Biomedical Signal Processing and Control, 2017, 37: 23‒31‍.

[31]

Kiran Reddy M, Helkkula P, Madhu Keerthana Y, et al‍. The automatic detection of heart failure using speech signals [J]‍. Computer Speech & Language, 2021, 69: 101205‍.

[32]

Maor E, Perry D, Mevorach D, et al‍. Vocal biomarker is associated with hospitalization and mortality among heart failure patients [J]‍. Journal of the American Heart Association, 2020, 9(7): e013359‍.

[33]

陈春凤, 王忆勤, 徐琎, 等‍. 342例肺系疾病患者的语音信号采集和特征分析 [J]‍. 上海医药, 2022, 43(14): 21‒25‍.

[34]

Chen C F, Wang Y Q, Xu J, et al‍. Voice signal acquisition and characteristic analysis of 342 patients with pulmonary diseases [J]‍. Shanghai Medical & Pharmaceutical Journal, 2022, 43(14): 21‒25‍.

[35]

U‍.S‍. National Science Foundation‍. NSF 23-614: Smart health and biomedical research in the era of artificial intelligence and advanced data science (SCH) [EB/OL]‍. (2023-08-14)[2024-05-12]‍. https://www‍.nsf‍.gov/pubs/2023/nsf23614/nsf23614‍.htm‍.

[36]

National Institutes of Health‍. Data generation projects for the NIH bridge to artificial intelligence (Bridge2AI) program (OT2) [EB/OL]‍. (2021-05-13)[2024-05-12]‍. https://commonfund‍.nih‍.gov/sites/default/files/OT2-Data-Generation-Projects-B2AI-051321-508‍.pdf‍.

[37]

惠仲阳, 杨况骏瑜‍. 日本发布《人工智能战略2022》 [EB/OL]‍. (2022-09-27)[2024-05-12]‍. http://www‍.‍casisd‍.‍cn/zkcg/ydkb/kjzcyzxkb/2022/zczxkb202206/202209/t20220927_6517785‍.html‍.

[38]

Hui Z Y, Yang K J Y‍. Japan releases artificial intelligence strategy 2022 [EB/OL]‍. (2022-09-27)[2024-05-12]‍. http://www‍.casisd‍.cn/zkcg/ydkb/kjzcyzxkb/2022/zczxkb202206/202209/t20220927_6517785‍.html‍.

[39]

The Japanese Cabinet‍. Japan revitalization strategy 2016 [EB/OL]‍. (2016-06-02)[2024-05-12]‍. https://www‍.kantei‍.go‍.jp/jp/singi/keizaisaisei/pdf/2016_hombun1_e‍.pdf‍.

[40]

胡智慧‍. 日本科学技术创新综合战略2016提出五大政策措施 [EB/OL]‍. (2016-08-02)[2024-05-12]‍. http://www‍.casisd‍.cn/zkcg/ydkb/kjzcyzxkb/2016/201608/201703/t20170330_4768733‍.html‍.

[41]

Hu Z H‍. Japanese comprehensive strategy for science, technology and innovation 2016 proposes five major policy measures [EB/OL]‍. (2016-08-02)[2024-05-12]‍. http://www‍.casisd‍.cn/zkcg/ydkb/kjzcyzxkb/2016/201608/201703/t20170330_4768733‍.html‍.

[42]

葛春雷‍. 德国发布《人工智能行动计划》 [EB/OL]‍. (2023-11-20)[2024-05-12]‍. http://www‍.‍casisd‍.‍cn/zkcg/ydkb/kjzcyzxkb/2023/zczxkb202310/202311/t20231120_6934950‍.html‍.

[43]

Ge C L‍. Germany releases artificial intelligence action plan [EB/OL]‍. (2023-11-20)[2024-05-12]‍. http://www‍.casisd‍.cn/zkcg/ydkb/kjzcyzxkb/2023/zczxkb202310/202311/t20231120_6934950‍.html‍.

[44]

葛春雷‍. "德国高技术战略2025"明确未来三大领域12项使命 [EB/OL]‍. (2018-11-13)‍[2024-05-12]‍. http://www‍.casisd‍.cn/zkcg/ydkb/kjzcyzxkb/2018/kjzczx201811/201811/t20181113_5170584‍.html‍.

[45]

Gu C L‍. "German high-tech strategy 2025" defines 12 missions in three major fields for the future [EB/OL]‍. (2018-11-13)[2024-05-12]‍. http://www‍.casisd‍.cn/zkcg/ydkb/kjzcyzxkb/2018/kjzczx201811/201811/t20181113_5170584‍.html‍.

[46]

葛春雷‍. 德国联邦政府通过AI战略要点文件 [EB/OL]‍. (2018-09-07)[2024-05-12]‍. http://www‍.casisd‍.cn/zkcg/ydkb/kjzcyzxkb/2018/zczxkb201809/201809/t20180907_5065796‍.html‍.

[47]

Ge C L‍. The German federal government adopts a key document on artificial intelligence strategy [EB/OL]‍. (2018-09-07)‍[2024-05-12]‍. http://www‍.casisd‍.cn/zkcg/ydkb/kjzcyzxkb/2018/zczxkb201809/201809/t20180907_5065796‍.html‍.

[48]

Ministers Department of Health and Aged Care‍. $73 million for new medical technology and research facilities [EB/OL]‍. (2023-06-26)[2024-05-12]‍. https://www‍.health‍.gov‍.au/ministers/the-hon-mark-butler-mp/media/73-million-for-new-medical-technology-and-research-facilities?language=en‍.

[49]

Australian Government Department of Health and Aged Care‍. Budget 2022-23: Investments in life-saving health and medical research [EB/OL]‍. (2022-04-04)[2024-05-12]‍. https://www‍.health‍.gov‍.au/news/mrff-budget-2022-23-investments-in-life-saving-health-and-medical-research‍.

[50]

Australian Government Department of Industry, Science and Resources‍. Australia's artificial intelligence action plan [EB/OL]‍. (2021-08-18)[2024-05-12]‍. https://www‍.industry‍.gov‍.au/data-and-publications/australias-artificial-intelligence-action-plan‍.

[51]

姜晓华‍. 智能语音技术的法律规制研究 [J]‍. 学术探索, 2023 (4): 67‒72‍.

[52]

Jiang X H‍. Research on legal regulation of intelligent sound technology [J]‍. Academic Exploration, 2023 (4): 67‒72‍.

[53]

Wilkinson M D, Dumontier M, Aalbersberg I J, et al‍. The FAIR guiding principles for scientific data management and stewardship [J]‍. Scientific Data, 2016, 3: 160018‍.

[54]

梁丹, 李佳佳‍. 如何让青年教师快步走上科研路——北大医学部打造青年科技创新发展平台的实践 [ N]‍. 中国教育报, 2024-01-19(03)‍.

[55]

Liang D, Li J J‍. How to enable young faculties to quickly embark on the path of scientific research—The practice of Peking University Health Science Center in building a technological innovation and development platform for young faculties [N]‍. China Education Daily, 2024-01-19(03)‍.

[56]

McMahan H B, Moore E, Ramage D, et al‍. Communication-efficient learning of deep networks from decentralized data [EB/OL]‍. (2023-01-26)[2024-02-20]‍. http://arxiv‍.org/abs/1602‍.05629v4‍.

[57]

王鑫, 黄伟口, 孙凌云‍. 跨机构联邦学习的激励机制综述 [J]‍. 计算机科学, 2024, 51(3): 20‒29‍.

[58]

Wang X, Huang W K, Sun L Y‍. Survey of incentive mechanism for cross-silo federated learning [J]‍. Computer Science, 2024, 51(3): 20‒29‍.

基金资助

中国工程院咨询项目“应对人口老龄化国家战略相关问题研究”(2022-XBZD-30)

AI Summary AI Mindmap
PDF (657KB)

5101

访问

0

被引

详细

导航
相关文章

AI思维导图

/