
Image by Catherine Breslin from Unsplash
AI帮她在癌症后恢复声音,但覆盖范围仍然遥不可及
生成性AI语音技术使Sonya Sotinsky在癌症手术后失声的情况下能够再次发声。
赶时间?以下是重点小结:
- 她使用AI通过预先录制的样本重新创造了自己的声音。
- AI语音通过一款名为Whisper的文本转语音应用程序进行部署。
- 她每月支付99美元用于她的AI语音,并现在主张更广泛的访问权限。
被诊断出患有四期舌癌后,Sonya Sotinsky 进行了一次挽救生命的手术,切除了她的舌头、喉头和声带。这个手术使她失去了说话的能力,但她找到了保持说话能力的方法。
索廷斯基在被诊断和手术之间的五周期间开始了声音银行。她录制自己说日常短语和读儿童书籍,保留了她独特的语调和讽刺的表达方式。
“你的声音就是你的身份,”她对NPR说,这个故事最初是由它报道的。“当你不能使用你的声音时,这真的非常非常令人沮丧,”她补充说。
在她于2022年初进行手术时,当时可用的语音技术是非常有限和机械化的。此外,由于她没有舌头,标准的电子喉器对她来说并不起作用。
但到了2024年中期,生成式AI的进步使得复制自然人声的精度大大提高。美国国家公共广播公司报道,一家AI公司使用她的备用录音开发了一个定制的语音模型。这使她的手机上的Whisper应用程序可以实现文字转语音的功能。
这个结果令人震惊。她的女儿,Ela Fuentevilla,描述了那一刻:“她找回了她的活力[…]这简直太相似了,”她在NPR上说。
然而,这种程度的声音恢复是要付出个人代价的。NPR报道,最初的辅助语音技术让Sotinsky花费了3000美元。现在,她每月要花费99美元来持续使用。
健康保险公司,亚利桑那州的蓝十字蓝盾,拒绝承担这项费用。NPR报道称,他们辩称辅助通讯工具并不符合他们对医疗必需品的标准。
这并不是人工智能在恢复语音方面发挥作用的第一次。今年早些时候,拉德堡大学和乌得勒支大学医学中心的科学家开发了一种脑植入物,可以将神经信号转化为实时的、自然 sounding的语音。这种AI模型在短短80毫秒内就能解码脑波,甚至可以使用受伤前的录音复制病人原来的声音。
NPR报道,索廷斯基暂时放下自己的职业,开始倡导语音银行和改善对AI基础工具的访问。她与希望临床试验能帮助使这种技术更易获得的研究人员合作,最终使其有可能得到保险覆盖。