OpenAI推出声音克隆新技术：15秒复刻你的声音

阿菜热点要闻 2024-03-31 18:48:02

OpenAI最新推出的Voice Engine技术可谓是一项颠覆性的技术创新！只需15秒的音频样本，就能够复刻出与原始说话者极为相似的声音，而且还能表达丰富的情感，听起来非常自然逼真。这种技术的研发始于2022年，如今已经成功应用于公司现有的文本转语音API和Read Aloud功能中的预设语音。

据悉，Voice Engine技术不仅在阅读辅助和语言翻译方面具有巨大潜力，能够提供更为自然的语音输出，增强用户体验，而且对于言语障碍患者来说更是一大福音。在布朗大学的一个试点项目中，这项技术已经成功用于创建从学校项目录制的音频中提取的语音克隆，为言语障碍学生提供了有效帮助。

然而，考虑到合成语音技术可能存在的滥用风险，OpenAI目前仅对少数可信合作伙伴开放小规模测试。通过这种方式，公司旨在深入了解技术的潜在应用，并评估可能带来的风险。同时，为了确保技术的安全使用，OpenAI还采取了一系列安全措施，包括使用水印技术追踪音频来源，以及对系统的使用方式进行主动监控。

未来，当Voice Engine技术正式推向市场时，OpenAI将设立一个“禁止语音列表”，以检测并阻止与名人声音过于相似的人工智能生成声音，从而避免潜在的版权和隐私问题。通过这一举措，公司希望引发社会对合成语音负责任部署的广泛讨论，共同探索如何适应这一新型技术的发展。