芝麻是一家位于旧金山的初创企业,刚刚推出了一种史无前例的现实主义的人造语音技术。人工智能(AI)的这一进步引起了第一批用户的热情,有些报道在与系统的互动过程中感到“不安”。
2025年2月27日,芝麻介绍了他的对话演讲模型,即近一百万小时的英语音频数据培训的成果。现在,公众可以通过公司的搜索博客访问两个IA,Maya和Miles角色。该技术旨在达到芝麻称之为“人声形象”,这种声音的质量如此自然,以至于人类的声音无法区分。
芝麻由Oculus的联合创始人Brendan Iribe创立,将他的努力集中在四个关键方面:情绪智力,对话动态,上下文意识和人格连贯性。目标是像人类一样与自然和流体的计算机建立声带互动。
读- 这个人工智能可以从录制的几秒钟来模仿您的声音,这令人恐惧
对这项创新的混合反应
该行业中用户和专家的反应分享了。 The Verge的Sean Hollister称这项技术为“我想多次讲话的第一声助手”。 Shopify首席执行官Tobi Lutke公开称赞这项创新是“绝对令人难以置信的”。但是,一些用户,例如来自PCWorld的Mark Hachman,报告了面对这些人造声音令人不安的现实主义的不适感。
芝麻计划将这种声音技术与轻型AI眼镜联系起来,从而“可实现能够与您一起观察世界的同伴的实用访问”。这种观点提出了有关我们日常生活中AI无处不在的疑问。
该技术的潜在应用很大,从改进到语言学习中心。芝麻计划将支持扩展到20多种语言,并在Apache 2.0许可下制作某些关键组件。芝麻的突破表明,以声音为中心的界面可以定义下一波男式相互作用,无论好坏。