這個AI的聲音是如此現實,以至於他們擔心用戶

芝麻是一家位於舊金山的初創企業,剛剛推出了一種史無前例的現實主義的人造語音技術。人工智能(AI)的這一進步引起了第一批用戶的熱情,有些報導在與系統的互動過程中感到“不安”。

2025年2月27日,芝麻介紹了他的對話演講模型,即近一百萬小時的英語音頻數據培訓的成果。現在,公眾可以通過公司的搜索博客訪問兩個IA,Maya和Miles角色。該技術旨在達到芝麻稱之為“人聲形象”,這種聲音的質量如此自然,以至於人類的聲音無法區分。

芝麻由Oculus的聯合創始人Brendan Iribe創立,將他的努力集中在四個關鍵方面:情緒智力,對話動態,上下文意識和人格連貫性。目標是像人類一樣與自然和流體的計算機建立聲帶互動。

- 這個人工智能可以從錄製的幾秒鐘來模仿您的聲音,這令人恐懼

對這項創新的混合反應

該行業中用戶和專家的反應分享了。 The Verge的Sean Hollister稱這項技術為“我想多次講話的第一聲助手”。 Shopify首席執行官Tobi Lutke公開稱讚這項創新是“絕對令人難以置信的”。但是,一些用戶,例如來自PCWorld的Mark Hachman,報告了面對這些人造聲音令人不安的現實主義的不適感。

芝麻計劃將這種聲音技術與輕型AI眼鏡聯繫起來,從而“可實現能夠與您一起觀察世界的同伴的實用訪問”。這種觀點提出了有關我們日常生活中AI無處不在的疑問。

該技術的潛在應用很大,從改進到語言學習中心。芝麻計劃將支持擴展到20多種語言,並在Apache 2.0許可下製作某些關鍵組件。芝麻的突破表明,以聲音為中心的界面可以定義下一波男式相互作用,無論好壞。