ChatGPT 的創建者 OpenAI 剛剛推出了一個引人注目的新型生成視訊模型,名為 Sora,它可以將簡短的文字描述轉換為詳細的影片剪輯。以下是我們對他的了解。
雖然Google剛發布了新的 Gemini 1.5 AI,但 OpenAI 立即推出了其首款功能強大的工具 Sora 進行反擊將文字轉換為視頻d'最長持續時間為一分鐘。Sora 不僅僅是數位工具箱中的另一個應用程序,而且似乎是創作者和公眾未來的象徵。
事實上,我們離提出的結果還很遠Runway AI,另一種能夠產生影片的技術幾秒鐘的相當模糊、斷斷續續、扭曲,有時甚至令人不安。
OpenAI 將其新系統命名為 Sora,日文單字的意思是“夏爾」。據報道,該技術背後的團隊,包括研究人員蒂姆·布魯克斯和比爾·皮布爾斯,選擇這個名字是因為“喚起無限創造潛能的想法»。
OpenAI 分享了一些由其新人工智慧產生的影片片段,至少可以說,結果是驚人的。在其中一張上,我們可以讀到以下請求:“美麗的雪城東京正如火如荼地進行著。鏡頭沿著繁忙的城市街道移動,跟著幾個人享受美麗的雪天並在附近的攤位購物。美麗的櫻花花瓣隨著雪花在風中飛舞」。根據要求,生成的影片發生在東京的街道上,並清楚地表明:Sora 學會了物體如何在 3D 中組合在一起。然後鏡頭深入場景,跟蹤一對夫婦走過一排商店。
OpenAI 工具的影片比其他現有工具提供的影片更有說服力,即使我們有時仍然會注意到一些小缺陷。在其中一張照片上,我們看到一名婦女在街上行走,我們注意到例如在一些圖像中,他的腿沒有正確跟隨運動。
另請閱讀–OpenAI 真的想用正在開發的新搜尋引擎殺死 Google
Sora 尚未對所有人開放
目前,Sora 仍處於開發階段,因此尚未向公眾開放。然而,OpenAI 已經與某些學者和其他研究人員共享了該工具,他們將把它提交給「紅隊」。這是一小群人,他們負責研究濫用它的所有方法,目的是了解此類技術所帶來的危險。
可以肯定的是,OpenAI 必須找到一種方法來確保他們的影片不被用於傳播錯誤訊息,因為我們認為有些人可能會喜歡製作可能引起爭議的假影片。本月早些時候,OpenAI 宣佈在其 DALL-E 3 文字到圖像轉換工具中添加浮水印,但表示它們可以「輕鬆刪除」。因此,我們希望該公司正在研究一種新方法,以確保其假影片易於識別。
OpenAI 也提供精選視覺藝術家、設計師和電影製作人的回饋。她指出,現有模型可能無法準確模擬複雜場景的物理原理,並且可能無法正確解釋某些因果關係的情況,這就是為什麼該技術在得到更廣泛應用之前仍需成熟。
詢問我們最新的!
2024 年最好的智慧型手機是什麼?有幾種型號正在競爭中,完全值得在我們的選擇中佔有一席之地。想要讓智慧型手機脫穎而出非常困難,因為需要考慮很多標準。系統、電源、...
智慧型手機購買指南