微軟研究人員團隊提出了一種新的人工智慧,它比著名的 ChatGPT 更通用。它不僅能夠回答文字問題,還可以分析和處理圖像。

在一篇題為「語言並不是您所需要的一切:調整感知和語言模式»(語言並不是您所需要的一切:使感知與語言模型一致),微軟研究人員展示了 Kosmos-1。正如他們在論文引言中指出的那樣,「語言、多模態感知、行動和世界建模的巨大融合是邁向通用人工智慧的關鍵一步」。
我們知道微軟非常欣賞ChatGPT,因此向聊天機器人的設計者OpenAI投資了數十億美元。該公司的雷德蒙德希望將這項發明整合到其多個軟體中。該公司的搜尋引擎 Bing 使用 GPT 3.5,這是 ChatGPT 使用的語言模型的演進。但這家雷德蒙公司並不打算就此止步。真正的通用人工智慧將無法僅僅理解文字。她一定能夠解釋圖像及其上下文,或理解聲音訊號。換句話說,它必須像人類一樣利用五種感官。
Kosmos-1將繼承ChatGPT,它可以理解文字和圖像
這微軟推出的新人工智慧, 能夠做到與 ChatGPT 相同,等等。事實上,Kosmos-1 不僅僅是一個對話代理。據其創造者稱,「它取得了令人印象深刻的性能在語言理解和生成、多模態對話、圖像字幕、視覺問答和視覺任務(例如根據文字指令進行分類)方面。

因此,我們離著名的通用人工智慧概念越來越近了。,它將能夠在所有智力任務中取代人類。我們該為此感到高興還是憂慮呢?有一點是肯定的,那就是人工智慧已經在擾亂我們的社會。