ChatGPT,著名的生成人工智慧,已經過其診斷兒科病例的能力的測試。結果並不樂觀,特別是對於影響兒童的疾病。

本週在《美國醫學會兒科雜誌》上發表的一項研究表明,ChatGPT-4、最新版本的聊天機器人在診斷 100 例罕見病例時,準確率僅為 17%。這一比率遠低於 ChatGPT-3 在去年類似測試中獲得的 39% 的準確率。
這項研究由紐約科恩兒童醫學中心的研究人員領導,強調了使用人工智慧聊天機器人進行複雜診斷的局限性和挑戰,特別是對於兒童。研究人員強調,兒科病例需要更多關注患者的年齡和發展階段,以及更多的溝通技巧,以從兒童或其父母引出症狀。
研究人員使用了2013 年至2023 年間發表在《JAMA Pediatrics》和《NEJM》上的100 個兒科病例。推理。研究人員將病例文字轉發給 ChatGPT 並要求其提供診斷。然後,兩名醫生兼研究人員評估了聊天機器人的反應,並將其評為正確、不正確或部分正確。
ChatGPT僅在17個案例中正確,在72個案例中錯誤,在11個案例中部分正確。部分正確的病例是指 ChatGPT 給出的診斷與正確的診斷相關,但過於模糊或籠統而不能被認為是準確的。
研究人員也注意到ChatGPT 很難辨識人類醫師很容易辨識的不同病理之間的關係。例如,ChatGPT 未能將自閉症和壞血病聯繫起來,這兩種疾病都與維生素 C 缺乏有關,ChatGPT 也犯了與同一器官系統相關的錯誤,例如混淆了腎結石和腎癌。
研究人員建議,ChatGPT 可以透過使用醫學文字進行訓練並存取更多即時醫療資料來提高其效能。我們已經能夠看到AI 成功診斷出 17 名醫生未能識別的疾病,所以幾年內AI變得比一些醫生更能幹也不是沒有可能。
詢問我們最新的!
據爆料者 Ice Universe 透露,三星將藉用 Google Pixels 的一項非常有用且獨有的功能,將其添加到 Galaxy 智慧型手機上的 One UI 7 中。這就是它的內容。選擇 Google 的 Pixel 智慧型手機是…
三星