Chatgpt在诊断医疗状况方面确实很糟糕

   日期:2025-06-14     来源:本站    作者:admin    浏览:66    
核心提示:一项新的研究显示,Chatgpt的医学诊断不到一半的时间。科学家问 人工智能 (AI)聊天机器人评估医学网站Medscape的150个案例研究

一项新的研究显示,Chatgpt的医学诊断不到一半的时间。

科学家问 人工智能 (AI)聊天机器人评估医学网站Medscape的150个案例研究,并发现GPT 3.5(2022年推出时为CHATGPT提供动力)仅给出了49%的时间。 

先前的研究表明聊天机器人可以 刮擦通行证 在美国医学许可考试(USMLE)—这一发现被其作者称为“ AI成熟的著名里程碑”。 

但是在新的研究中,于7月31日在《杂志》上发表 PLOS一个,科学家警告不要依靠聊天机器人来进行需要人类辨别的复杂医疗案例。

“如果人们害怕,困惑或无法获得护理,他们可能会依靠一种工具,该工具似乎为他们提供了'量身定制'的医疗建议,”高级研究作者 Amrit Kirpalani博士,安大略省西部大学的舒利希医学院和牙科学院的小儿肾脏病医生告诉Live Science。“我认为,作为一个医学界(以及在更大的科学界),我们需要积极主动地教育普通人群有关这些工具在这方面的局限性。他们还不应该取代您的医生。”

Chatgpt分配信息的能力基于其培训数据。从存储库中刮擦 常见的爬网,供2022型型号的570千兆字节的文本数据总计约3000亿个单词,这些单词是从书籍,在线文章,Wikipedia和其他网页中获取的。 

有关的: 有偏见的AI可以使医生的诊断降低准确

AI系统以他们经过培训的单词来预测可能随后的内容,使他们能够为提示或问题提供答案。从理论上讲,这使他们对医学生和寻求简化的复杂医疗问题答案的患者有帮助,但机器人倾向于“幻觉”—完全做出回应 —限制了它们在医学诊断中的用处。

为了评估Chatgpt医疗建议的准确性,研究人员通过150种不同的案例研究及其模型介绍了该模型;包括患者病史,从实验室&Mdash拍摄的体格检查结果和图像;旨在挑战学员医生的诊断能力。聊天机器人选择了四个多项选择结果之一,然后响应其诊断和研究人员的准确性和清晰度。 

结果表现不足,而Chatgpt的响应却多于医疗准确性,而这是52%的时间。尽管如此,聊天机器人的总体准确性要高得多,为74%,这意味着它可以识别和丢弃错误的多项选择答案。

研究人员说,这种表现不佳的原因可能是AI在一个足够大的临床数据集中受过训练,这使其无法通过多次测试进行兼顾的结果,并避免像人类医生那样有效地处理绝对。

尽管存在缺点,但研究人员说,AI和聊天机器人对于教患者和学员的医生&Mdash仍然有用。前提是AI系统受到监督,并且他们的宣告伴随着一些健康的事实检查。

“如果您回到1995年左右的医学杂志出版物,您会发现'万维网都在发生同样的话语。有一些有关有趣用例的新出版物,并且关于这是否只是一种时尚的论文也持怀疑态度。”基尔帕拉尼说。“我认为特别是在AI和聊天机器人中,医学界最终会发现,增加临床决策,简化行政任务并增强患者参与的潜力很大。”

 
打赏
 
更多>同类资讯

推荐图文
推荐资讯
点击排行