HILOVEYOUTU 发表于 2025-2-16 23:49:18

AI模型也会变老? 「失智症」检测不及格... 有认知受损迹象

https://pgw.worldjournal.com/gw/photo.php?u=https://uc.udn.com.tw/photo/wj/realtime/2025/02/17/31508665.jpg&x=0&y=0&sw=0&sh=0&sl=W&fw=800&exp=3600&q=75新近研究显示,大型语言模型和聊天机器人等AI技术,也会因为老旧,有认知能力受损的表现。 这意味AI距离取代真人医生还有一段路; 示意图。 (路透)根据英国医学期刊(BMJ)2024年12月20日刊出的研究论文,大型语言模型(LLM)和聊天机器人等人工智能()技术,也像人一样,会因为年龄,出现认知能力退化的迹象。 这表示,即使医疗诊断愈来愈常仰赖AI,在肉眼明显察觉之前,快速有效地从病历、X光片和其他资料里发现异常,但AI还不能很快地取代真人医生。
科学家使用「蒙特娄认知评估」(MoCA)来测试市面上公开的、由LLM驱动的聊天机器人,包括OpenAI的、Anthropic的Sonnet,以及Alphabet的Gemini。 MoCA是专用来老年人早期痴呆或认知受损的工具,满分30分,人类受测者26分以上代表合格,认知无障碍。

对大多数LLM来说,它们在命名、专注力、语言能力和抽象概念等测试的某些方面看起来很轻松,但在视觉空间建构和执行功能的表现都不好,有几个在延迟记忆比其他LLM表现更差。
至关重要的是,虽然ChatGPT最新版本(第4版)得分最高(30分里获26分),但较旧的Gemini 1.0仅得16分,导致了较旧LLM出现认知能力衰退迹象的结论。
这些发现挑战了AI将很快取代人类医生的假设。 具体而言,研究作者反对在需要视觉抽象思维和执行功能的任务中使用AI,「领先的聊天机器人身上认知能力受损明显,可能影响它们进行医疗诊断的可靠性,并削弱患者信心。」
根据研究作者,他们的发现仅仅是观察性的,AI与人类心智运作方式的关键差异意味实验无法构成直接的比较。 但他们警告说,这可能是给AI临床医学应用踩煞车的「重大弱点」。点击下面文字可快速查看或发布对应的便民信息!纽约情报站让您的生活变的更简单:hug:电召车 :hug:顺风拼车:hug:汽车买卖 :hug:便捷搬家:hug:招聘求职 :hug:店铺转让:hug:房屋出售 :hug:商家黄页简介:纽约情报站是汇集全美75万粉丝的公众平台。除了实时新闻、找工招工信息发布、app社区互动,更有微信公众号推文探店等。如果你投稿、爆料、活动策划、商务合作,或者想邀请我们去探店,请联系主编微信: nyinfor

页: [1]
查看完整版本: AI模型也会变老? 「失智症」检测不及格... 有认知受损迹象