AI模型也会变老？「失智症」检测不及格... 有认知受损迹象-北美情报站-综合华人便民生活服务平台

HILOVEYOUTU 发表于 2025-2-16 23:49:18

AI模型也会变老？「失智症」检测不及格... 有认知受损迹象

https://pgw.worldjournal.com/gw/photo.php?u=https://uc.udn.com.tw/photo/wj/realtime/2025/02/17/31508665.jpg&x=0&y=0&sw=0&sh=0&sl=W&fw=800&exp=3600&q=75新近研究显示，大型语言模型和聊天机器人等AI技术，也会因为老旧，有认知能力受损的表现。这意味AI距离取代真人医生还有一段路; 示意图。（路透）根据英国医学期刊（BMJ）2024年12月20日刊出的研究论文，大型语言模型（LLM）和聊天机器人等人工智能（）技术，也像人一样，会因为年龄，出现认知能力退化的迹象。这表示，即使医疗诊断愈来愈常仰赖AI，在肉眼明显察觉之前，快速有效地从病历、X光片和其他资料里发现异常，但AI还不能很快地取代真人医生。
科学家使用「蒙特娄认知评估」（MoCA）来测试市面上公开的、由LLM驱动的聊天机器人，包括OpenAI的、Anthropic的Sonnet，以及Alphabet的Gemini。 MoCA是专用来老年人早期痴呆或认知受损的工具，满分30分，人类受测者26分以上代表合格，认知无障碍。

对大多数LLM来说，它们在命名、专注力、语言能力和抽象概念等测试的某些方面看起来很轻松，但在视觉空间建构和执行功能的表现都不好，有几个在延迟记忆比其他LLM表现更差。
至关重要的是，虽然ChatGPT最新版本（第4版）得分最高（30分里获26分），但较旧的Gemini 1.0仅得16分，导致了较旧LLM出现认知能力衰退迹象的结论。
这些发现挑战了AI将很快取代人类医生的假设。具体而言，研究作者反对在需要视觉抽象思维和执行功能的任务中使用AI，「领先的聊天机器人身上认知能力受损明显，可能影响它们进行医疗诊断的可靠性，并削弱患者信心。」
根据研究作者，他们的发现仅仅是观察性的，AI与人类心智运作方式的关键差异意味实验无法构成直接的比较。但他们警告说，这可能是给AI临床医学应用踩煞车的「重大弱点」。点击下面文字可快速查看或发布对应的便民信息！纽约情报站让您的生活变的更简单:hug:电召车 :hug:顺风拼车:hug:汽车买卖 :hug:便捷搬家:hug:招聘求职 :hug:店铺转让:hug:房屋出售 :hug:商家黄页简介：纽约情报站是汇集全美75万粉丝的公众平台。除了实时新闻、找工招工信息发布、app社区互动，更有微信公众号推文探店等。如果你投稿、爆料、活动策划、商务合作，或者想邀请我们去探店，请联系主编微信： nyinfor

页: [1]

北美情报站-综合华人便民生活服务平台's Archiver

AI模型也会变老？ 「失智症」检测不及格... 有认知受损迹象

AI模型也会变老？「失智症」检测不及格... 有认知受损迹象