[返回网际谈兵首页]·[所有跟帖]·[ 回复本帖 ] ·[热门原创] ·[繁體閱讀]·[版主管理]
重大突破!ChatGPT首次通过神经科考试
送交者: 爷来也[♂★★倚剑走天涯★★♂] 于 2023-12-12 4:36 已读 928 次  

爷来也的个人频道

OpenAI公司旗下最新研发的大型语言模型ChatGPT 4.0已通过临床神经学考试,在概念验证研究中回答了85%的正确答案。研究作者认为,经过一些微调,ChatGPT就可以在临床神经病学中具有“重大应用”。当前,人工智能(AI)已在为阿斯利康寻找癌症治疗方法,还有对抗香港抗生素的过度处方。

  这项实验结果由海德堡大学医院和海德堡德国癌症研究中心的一组研究人员于12月7日发布,该测试于5月31日进行,测试对象包括两个大型语言模型,即ChatGPT 3.5及其更高版本ChatGPT 4.0。

  研究人员使用了美国精神病学和神经病学委员会的神经病学考试题库,以及欧洲神经病学委员会的一小部分问题。

6park.com

  旧版本的ChatGPT得分为66.8%,正确回答了1956个问题中的1306个问题,而较新的版本ChatGPT 4.0得分为85%,正确答案为1662个。


  值得关注的是,普通人类平均得分为73.8%。这意味着,ChatGPT 4.0的能力已超越了人类平均。

  ChatGPT 4.0在行为、认知和心理相关问题上的表现优于人类用户,并有效“通过”了神经学考试,因为70%的正确答案通常被教育机构视为及格分数。

  然而,这两种模型在需要“高阶思维”的任务中的表现,都比仅需要“低阶思维”的问题表现得更弱。

  根据进行实验的研究人员小组的说法,这些结果可以作为在一些修改后在临床神经病学中使用ChatGPT的建议。 6park.com


他们指出:“这些发现表明,通过进一步完善,大型AI语言模型可以在临床神经病学中具有重要的应用。”

  研究人员指出,目前仍存在一些保留意见。尽管在文档和决策支持系统中应用ChatGPT有一个明确的前景,但神经学家应该谨慎对待它们在实践中的使用,因为它们在高阶认知任务方面仍然不完善。 6park.com


该研究的作者之一Varun Venkataramani博士在接受采访时表示:“我们将目前的研究更多地视为对ChatGPT能力的概念验证。”

  “AI语言模型仍然需要发展,甚至可能需要进行具体的微调,以使其正确适用于临床神经病学,”他补充道。

  实际上,当前AI已经在致力于医疗保健领域的一些重大任务,例如为阿斯利康寻找癌症治疗方法,或是对抗香港抗生素的过度处方。

喜欢爷来也朋友的这个贴子的话, 请点这里投票,“赞”助支持!
[举报反馈]·[ 爷来也的个人频道 ]·[-->>参与评论回复]·[用户前期主贴]·[手机扫描浏览分享]·[返回网际谈兵首页]
帖子内容是网友自行贴上分享,如果您认为其中内容违规或者侵犯了您的权益,请与我们联系,我们核实后会第一时间删除。

所有跟帖:        ( 主贴楼主有权删除不文明回复,拉黑不受欢迎的用户 )


用户名:密码:[--注册ID--]

标 题:

粗体 斜体 下划线 居中 插入图片插入图片 插入Flash插入Flash动画


     图片上传  Youtube代码器  预览辅助

手机扫描进入,浏览分享更畅快!

楼主本栏目热帖推荐:

>>>>查看更多楼主社区动态...






[ 留园条例 ] [ 广告服务 ] [ 联系我们 ] [ 个人帐户 ] [ 版主申请 ] [ Contact us ]