谷歌医疗版ChatGPT已在诊所实测 多个指标和真人医生相当
【太平洋科技资讯】据《华尔街日报》爆料,早在今年4月,Med-PaLM 2就开始在多家诊所内测试,其工作范围覆盖回答医疗问题、总结文件或处理医疗大数据等。
谷歌曾经表示,在医疗领域,Med-PaLM 2的效果优于Bard、Bing、ChatGPT等通用大模型。
那Med-PaLM 2能力到底如何呢?
Med-PaLM 2是基于谷歌当下最先进的大语言模型PaLM 2以及大量医疗数据训练的,是第一个在MedQA测试集中达到“专家”水平的AI大模型。
它的前身Med-PaLM是首个在美国医疗执照考试(USMLE)中取得“及格”以上分数的AI模型,在MedQA数据集上的得分为67.2。
而Med-PaLM 2将这一分数提升了19%,达到86.5,并在MedMACQA、PubMedQA和MMLU等多个临床方面的数据集上性能接近或超过SOTA。
在1000多个实际医疗场景问答中,Med-PaLM 2在9项基准测试中,有8项表现良好,相较于人类医生的回答得到更多认可。
与普通医生的回答相比,Med-PaLM 2有72.9%的回答被认为和医生回答相对一致。
但这些数据距离Med-PaLM 2能被完全投入到实际医疗场景中应用还有一些挑战,尤其是回答问题的准确性和稳定性方面。在上面的测试中,Med PaLM 2唯一一项没有被认可的基准测试,就是“信息准确性/相关性”。
尽管在实际应用落地中存在诸多困难,比如数据隐私方面的担忧、责任方的认定等,但这项技术代表了科技的进步,我们对AI在医疗领域的更多贡献和益处抱有期待。未来,AI将在医疗领域发挥更大的作用,造福人类。
最近更新热点资讯
- 谷歌AI聊天记录让网友San值狂掉:研究员走火入魔认为它已具备人格,被罚带薪休假
- 豆瓣9.4,姐弟恋、三人行,这部大尺度太厉害
- Genes, Intelligence, Racial Hygiene, Gen
- 【土耳其电影】《冬眠》电影评价: 宛如一部回归伯格曼风格的道德剧
- 陌生人社会伦理问题研究
- 理论研究|前海实践的价值理性和工具理性
- 澳门刑事证据禁止规则
- 综艺普及剧本杀和密室逃脱助力线下实体店爆发式增长
- 日本小伙和五个小姐姐同居?看完我酸了!
- 第一学期高一语文考试期中试卷
- 高中必考的物理公式有哪些
- 这部大尺度的申奥片,却讲述了不lun恋...
- 心理语言学论文精品(七篇)
- 《贵妃还乡》 超清
- 专论 | 郭丹彤、陈嘉琪:古代埃及书信中的玛阿特观念
- 微专业招生 | 数字文化传播微专业列车即将发车,沿途课程抢先看!
- 生态安全的重要性汇总十篇
- 原创因“18禁”电影登舆论顶峰,万千少女一场春梦:这一生,足够了
- 章鱼头
- 读书心得体会
- 考研考北京大学医学部或者协和是一种怎样的难度?
- 央媒评女主播编造“夜宿故宫”:让肇事者付出代价,理所应当
- 库欣病患者求医记(流水账)
- 《太平公主》④ | 地位越高,越要装傻
- 爱体检 安卓版 v2.5