喵ID:YLxoiq免责声明

Appraising the Potential Uses and Harms of LLMs for Medical Systematic Reviews

评估法学硕士在医学系统评价中的潜在用途和危害

基本信息

DOI:
--
发表时间:
2023
期刊:
Conference on Empirical Methods in Natural Language Processing
影响因子:
--
通讯作者:
Byron Wallace
中科院分区:
文献类型:
--
作者: Hye Sun Yun;I. Marshall;T. Trikalinos;Byron Wallace研究方向: -- MeSH主题词: --
关键词: --
来源链接:pubmed详情页地址

文献摘要

Medical systematic reviews play a vital role in healthcare decision making and policy. However, their production is time-consuming, limiting the availability of high-quality and up-to-date evidence summaries. Recent advancements in large language models (LLMs) offer the potential to automatically generate literature reviews on demand, addressing this issue. However, LLMs sometimes generate inaccurate (and potentially misleading) texts by hallucination or omission. In healthcare, this can make LLMs unusable at best and dangerous at worst. We conducted 16 interviews with international systematic review experts to characterize the perceived utility and risks of LLMs in the specific context of medical evidence reviews. Experts indicated that LLMs can assist in the writing process by drafting summaries, generating templates, distilling information, and crosschecking information. They also raised concerns regarding confidently composed but inaccurate LLM outputs and other potential downstream harms, including decreased accountability and proliferation of low-quality reviews. Informed by this qualitative analysis, we identify criteria for rigorous evaluation of biomedical LLMs aligned with domain expert views.
医学系统综述在医疗决策和政策制定中起着至关重要的作用。然而,其制作过程耗时,限制了高质量和最新证据综述的获取。大型语言模型(LLMs)的最新进展提供了按需自动生成文献综述的可能性,从而解决这一问题。然而,LLMs有时会因幻觉或遗漏而生成不准确(且可能具有误导性)的文本。在医疗领域,这可能导致LLMs往好了说是无法使用,往坏了说则是危险的。我们对国际系统综述专家进行了16次访谈,以描述在医学证据综述的特定背景下LLMs的感知效用和风险。专家们表示,LLMs可以通过起草摘要、生成模板、提炼信息和交叉核对信息来辅助写作过程。他们还对自信撰写但不准确的LLM输出以及其他潜在的下游危害表示担忧,包括责任感降低和低质量综述的泛滥。基于这一定性分析,我们确定了符合领域专家观点的严格评估生物医学LLMs的标准。
参考文献(8)
被引文献(5)
Extracting PICO Sentences from Clinical Trial Reports using Supervised Distant Supervision
DOI:
发表时间:
2016
期刊:
Journal of machine learning research : JMLR
影响因子:
0
作者:
Byron C. Wallace;J. Kuiper;Aakash Sharma;Mingxi Zhu;I. Marshall
通讯作者:
Byron C. Wallace;J. Kuiper;Aakash Sharma;Mingxi Zhu;I. Marshall
Reducing workload in systematic review preparation using automated citation classification
DOI:
10.1197/jamia.m1929
发表时间:
2006-03-01
期刊:
JOURNAL OF THE AMERICAN MEDICAL INFORMATICS ASSOCIATION
影响因子:
6.4
作者:
Cohen, AM;Hersh, WR;Yen, PY
通讯作者:
Yen, PY
State of the evidence: a survey of global disparities in clinical trials
证据状况:临床试验全球差异的调查
DOI:
10.1101/2020.10.08.20209353
发表时间:
2020
期刊:
影响因子:
0
作者:
Marshall I
通讯作者:
Marshall I

数据更新时间:{{ references.updateTime }}

Byron Wallace
通讯地址:
--
所属机构:
--
电子邮件地址:
--
免责声明免责声明
1、猫眼课题宝专注于为科研工作者提供省时、高效的文献资源检索和预览服务;
2、网站中的文献信息均来自公开、合规、透明的互联网文献查询网站,可以通过页面中的“来源链接”跳转数据网站。
3、在猫眼课题宝点击“求助全文”按钮,发布文献应助需求时求助者需要支付50喵币作为应助成功后的答谢给应助者,发送到用助者账户中。若文献求助失败支付的50喵币将退还至求助者账户中。所支付的喵币仅作为答谢,而不是作为文献的“购买”费用,平台也不从中收取任何费用,
4、特别提醒用户通过求助获得的文献原文仅用户个人学习使用,不得用于商业用途,否则一切风险由用户本人承担;
5、本平台尊重知识产权,如果权利所有者认为平台内容侵犯了其合法权益,可以通过本平台提供的版权投诉渠道提出投诉。一经核实,我们将立即采取措施删除/下架/断链等措施。
我已知晓