新たな医療知識の獲得に向けた医学系論文の文脈構造の解析と情報抽出への応用
医学论文上下文结构分析及其在信息提取中获取新医学知识的应用
基本信息
- 批准号:21K17815
- 负责人:
- 金额:$ 2.91万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Early-Career Scientists
- 财政年份:2021
- 资助国家:日本
- 起止时间:2021-04-01 至 2024-03-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本研究課題では、医学生物学論文の談話構造の解析とそこからの知識獲得を行うために、(1)談話構造スキームの設計とコーパスの構築、(2)談話構造解析法の開発、(3)談話構造の情報抽出への応用に取り組む。2022年度では、これらのうち(1)および(3)に主に取り組んだ。具体的には、医学生物学論文の談話構造のスキーム設計とコーパス構築を前年度に引き続いて行い、GENIAコーパスに収録されている1,999件の医学生物学論文アブストラクトに対して人手で談話依存構造をアノテーションし、またアノテーションの質の向上もはかった。さらに、これらのアノテーションデータ上での機械学習手法のベンチマーク実験を行い、従来手法の精度と従来手法では解けない事例について分析を行った。現在はその成果を英語論文としてまとめ、国際論文誌に投稿するために準備中である。また、情報抽出における基幹タスクの一つである文書レベル関係抽出における共参照構造の重要性と役割、共参照構造の活用方法を調査するために、CDRコーパスに収録される医学生物学論文アブストラクト1,500件に対して人手で共参照・照応構造をアノテーションした。その結果、文境界を越えるエンティティ間の関係性を同定するためには、共参照による間接的な接続を考慮することが重要であることを示した。この成果についても、それを英語論文としてまとめ、査読あり国際会議に投稿するために準備中である。
在本研究项目中,为了分析医学生物学论文的语篇结构并从中获取知识,我们将(1)设计语篇结构方案并构建语料库,(2)开发语篇结构分析方法,以及(3) ) ) 致力于语篇结构在信息抽取中的应用。 2022财年,我们主要致力于其中的(1)和(3)。具体来说,我们延续前一年的医学生物学论文篇章结构设计方案并构建语料库,对GENIA语料库中收录的1999篇医学生物学论文摘要手动创建了篇章依赖结构。提高注释的质量。此外,我们对这些标注数据进行了机器学习方法的基准实验,分析了常规方法的准确性以及常规方法无法解决的情况。我们目前正在将研究结果编译成英文论文,并准备提交给国际期刊。此外,为了研究共指结构在信息抽取的核心任务之一——文档级关系抽取中的重要性和作用,以及如何利用共指结构,我们收集了1500篇医学和生物学论文摘要,其中包括CDR 语料库。我们手动注释了项目的共指和照应结构。结果表明,为了识别跨越句子边界的实体之间的关系,考虑通过共同引用的间接联系非常重要。我们还正在将这一结果汇编成英文论文,并准备提交给同行评审的国际会议。
项目成果
期刊论文数量(2)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Out-of-Domain Discourse Dependency Parsing via Bootstrapping: An Empirical Analysis on Its Effectiveness and Limitation
- DOI:10.1162/tacl_a_00451
- 发表时间:2022-02
- 期刊:
- 影响因子:10.9
- 作者:Noriki Nishida;Yuji Matsumoto
- 通讯作者:Noriki Nishida;Yuji Matsumoto
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
西田 典起其他文献
西田 典起的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('西田 典起', 18)}}的其他基金
Natural Language Understanding Based on Discourse Structure and Knowledge
基于语篇结构和知识的自然语言理解
- 批准号:
18J12366 - 财政年份:2018
- 资助金额:
$ 2.91万 - 项目类别:
Grant-in-Aid for JSPS Fellows
相似海外基金
A data resource for high resolution neuropathological and omics analysis of Alzheimer's disease
用于阿尔茨海默病高分辨率神经病理学和组学分析的数据资源
- 批准号:
10112799 - 财政年份:2020
- 资助金额:
$ 2.91万 - 项目类别:
A data resource for high resolution neuropathological and omics analysis of Alzheimer's disease
用于阿尔茨海默病高分辨率神经病理学和组学分析的数据资源
- 批准号:
10375359 - 财政年份:2020
- 资助金额:
$ 2.91万 - 项目类别:
A data resource for high resolution neuropathological and omics analysis of Alzheimer's disease
用于阿尔茨海默病高分辨率神经病理学和组学分析的数据资源
- 批准号:
10612883 - 财政年份:2020
- 资助金额:
$ 2.91万 - 项目类别:
Research on Integrated Structural Parsing from Scientific Literature
科技文献综合结构解析研究
- 批准号:
18K18109 - 财政年份:2018
- 资助金额:
$ 2.91万 - 项目类别:
Grant-in-Aid for Early-Career Scientists