新たな医療知識の獲得に向けた医学系論文の文脈構造の解析と情報抽出への応用
医学论文上下文结构分析及其在信息提取中获取新医学知识的应用
基本信息
- 批准号:21K17815
- 负责人:
- 金额:$ 2.91万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Early-Career Scientists
- 财政年份:2021
- 资助国家:日本
- 起止时间:2021-04-01 至 2024-03-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本研究課題では、医学生物学論文の談話構造の解析とそこからの知識獲得を行うために、(1)談話構造スキームの設計とコーパスの構築、(2)談話構造解析法の開発、(3)談話構造の情報抽出への応用に取り組む。2022年度では、これらのうち(1)および(3)に主に取り組んだ。具体的には、医学生物学論文の談話構造のスキーム設計とコーパス構築を前年度に引き続いて行い、GENIAコーパスに収録されている1,999件の医学生物学論文アブストラクトに対して人手で談話依存構造をアノテーションし、またアノテーションの質の向上もはかった。さらに、これらのアノテーションデータ上での機械学習手法のベンチマーク実験を行い、従来手法の精度と従来手法では解けない事例について分析を行った。現在はその成果を英語論文としてまとめ、国際論文誌に投稿するために準備中である。また、情報抽出における基幹タスクの一つである文書レベル関係抽出における共参照構造の重要性と役割、共参照構造の活用方法を調査するために、CDRコーパスに収録される医学生物学論文アブストラクト1,500件に対して人手で共参照・照応構造をアノテーションした。その結果、文境界を越えるエンティティ間の関係性を同定するためには、共参照による間接的な接続を考慮することが重要であることを示した。この成果についても、それを英語論文としてまとめ、査読あり国際会議に投稿するために準備中である。
在本研究主题中,为了分析医学和生物学论文的话语结构并从中获取知识,我们将致力于(1)设计话语结构方案和构建语料库,(2)开发话语结构分析方法,以及(3)将话语结构信息应用于提取话语结构信息。在2022年,我们主要研究其中的(1)和(3)。具体而言,我们继续在上一年设计医学和生物学论文的话语结构,并为Genia Corpus中包含的1,999个医学和生物学论文摘要手动注释的话语依赖性结构,并提高了注释的质量。此外,我们对这些注释数据进行了基准实验,并分析了无法使用常规方法解决的常规方法和案例的准确性。目前,将结果汇编成英文论文,并准备将其提交给国际日报。此外,为了研究共同参考结构在文档级关系提取中的重要性和作用,信息提取的关键任务之一以及如何利用共同参考结构,我们手动注释了CDR语料库中包含的1,500篇医学和生物学摘要的共同参考和分析结构。结果表明,重要的是要通过共同参考来考虑间接连接,以确定跨句子边界之间的实体之间的关系。该结果还准备好将其汇编成英文论文,并提交给与同行评审的国际会议。
项目成果
期刊论文数量(2)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Out-of-Domain Discourse Dependency Parsing via Bootstrapping: An Empirical Analysis on Its Effectiveness and Limitation
- DOI:10.1162/tacl_a_00451
- 发表时间:2022-02
- 期刊:
- 影响因子:10.9
- 作者:Noriki Nishida;Yuji Matsumoto
- 通讯作者:Noriki Nishida;Yuji Matsumoto
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
西田 典起其他文献
西田 典起的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('西田 典起', 18)}}的其他基金
Natural Language Understanding Based on Discourse Structure and Knowledge
基于语篇结构和知识的自然语言理解
- 批准号:
18J12366 - 财政年份:2018
- 资助金额:
$ 2.91万 - 项目类别:
Grant-in-Aid for JSPS Fellows
相似海外基金
Research on Integrated Structural Parsing from Scientific Literature
科技文献综合结构解析研究
- 批准号:
18K18109 - 财政年份:2018
- 资助金额:
$ 2.91万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
Large-scale and massively parallel computing for global optimization in natural language processing
用于自然语言处理全局优化的大规模和大规模并行计算
- 批准号:
23700177 - 财政年份:2011
- 资助金额:
$ 2.91万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
Development of a universal organ segmentation method based on similar image retrieval and machine-learning by using a large database of medical images
利用大型医学图像数据库开发基于相似图像检索和机器学习的通用器官分割方法
- 批准号:
23500118 - 财政年份:2011
- 资助金额:
$ 2.91万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Building Named Entity Recognizers by combining a large-scale lexicon and corpora
通过结合大规模词典和语料库构建命名实体识别器
- 批准号:
23700159 - 财政年份:2011
- 资助金额:
$ 2.91万 - 项目类别:
Grant-in-Aid for Young Scientists (B)