テクストの数理的モデリングと、数理モデルを通したテクストらしさの解明への挑戦

文本的数学建模以及通过数学模型阐明文本独特性的挑战

基本信息

  • 批准号:
    20J22697
  • 负责人:
  • 金额:
    $ 1.79万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
  • 财政年份:
    2020
  • 资助国家:
    日本
  • 起止时间:
    2020-04-24 至 2023-03-31
  • 项目状态:
    已结题

项目摘要

昨年度に引き続き,ヒトがテクストを読む際の逐次的処理のモデルについて,自然言語処理分野の技術を活用して探求した.昨年度の研究では,工学的に用いられる大規模言語モデルとヒトの文処理の間に乖離を確認していた.今年度は,心理言語学分野の知見と紐付けながら,この乖離を埋める方法について調査した.本課題について一定の知見が得られており,おおむね順調に研究が進んでいる.当初の計画では,テクスト(複数の文からなる文章)レベルの処理について焦点を当てる予定であったが,その手前の段階として一文ごとの処理に着目した場合にも,ヒトと工学的モデルの間で乖離が生じることが分かった.これを踏まえ,今年度は文レベルの処理に重きをおいた研究となった.並行して文章レベルの処理についても,主題化や省略といった観点について,ヒトと言語モデルの振る舞いを対照させる分析を行ってきた.今年度の研究成果については国内最大規模の学会(自然言語処理学会第28回年次大会)で発表した.今後さらに国際学会への投稿も予定している.また,昨年度の研究成果について当該分野で最も権威ある国際学会(ACL2021)で発表を行った.これらの研究は,心理言語学的な視点からは,ヒトの言語処理の数理的モデルの解明と位置づけられる一方,工学的な視点からはブラックボックスな機械の言語処理の機序を,ヒトと照らし合わせて分析する営みとも捉えられる.工学的な言語処理モデルの分析に関連して,大規模言語モデルをホワイトボックス化する研究や,これらのモデルの説明性を向上させる研究にも共著者として関わった (TACL2021,EMNLP2021,自然言語処理学会第28回年次大会受賞).
从去年开始,我们探讨了在人类使用自然语言处理领域读取文本的顺序处理模型。去年的研究证实了大型工程语言模型与人类句子处理之间的差异。今年,我们研究了如何填补这一空白,将其与心理语言学领域的知识联系起来。在这个问题上已经获得了一定数量的知识,研究的进展总体稳定。最初的计划是专注于文本级处理(单句);但是,发现即使专注于句子处理作为阶段之前,人类与工程模型之间也存在差异。考虑到这一点,今年的研究重点是句子级处理。同时,我们还进行了分析,以将人和语言模型的行为与主观和省略的主观过程进行对比。今年的研究结果是在日本最大的学术会议上介绍的(自然语言处理协会的第28届年会)。我们计划将来向国际学术会议提交更多意见。此外,去年的研究结果是在最享有声望的国际科学学会(ACL2021)中提出的,该学会是该领域最权威的。从心理语言学的角度来看,这些研究可以被视为阐明人类语言处理的数学模型,而从工程的角度来看,它们也可以看作是分析黑盒机器中与人类相比的语言处理机制的活性。关于对工程语言处理模型的分析,他还参与了与白色框大规模语言模型并改善这些模型的解释性的研究(TACL2021,EMNLP2021,并授予了第28届自然语言处理年度会议)。

项目成果

期刊论文数量(14)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Transformerの文脈を混ぜる作用と混ぜない作用
Transformer 上下文混合和非混合效果
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    小林悟郎;栗林樹生;横井祥;乾健太郎
  • 通讯作者:
    乾健太郎
Langsmith: 人とシステムの協働による論文執筆
Langsmith:通过人与系统之间的协作来撰写论文
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    伊藤拓海;栗林樹生;日高雅俊;鈴木潤;乾健太郎
  • 通讯作者:
    乾健太郎
Lower Perplexity is Not Always Human-Like
较低的困惑并不总是像人类一样
人と言語モデルが捉える文の主題
人类和语言模型捕获的句子主题
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    藤原吏生;栗林樹生;乾健太郎
  • 通讯作者:
    乾健太郎
Incorporating Residual and Normalization Layers into Analysis of Masked Language Models
  • DOI:
    10.18653/v1/2021.emnlp-main.373
  • 发表时间:
    2021-09
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Goro Kobayashi;Tatsuki Kuribayashi;Sho Yokoi;Kentaro Inui
  • 通讯作者:
    Goro Kobayashi;Tatsuki Kuribayashi;Sho Yokoi;Kentaro Inui
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

栗林 樹生其他文献

栗林 樹生的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('栗林 樹生', 18)}}的其他基金

人間らしい言語獲得効率に対するマルチモーダル言語処理を通した構成論的探求
通过多模态语言处理对类人语言习得效率的建设性探索
  • 批准号:
    23K16938
  • 财政年份:
    2023
  • 资助金额:
    $ 1.79万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists

相似海外基金

Building a Data Knowledge Circulation System for Psychotherapy Using Artificial Intelligence Technology
利用人工智能技术构建心理治疗数据知识流通体系
  • 批准号:
    20K20876
  • 财政年份:
    2020
  • 资助金额:
    $ 1.79万
  • 项目类别:
    Grant-in-Aid for Challenging Research (Exploratory)
The role of causal and semantic relatedness in comprehension processes of EFL reading: An eye-tracking investigation
因果关系和语义相关性在英语阅读理解过程中的作用:眼动追踪调查
  • 批准号:
    20K00827
  • 财政年份:
    2020
  • 资助金额:
    $ 1.79万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Adaptation and prosodic processing in L2: Eye-tracking evidence and processing models
L2 中的适应和韵律处理:眼动追踪证据和处理模型
  • 批准号:
    19H01279
  • 财政年份:
    2019
  • 资助金额:
    $ 1.79万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Syntactic bootstrapping with null arguments in Japanese
日语中使用空参数的语法引导
  • 批准号:
    18K12357
  • 财政年份:
    2018
  • 资助金额:
    $ 1.79万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
The role of semantic relatedness in text comprehension in English as a foreign language: Comparison of different text units and developmental stages
语义相关性在英语作为外语文本理解中的作用:不同文本单元和发展阶段的比较
  • 批准号:
    17K13507
  • 财政年份:
    2017
  • 资助金额:
    $ 1.79万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了