Building General Language Understanding Infrastructure by Fusing Computational and Human Intelligence

通过融合计算和人类智能构建通用语言理解基础设施

基本信息

  • 批准号:
    21H04901
  • 负责人:
  • 金额:
    $ 26.62万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
  • 财政年份:
    2021
  • 资助国家:
    日本
  • 起止时间:
    2021-04-05 至 2025-03-31
  • 项目状态:
    未结题

项目摘要

2022年度は以下の4つの研究項目について研究を行った。「人知のデザイン、構築」(研究項目1)および「計算知のデザイン、構築」(研究項目2)では、Transformerに基づく計算知に対して、人知の一つである辞書を融合する手法を考案し、形態素解析タスクに適用した。この手法は、入力文の各文字が辞書にマッチしたかどうかを埋め込みベクトルとして学習し、入力に足し合わせる。実験により、辞書の種類によっては精度が向上することを確認した。また、2021年度から継続的に構築していた日本語RoBERTaモデルのlargeサイズを公開した。「人に近い文章理解の実現に向けた計算知・人知融合モデルの構築」(研究項目3)では、事前学習済み言語モデルを、自然言語推論(NLI)データを用いてfine-tuningすることで得られた文ベクトルと、国語辞典の定義文を用いてfine-tuningすることで得られた文ベクトルを比較し、後者の方が表層的に類似していない文ペアの意味的関係性の認識に強いなど、両者の性質に違いがあることを明らかにした。また、両者を統合することで文ベクトルの性能向上が可能なことを示した。「計算知・人知融合モデルの処理過程の説明方式の確立」(研究項目4)では、巨大言語モデルに適切な例題を提示することで、思考連鎖(Chain-of-Thought)の能力で問題を解決できる可能性があることが先行研究にて示されていることに着目した。この思考連鎖の能力についてより深い検証を行い、特に否定的な意味合いを持つ単語を使うと、思考連鎖が機能しなくなるという現象をつきとめた。また、この過程で言語モデルの推論過程を適切に調査するための方法論を考案した。これ以外にもニューラルネットワークの説明性の評価基準である忠実性評価に関して現状を網羅的に調査し、言語処理タスクにおける忠実性評価の指針を示した。
2022年,我们开展了以下四个研究项目的研究。在“人类智能的设计与构建”(研究项目1)和“计算智能的设计与构建”(研究项目2)中,我们设计了一种将人类知识的字典与基于计算智能的方法相结合的方法。并将其应用于形态分析任务。该方法学习输入句子中的每个字符是否与字典匹配作为嵌入向量并将其添加到输入中。通过实验,我们证实根据词典的类型可以提高准确性。此外,我们还发布了自 2021 年以来不断打造的日本 RoBERTa 模型的大尺寸。 “构建计算/人类智能融合模型以实现类似于人类的文本理解”(研究项目3)涉及使用自然语言推理(NLI)数据微调预训练的语言模型并获得句子向量。 ,比较了使用日语词典中的定义句子进行微调得到的句子向量,发现后者更擅长识别表面上不相似的句子对之间的语义关系,揭示了它们的属性存在差异。我们还表明,通过整合两者可以提高句子向量的性能。 “建立一种解释计算智能/人类智能融合模型处理过程的方法”(研究项目4)旨在通过向巨型语言模型提供适当的示例,利用思维链能力来解决问题。事实上,之前的研究表明这个问题有可能得到解决。我们对这个思维链的能力进行了更深入的检查,发现这个思维链不再发挥作用,特别是当使用带有负面含义的词语时。此外,在此过程中,我们设计了一种方法来适当研究语言模型的推理过程。除此之外,我们还全面研究了保真度评估的现状,这是评估神经网络可解释性的标准,并为语言处理任务中的保真度评估提供了指导。

项目成果

期刊论文数量(17)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
言語モデルを用いた漢文の返り点付与と書き下し文生成
对中文句子进行返回点并使用语言模型生成写下来的句子
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    王昊;清水博文;河原大輔
  • 通讯作者:
    河原大輔
Sentence Embeddings using Definition Sentences
使用定义句子的句子嵌入
Comparison and Combination of Sentence Embeddings Derived from Different Supervision Signals
  • DOI:
    10.18653/v1/2022.starsem-1.12
  • 发表时间:
    2022-02
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Hayato Tsukagoshi;Ryohei Sasano;Koichi Takeda
  • 通讯作者:
    Hayato Tsukagoshi;Ryohei Sasano;Koichi Takeda
思考連鎖指示における大規模言語モデルの否定表現理解
使用思维链指令中的大规模语言模型理解否定表达
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    葉夢宇;栗林樹生;舟山弘晃;鈴木潤
  • 通讯作者:
    鈴木潤
日本語GPT2 small
日文GPT2小号
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

河原 大輔其他文献

「メディア流言」の時代―第6回 焼け跡ジャーナリズムの「真相」
“媒体谣言”时代——第六部分:新闻业倦怠的“真相”
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    粟村 誉;荒牧 英治;河原 大輔;柴田知秀;黒橋 禎夫;Sato Takumi;Daisuke Kawahara and Martha Palmer;佐藤卓己
  • 通讯作者:
    佐藤卓己
月刊「細胞」: 溶液NMR法を用いた蛋白質立体構造計算の最近の動向
月刊《Cell》:利用溶液NMR方法计算蛋白质3D结构的最新趋势
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    山本 泰久;好村 尚記;高橋 治子;河原 大輔;菊池 裕;池谷鉄兵 & 伊藤隆
  • 通讯作者:
    池谷鉄兵 & 伊藤隆
KWJA: 汎用言語モデルに基づく日本語解析器
KWJA:基于通用语言模型的日语语言分析器
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    植田 暢大;大村 和正;児玉 貴志;清丸 寛一;村脇 有吾;河原 大輔;黒橋 禎夫
  • 通讯作者:
    黒橋 禎夫
医療画像および遺伝子発現データの統合解析によるがん診断基盤の構築
通过医学图像和基因表达数据综合分析构建癌症诊断平台
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    山本 泰久;好村 尚記;高橋 治子;河原 大輔;菊池 裕
  • 通讯作者:
    菊池 裕
Consumption of Nazi Culture Images in Postwar Japan
战后日本纳粹文化图像的消费
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    粟村 誉;荒牧 英治;河原 大輔;柴田知秀;黒橋 禎夫;Sato Takumi
  • 通讯作者:
    Sato Takumi

河原 大輔的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('河原 大輔', 18)}}的其他基金

医療AIの予後予測における"見える化"と最適な放射線治療シミュレーションの構築
医疗AI预后预测的“可视化”及最优放疗模拟的构建
  • 批准号:
    24K10811
  • 财政年份:
    2024
  • 资助金额:
    $ 26.62万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
人知との融合による大規模言語モデルの大規模知識モデルへの進化
通过与人类智能融合,将大规模语言模型进化为大规模知识模型
  • 批准号:
    24H00727
  • 财政年份:
    2024
  • 资助金额:
    $ 26.62万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
現代アメリカ映画産業における製作のグローバル化と産業労働の変容に関する研究
当代美国电影产业生产全球化与产业劳动力转型研究
  • 批准号:
    24K03594
  • 财政年份:
    2024
  • 资助金额:
    $ 26.62万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
造影下低エネルギーX線照射による被ばく線量定量化及び新規放射線治療法実現性の検討
对比增强低能X射线照射剂量的量化及新放疗方法的可行性研究
  • 批准号:
    20K16727
  • 财政年份:
    2020
  • 资助金额:
    $ 26.62万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
グローバル状況下における米国映画製作の政治経済分析:製作工程の海外委託を中心に
全球背景下美国电影制作的政治经济分析:聚焦海外制作流程外包
  • 批准号:
    19K13041
  • 财政年份:
    2019
  • 资助金额:
    $ 26.62万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
ダイナミックインシュレーション技術を適用した開口部の実用化に関する研究
动态隔热技术洞口实际应用研究
  • 批准号:
    14J10194
  • 财政年份:
    2014
  • 资助金额:
    $ 26.62万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
ポスト古典的ハリウッド映画研究:様式の変遷に関する実証的調査と歴史的考察
后古典好莱坞电影研究:风格变化的实证研究和历史考量
  • 批准号:
    07J02100
  • 财政年份:
    2007
  • 资助金额:
    $ 26.62万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows

相似海外基金

Reading Bees: Adapting and Testing a Mobile App Designed to Empower Families to Read more Interactively with Children in Distinct Geographical and Cultural Contexts
阅读蜜蜂:调整和测试一款移动应用程序,旨在让家庭能够在不同的地理和文化背景下与孩子进行更多互动阅读
  • 批准号:
    10729773
  • 财政年份:
    2023
  • 资助金额:
    $ 26.62万
  • 项目类别:
Construction of efficient machine learning models using domain knowledge
使用领域知识构建高效的机器学习模型
  • 批准号:
    20K11960
  • 财政年份:
    2020
  • 资助金额:
    $ 26.62万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Knowledge Routing Method for Modality Networks
模态网络的知识路由方法
  • 批准号:
    19K22861
  • 财政年份:
    2019
  • 资助金额:
    $ 26.62万
  • 项目类别:
    Grant-in-Aid for Challenging Research (Exploratory)
語句の意味推定モデルとのマルチタスク学習に基づく世界知識を考慮した対話システム
基于词义估计模型的多任务学习考虑世界知识的对话系统
  • 批准号:
    19J14522
  • 财政年份:
    2019
  • 资助金额:
    $ 26.62万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
Developing a brain-integrated AI system with personality
开发具有个性的大脑集成人工智能系统
  • 批准号:
    18K18141
  • 财政年份:
    2018
  • 资助金额:
    $ 26.62万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了