複数の言語処理タスクを利用したデータ拡張法に基づくマルチラベル文書分類

使用多种语言处理任务的基于数据增强方法的多标签文档分类

基本信息

  • 批准号:
    22K12146
  • 负责人:
  • 金额:
    $ 2.66万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
  • 财政年份:
    2022
  • 资助国家:
    日本
  • 起止时间:
    2022-04-01 至 2025-03-31
  • 项目状态:
    未结题

项目摘要

現在実施中の「複数の言語処理タスクを利用したデータ拡張法に基づくマルチラベル文書分類」についての研究の令和4年度の実施予定は「局所的なノイズ生成手法の開発」であり,「分野依存語義の同定」と「構文構造に基づく能動・受動変換手法の提案」を行い,「実験の成果と公開」を行うことであった.令和4年度はそのうち「分野依存語義の同定」についてYAGO[Fabian Suchanek, etc.]で定義されている分野語義とWordNet3.2の語義文を利用し,Quadruplet loss[Chen'17]により意味が等価であるか否かを学習・判定する実験を行った.予備的な実験のため,サイズの小さいデータを用いて実験を行ったが,YAGOの語義が非常に細かい分類であるにも関わらず分野依存語義の同定が可能であることが実験で確かめられた.また,この結果を利用して意味的に等価と判断された語義の単語をWordNetに掲載されている同義語で置き換えることができた.この後すぐにデータを増やして分野依存語義同定・同義語への置き換えの実験を行う予定である.「構文構造に基づく能動・受動変換手法」については現在モデルを作成しており,RCV1 datasetを用いた実験を行う準備をしている.令和4年度に実施した「分野依存語義の同定」と現在開発中の「構文構造に基づく能動・受動変換手法」をFixMatch(半教師付き学習)による弱データ拡張を令和5年度前半に実験を行い,その成果を令和5年度中に国際会議で発表する予定である.
当前对“基于数据扩展方法的多标签文档分类使用多种语言处理任务”的研究计划为2022年,以“开发本地噪声产生方法”和“识别识别现场依赖的单词含义”,并“提出了基于主动和被动的转换方法,基于句法结构”,以及“实验结果和披露”。”在2022财政年度,我们进行了一个实验,我们使用wordnet 3.2的语义句子来了解并判断含义是否相当于使用QUADRUPEL损失[Chen'17],这些句子是在Yago [Fabian Suchanek等中定义的],用于“识别田地相关含义”。对于初步实验,我们使用少量数据进行了实验,尽管Yago的含义是非常详细的分类,但已证实可以识别依赖场的含义。此外,使用此结果,可以用WordNet中发表的同义词代替具有被认为是语义上等效的含义的单词。我们很快将进行一个实验,以识别和替换语义依赖于场的词并包括同义词。我们目前正在为“基于句法结构的主动/被动转换方法”创建一个模型,并准备使用RCV1数据集进行实验。我们将在2022年实验“鉴定与现场依赖的含义”,并使用FixMatch(半监督学习)(半纯粹的学习)开发的“基于句法结构的主动和被动转换方法”,以及使用FIXMATCH MATCHMATCH(SEMI-SUPERPERPERSIND MELLIVINED)(SEMI-SUPERPENTIST)的数据扩展(这些数据的结果),以及这些数据的结果将在2023年纳入2023年的国际会议上。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Improving Peer-Review Score Prediction with Semi-Supervised Learning and Denoising Networks
利用半监督学习和去噪网络改进同行评审分数预测
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Panitan Muangkammuen;福本文代,李吉屹,鈴木良弥
  • 通讯作者:
    福本文代,李吉屹,鈴木良弥
Exploiting Labeled and Unlabeled Data via Transformer Fine-tuning for Peer-Review Score Prediction
  • DOI:
    10.18653/v1/2022.findings-emnlp.164
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Panitan Muangkammuen;Fumiyo Fukumoto;Jiyi Li;Yoshimi Suzuki
  • 通讯作者:
    Panitan Muangkammuen;Fumiyo Fukumoto;Jiyi Li;Yoshimi Suzuki
Disentangling Meaning and Style for Positive Text Reframing
理清积极文本重构的含义和风格
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    河野稜斗;平林照雄;古宮嘉那子;徐勝,鈴木良弥,李吉屹,郷健太郎,福本文代
  • 通讯作者:
    徐勝,鈴木良弥,李吉屹,郷健太郎,福本文代
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

鈴木 良弥其他文献

鈴木 良弥的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('鈴木 良弥', 18)}}的其他基金

ニュース文の話題識別とその続報記事の自動抽出
新闻文本主题识别及后续文章自动提取
  • 批准号:
    11780257
  • 财政年份:
    1999
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了