意味構造と統語構造の統合学習を用いた文書作成支援アプリケーションの開発
使用语义和句法结构的集成学习开发文档创建支持应用程序
基本信息
- 批准号:21K00806
- 负责人:
- 金额:$ 1.83万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (C)
- 财政年份:2021
- 资助国家:日本
- 起止时间:2021-04-01 至 2024-03-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本研究では,言語形態論のうち,言語コーパスに基づく統語構造(Syntactic structure)学習モデルと意味構造(Semantic structure)学習モデルを統合した総合的形態論に基づく言語モデルを構築し,第二言語習得者のための言語習得支援に活用することを目的とする.第1の課題であるBEA2019 Shared Taskの研究結果に基づく,統語構造を獲得する学習法の改良検討については,前年度は,Kanneko et al.のBert-gecモデルを評価検討したが,今年度は,Omelianchuk et alのGECToRを評価検討し,とくに,人工的に合成された大規模な訓練データの品質を改善するために,訓練文を従来の人工的なエラーを挿入する前の原文ではなくGECモデルの予測文がより適切な誤り訂正文であるという仮説を立てて,人工合成訓練データを再構築する方法を提案した.数値実験の結果,提案した再構築された人工合成訓練データによる学習が,元の人工合成訓練データによる学習よりも優れていることが示され,提案手法による人工学習訓練データのみを用いた学習は,第二言語学習者の誤り文章から生成された訓練データと従来の人工合成訓練データを併用した学習と同等の効果が得られることが示された.第2の課題である入力文章から意味構造を獲得する学習モデルについて,意味構造として抽象的なAMR(Abstract Meaning Representation)の学習モデルをさらに検討し,AMRの言語コーパスであるLDC2020T02を用いて,GECToRによる学習モデルを構築し,統合構造と意味構造の学習モデルの統合の実現性を実験等で確認した.
在本研究中,我们构建了基于综合词法的语言模型,该模型集成了基于语言语料库的句法结构学习模型和语义结构学习模型,并开发了用于第二语言习得的语言模型。支持人们的语言习得。关于第一个问题,即基于BEA2019共享任务的研究成果改进获取句法结构的学习方法的研究,去年我们评估并考虑了Kanneko、Omelianchuk等人的Bert-gec模型。等我们在al.中评估了GECToR,特别是为了提高人工合成的大规模训练数据的质量,训练句子不是插入常规人工错误之前的原始句子,而是我们提出的GEC模型的预测。一种基于句子是更合适的纠错句子的假设来重建人工合成的训练数据的方法。数值实验结果表明,使用所提出的重建合成训练数据进行学习优于使用原始合成训练数据进行学习,并且使用所提出的方法仅使用人工学习训练数据进行学习,结果表明与使用原始合成训练数据进行学习具有相同的效果。可以获得从第二语言学习者的错误句子生成的训练数据与传统的合成训练数据的组合。关于第二个问题,从输入句子中获取语义结构的学习模型,我们进一步研究了抽象意义表示(AMR)作为语义结构的学习模型,并使用AMR语言语料库LDC2020T02开发了GECToR构建了学习模型。基于该方法,并通过实验证实了整合结构和语义结构学习模型的可行性。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
小田 幹雄其他文献
小田 幹雄的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('小田 幹雄', 18)}}的其他基金
不応期ニューロンとスパースコーディングを用いた自己相関連想記憶に関する研究
利用不应期神经元和稀疏编码的自相关联想记忆研究
- 批准号:
14780308 - 财政年份:2002
- 资助金额:
$ 1.83万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
相似海外基金
Gradability in Idephones and Grammatical Integration
Idephones 的可分级性和语法整合
- 批准号:
18K12385 - 财政年份:2018
- 资助金额:
$ 1.83万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
Theoretical description and analysis of polysemy and grammaticalization in verbs: propositional meaning, non-proposisional meaning, and view point
动词多义与语法化的理论描述与分析:命题意义、非命题意义与观点
- 批准号:
16K02652 - 财政年份:2016
- 资助金额:
$ 1.83万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
ソーシャルメディアの情報統合によるエキスパート検索エンジンに関する研究
基于社交媒体信息整合的专家搜索引擎研究
- 批准号:
13J08349 - 财政年份:2013
- 资助金额:
$ 1.83万 - 项目类别:
Grant-in-Aid for JSPS Fellows
The Roles of Semantic Selection, Morphological Selection and Speech Act Compatibility in the Formation and Interpretation of Phrase Structure
语义选择、形态选择和言语行为相容性在短语结构形成和解释中的作用
- 批准号:
25370445 - 财政年份:2013
- 资助金额:
$ 1.83万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Building a large-scale Japanese Combinatory Categorial Grammar by extracting lexical entries from corpora
通过从语料库中提取词汇条目构建大规模日语组合范畴语法
- 批准号:
21500152 - 财政年份:2009
- 资助金额:
$ 1.83万 - 项目类别:
Grant-in-Aid for Scientific Research (C)