日本語ゼロ代名詞の先行詞の自動同定アルゴリズムに関する基礎研究および機械翻訳等の文書処理への実装
日语零代词先行词自动识别算法基础研究及在机器翻译等文档处理中的实现
基本信息
- 批准号:02F02348
- 负责人:
- 金额:$ 0.26万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for JSPS Fellows
- 财政年份:2002
- 资助国家:日本
- 起止时间:2002 至 2004
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
「研究目的」日本語では「誰が何を」などの情報が往々にして表現されない。しかし、この情報は自動要約、質疑応答などの様々な言語処理アプリケーションの高度化に必要になる。特に、機械翻訳(日本語→英語)システム開発においては、それらの省略された情報(ゼロ代名詞)が英語で必須であるため、その先行詞を同定する事は一つの大きな課題となっている。その解決策として、文法や文脈を考慮したアルゴリズムを考案したが、その実装と有用性評価が研究目的。「研究実績」新聞90記事を使用し、ガ格、ヲ格、ニ格のゼロ代名詞の先行詞を自動同定する実験の結果と改良点□実装結果:アルゴリズムの内容が全てプログラム化されていないため、ここでは精度よりも、実験から得れた知見について述べる。1.26.6%(24/90)記事は、全てのゼロ代名詞の先行詞の同定が正しく行われていることから、提唱しているアルゴリズムは省略の基本は掴んでおり、その有用性はあるといえる。2.不正解の原因は、1の結果からすると、著者による書体の違いからくる文体(文型)と省略度合いにも起因しているといえる。つまり、省略を誘発する要因は、統語、意味、文脈、分野の専門知識、世界知識に大きく分かれ、右の要因ほど機械処理には困難になる。人にとっても、理解により多くの推論が必要になり、文が曖昧になる。しかし、著者により統語的な省略だけにとどめる人もいれば、それ以外の要因で推論できるものも省略する人もおり、その度合いに大きな個人差がある。1での結果に、これが顕著に現れていると考えられる。□改良点と今後の課題3.2への対策:エラーや個人的書体とゼロ代名詞使用のヴァリエーションへの対策4.今回の分析で、異なる主語を誘発する動詞があることが判明。これにより、この部分にかんしては、先行詞の同定に世界知識などに頼らなくても機械的に処理することができるようになる。該当する動詞のリスト作成が必要。5.省略の有無(必須情報)の明確な定義付け動詞の選択制限だけではなく、共起する名詞句の意味制約も関連し、また、先行詞が不特定だったり一般である時には、先行詞を同定する必要が感じられない。
“研究目的” 在日语中,诸如“谁在做什么”之类的信息通常不会被表达。然而,这些信息是推进各种语言处理应用(例如自动摘要和问答)所必需的。特别是,在机器翻译(日语→英语)系统的开发中,识别先行词是主要挑战之一,因为这种省略的信息(零代词)在英语中是必不可少的。作为解决方案,我们设计了一种考虑语法和上下文的算法,我们研究的目的是实现它并评估其有用性。利用90篇报纸文章自动识别ga、wo、ni中零代词先行词的实验结果及改进□实现结果:由于算法的内容并未全部编程,这里我们讨论一下结果是通过实验获得的,而不是准确度。 1.26.6% (24/90) 这篇文章正确地识别了所有零代词的先行词,因此所提出的算法掌握了省略的基础知识,并且我可以说是有用的。 2.根据1的结果,可以说,错误答案的原因也是由于作者的字体差异和遗漏程度造成的写作风格(句式)造成的。也就是说,造成遗漏的因素大致分为句法、意义、语境、领域专业知识和世界知识,越靠近右侧的因素,机器处理的难度就越大。对于人类来说,理解也需要更多的推理,句子就会变得模糊。然而,根据作者的不同,有些作者只是进行了句法省略,而另一些作者则省略了可以从其他因素推断出来的东西,而且省略程度存在很大的个体差异。这在 1 的结果中似乎很明显。 □改进和未来的挑战 3. 对策 2. 错误、个人字体和零代词使用变化的对策 4. 通过分析发现,存在引出不同主语的动词。因此,这部分可以机械地处理,而不需要依靠世界知识来识别先行词。有必要创建一个适用动词的列表。 5. 存在或不存在省略的明确定义(必填信息) 不仅对动词的选择有限制,而且对共现名词短语的语义限制也是相关的。此外,当先行词不明确或一般时,先行词 I don感觉没有必要去识别它。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
松本 裕治其他文献
ベクトルのスパース化を用いたk近傍法におけるハブの軽減
使用向量稀疏化的 k 最近邻方法中的集线器缓解
- DOI:
- 发表时间:
2014 - 期刊:
- 影响因子:0
- 作者:
重藤 優太郎;新保 仁;松本 裕治 - 通讯作者:
松本 裕治
パターン認識と機械学習:ペイズ理論による統計的予測,
模式识别和机器学习:使用 Pays 理论进行统计预测,
- DOI:
- 发表时间:
2007 - 期刊:
- 影响因子:0
- 作者:
元田 浩;栗田 多喜夫;樋口 知之;松本 裕治;村田 昇;(編);赤穂 昭太郎;神嶌 敏弘;杉山 将;小野田 崇;池田 和司;鹿島 久嗣;賀沢 秀人;中島 伸一;竹内 純一;持橋 大地;小山 聡;井手 剛;篠田 浩一;山川 宏;(訳) - 通讯作者:
(訳)
決定木による「怒り」識別のための音響的特徴の検討と評価
使用决策树研究和评估“愤怒”识别的声学特征
- DOI:
- 发表时间:
2005 - 期刊:
- 影响因子:0
- 作者:
尾関基行;中村裕一;大田友一;松本 裕治;飯田 仁 - 通讯作者:
飯田 仁
松本 裕治的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('松本 裕治', 18)}}的其他基金
超分子ヒドロゲルの階層的ダイナミクスに基づくゾル-ゲル転移の制御
基于超分子水凝胶分级动力学的溶胶-凝胶转变控制
- 批准号:
15J04575 - 财政年份:2015
- 资助金额:
$ 0.26万 - 项目类别:
Grant-in-Aid for JSPS Fellows
意見情報抽出のための深い文解析に関する研究
深度句子分析观点信息提取研究
- 批准号:
08F08367 - 财政年份:2008
- 资助金额:
$ 0.26万 - 项目类别:
Grant-in-Aid for JSPS Fellows
日本語ゼロ代名詞の先行詞の自動同定アルゴリズムに関する基礎研究および機械翻訳等の文書処理への実装
日语零代词先行词自动识别算法基础研究及在机器翻译等文档处理中的实现
- 批准号:
02F00348 - 财政年份:2002
- 资助金额:
$ 0.26万 - 项目类别:
Grant-in-Aid for JSPS Fellows
利用者からの要求を考慮したテキストデータからの知識抽出
考虑用户请求从文本数据中提取知识
- 批准号:
13131207 - 财政年份:2001
- 资助金额:
$ 0.26万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
法律文解析のための知識の自動抽出
自动提取知识以进行法律文本分析
- 批准号:
08204207 - 财政年份:1996
- 资助金额:
$ 0.26万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
法律文解析のための知識の自動抽出
自动提取知识以进行法律文本分析
- 批准号:
07204204 - 财政年份:1995
- 资助金额:
$ 0.26万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
法律文解析のための知識の自動抽出
自动提取知识以进行法律文本分析
- 批准号:
06207205 - 财政年份:1994
- 资助金额:
$ 0.26万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
並列論理型言語によるプログラミング法に関する研究
并行逻辑语言编程方法研究
- 批准号:
04219205 - 财政年份:1992
- 资助金额:
$ 0.26万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
並列論理型言語によるプログラミング法に関する研究
并行逻辑语言编程方法研究
- 批准号:
03235205 - 财政年份:1991
- 资助金额:
$ 0.26万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
並列論理型言語によるプログラミング法に関する研究
并行逻辑语言编程方法研究
- 批准号:
02249203 - 财政年份:1990
- 资助金额:
$ 0.26万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
相似海外基金
Annotation of syntactic and semantic information for a corpus of Old Japanese
古日语语料库的句法和语义信息注释
- 批准号:
18K00560 - 财政年份:2018
- 资助金额:
$ 0.26万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Parallels between Japanese case markers and English prepositions regarding null elements
关于空元素的日语格标记和英语介词之间的相似之处
- 批准号:
17K13479 - 财政年份:2017
- 资助金额:
$ 0.26万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
言語理論と機械学習の融合による照応解析
语言理论与机器学习相结合的照应分析
- 批准号:
06J50722 - 财政年份:2006
- 资助金额:
$ 0.26万 - 项目类别:
Grant-in-Aid for JSPS Fellows
日本語ゼロ代名詞の先行詞の自動同定アルゴリズムに関する基礎研究および機械翻訳等の文書処理への実装
日语零代词先行词自动识别算法基础研究及在机器翻译等文档处理中的实现
- 批准号:
02F00348 - 财政年份:2002
- 资助金额:
$ 0.26万 - 项目类别:
Grant-in-Aid for JSPS Fellows
Semantic and Contextual Analysis using Common knowledge from Japanese Articles
使用日语文章中的常识进行语义和上下文分析
- 批准号:
13680461 - 财政年份:2001
- 资助金额:
$ 0.26万 - 项目类别:
Grant-in-Aid for Scientific Research (C)