大規模テキストデータに基づく名詞意味辞書の構築及び自然言語理解における利用
基于大规模文本数据的名词意义词典构建及其在自然语言理解中的应用
基本信息
- 批准号:12780282
- 负责人:
- 金额:$ 1.73万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Encouragement of Young Scientists (A)
- 财政年份:2000
- 资助国家:日本
- 起止时间:2000 至 2001
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本研究では,実用的規模の言語テキストに対して,これまでよりも深いレベルの意味理解を高性能に行うことを目的として,名詞の意味・用法をより深いレベルで記述した意味辞書を,大規模テキストデータから半自動的に構築する手法の研究を行った.本年度は,大規模な名詞意味辞書の存在が本質的に必須となる言語理解の各過程において,名詞意味辞書がどの程度有効であるかを評価・検証し,さらに言語理解の精度が最適化されるように,名詞意味辞書の記述の一般化の度合を柔軟に調整する手法の研究を行なった.本年度の研究項目は次の2点である.1.テキストの語彙的結束性に基づく語の意味的曖昧性の解消の過程において,名詞意味辞書の有効性を評価・検証した.2.照応・指示・省略などの文脈理解の各過程において,名詞意味辞書の有効性を評価・検証した.まず,第1点については,統計的手法により学習された意味的曖昧性解消規則を適用する過程において,名詞意味辞書の有効性を評価・検証した.従来,統計的手法による意味的曖昧性解消の研究においては,テキスト中の単語など表層的手がかりのみに基づいて意味的曖昧性を解消していたが,本研究では,意味的曖昧性解消の手がかりとして名詞意味辞書の記述を利用することにより,曖昧性解消の性能がどの程度向上するかを評価・検証した.第2点については,複数の文からなるテキストについて,テキスト中の名詞の意味記述を名詞意味辞書から検索し,これらをネットワーク状に連結することにより,まず,テキスト全体の語彙的結束性を表現した.そして,語彙的結束性に基づく語彙的制約と談話構造上の制約を統合的に考慮することにより,照応・指示・省略の参照先を決定する文脈理解モデルを構築し,その性能を評価した.
在这项研究中,一个主要的词典描述了更深层次的名词的含义和用法,目的是在实用规模上对语言文本进行深入了解。从这个财政年度的比例文本数据,名词词典在语言理解过程中的有效性,这对于我们评估和验证的大规模名词词典至关重要。调整名词词典的描述的概括程度,以进一步优化语言的精度。基于文本的词汇凝聚力,对名词词典的有效性进行了评估和验证。2.2在每个过程中。在使用统计方法中,对其进行了有意义的歧义解决方案的词典。 ,但在这项研究中,我们评估并验证了通过使用名词词典作为线索的描述,可以改善歧义的性能。将它们连接到网络表单中,首先通过整合上述约束来表达整个文本的词汇内聚会,建立了上下文理解模型,以确定对应关系,指令和遗漏的参考目的地,并评估了性能。
项目成果
期刊论文数量(48)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
小玉康広: "複数の音声認識システムの出力の共通部分を利用した確信度"日本音響学会2001年春季研究発表会講演論文集. I. (2001)
Yasuhiro Kodama:“使用多个语音识别系统输出的公共部分的信心”日本声学学会 2001 年春季会议记录 I. (2001)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
宇津呂 武仁: "ブートストラップによる低人手コスト日本語固有表現抽出"情報処理学会研究報告. 2000-NL-139. 9-16 (2000)
Takehito Utsuro:“使用 bootstrapping 进行低人力成本的日本命名实体提取”日本信息处理协会研究报告 2000-NL-139 (2000)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
宇津呂武仁: "言語コーパスをより有効に使うために"情報処理. 41・7. 787-792 (2000)
Takehito Utsuro:“更有效地使用语言语料库”信息处理41・792。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Takehito Utsuro: "Analyzing Dependencies of Japanese Subordinate Clauses based on Statistics of Scope Embedding Preference"Proceedings of the 1st Conference of the North American Chapter of the Association for Computational Linguistics. 110-117 (2000)
Takehito Utsuro:“基于范围嵌入偏好统计分析日语从句的依存关系”计算语言学协会北美分会第一届会议论文集。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
堀内貴司: "翻訳知識獲得のための言語横断関連報道記事検索"言語処理学会第8回年次大会論文集. (2002)
Takashi Horiuchi:“获取翻译知识的跨语言相关新闻文章搜索”语言处理学会第八届年会论文集(2002)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
宇津呂 武仁其他文献
Wikipediaを知識源とする分野トピックモデルの推定と分析
以维基百科为知识源的领域主题模型估计与分析
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
牧田 健作;鈴木 浩子;小池 大地;宇津呂 武仁;河田 容英 - 通讯作者:
河田 容英
時系列ニュース・ブログにおける話題同定に関する分析 --- 震災を例題として ---
时序新闻博客主题识别分析---以地震灾害为例---
- DOI:
- 发表时间:
2012 - 期刊:
- 影响因子:0
- 作者:
小池 大地;牧田 健作;宇津呂 武仁;吉岡 真治;河田 容英;福原 知宏 - 通讯作者:
福原 知宏
ウェブ検索者の情報要求観点の日中間対照分析
从网络搜索者信息请求的角度分析中日两国
- DOI:
- 发表时间:
2014 - 期刊:
- 影响因子:0
- 作者:
鄭 立儀;小池 大地;聶 添;今田 貴和;陳 磊;宇津呂 武仁;河田 容英;神門 典子. - 通讯作者:
神門 典子.
乳幼児をもつ養育者の絵本購入行動と購入絵本に対する意識と行動―インターネット調査からの検討―
婴幼儿看护者绘本购买行为及其购买绘本认知和行为——网络调查研究——
- DOI:
- 发表时间:
2018 - 期刊:
- 影响因子:0
- 作者:
笠松 美歩;上原 宏;宇津呂 武仁;齋藤 有;齋藤有 - 通讯作者:
齋藤有
宇津呂 武仁的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('宇津呂 武仁', 18)}}的其他基金
実世界の大規模言語資源からの翻訳知識獲得に基づく機械翻訳モデルの研究
基于现实世界大规模语言资源获取翻译知识的机器翻译模型研究
- 批准号:
16700141 - 财政年份:2004
- 资助金额:
$ 1.73万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
WWW上の多言語文書から翻訳知識を発見するための知的インタフェースの研究
从WWW多语言文档中发现翻译知识的智能接口研究
- 批准号:
15017245 - 财政年份:2003
- 资助金额:
$ 1.73万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
言語横断情報検索および多言語情報抽出の技術を利用した翻訳知識獲得の研究
利用跨语言信息检索和多语言信息抽取技术获取翻译知识的研究
- 批准号:
14780275 - 财政年份:2002
- 资助金额:
$ 1.73万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
大規模テキストデータに基づく名詞意味辞書の構築及び自然言語理解における利用
基于大规模文本数据的名词意义词典构建及其在自然语言理解中的应用
- 批准号:
11780275 - 财政年份:1999
- 资助金额:
$ 1.73万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
統計モデルに基づく大規模テキストへの言語情報付与及びテキストからの言語知識獲得
为大规模文本添加语言信息,基于统计模型从文本中获取语言知识
- 批准号:
09780338 - 财政年份:1997
- 资助金额:
$ 1.73万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
自然言語テキストからの語彙的知識獲得および獲得結果を利用した効率的文解析法
利用词汇知识获取和自然语言文本获取结果的高效句子分析方法
- 批准号:
07780326 - 财政年份:1995
- 资助金额:
$ 1.73万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
相似海外基金
古代日本語における格標示体系の総合的解明を目指した斜格データベースの構築
构建倾斜格数据库,全面阐明古代日语格标记系统
- 批准号:
21K13014 - 财政年份:2021
- 资助金额:
$ 1.73万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
Descriptive research on clarifying the systematization of idiom change
厘清成语变化系统性的描述性研究
- 批准号:
20K00674 - 财政年份:2020
- 资助金额:
$ 1.73万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
The development of parallel Japanese-English and English-Japanese corpora and their searching system, and its application
日英、英日并行语料库及其检索系统的开发与应用
- 批准号:
20K00692 - 财政年份:2020
- 资助金额:
$ 1.73万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Natural Language Processing Technologies for Formulaic Expressions
公式表达式的自然语言处理技术
- 批准号:
18H03297 - 财政年份:2018
- 资助金额:
$ 1.73万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Visualization of a semantic space in mental lexicon and development of a Kanji learning program based on the semantic space
心理词典中语义空间的可视化以及基于语义空间的汉字学习程序的开发
- 批准号:
16K04434 - 财政年份:2016
- 资助金额:
$ 1.73万 - 项目类别:
Grant-in-Aid for Scientific Research (C)