Semantic and Contextual Analysis using Common knowledge from Japanese Articles

使用日语文章中的常识进行语义和上下文分析

基本信息

  • 批准号:
    13680461
  • 负责人:
  • 金额:
    $ 1.41万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
  • 财政年份:
    2001
  • 资助国家:
    日本
  • 起止时间:
    2001 至 2003
  • 项目状态:
    已结题

项目摘要

The main aim of the research is to develop a practical semantic analysis system SAGE. For this aim, we attempted to improve the performance both in precision and speed based on the original prototype.In regard to the precision, we made four efforts to improve it. (1) In addition to the statistical measures calculated from the EDR corpus to determine the deep case among words, we supplement a rule-based procedure to determine the case between two words, based on the information on particles, parts of speech, and word meanings. (2) We contrived to determine the deep case between an indeclinable word and its modifier. (3) It has been made possible to analyze the deep case of unregistered words in the EDR Dictionary by replacing them with the registered words holding similar concepts. (4) We classified the expressions containing brackets into 3 categories, supplementation, commission, and complement, and add the analysis of brackets into SAGE.The present system employing the above techniques has reached a precision of 90.2% on word meaning, 90.0% on deep case for the sentences from EDR Corpus, and 87.0% and 86.8% respectively for news articles from the Internet.In regard to the speed-up, we devised a linear-order algorithm including two steps for deciding word meaning and deep case. We first see how the modified word impacts the meaning of the modifier from bottom up, and then represent it with a probability. After that, we determine the meaning of each clause with a top-down approach. We implemented a speed-up of about 10 thousand times with the algorithm. Besides, we reduced the time required for accessing the EDR Dictionary to 1 fifth of the original time, and converted the whole system from a Prolog version to a C version and hence realized another speed-up of 5 times.
该研究的主要目的是开发实用的语义分析系统SAGE。为此,我们试图根据原始原型来提高精确性和速度的性能。在精确度方面,我们做出了四项努力来改善它。 (1)除了从EDR语料库中计算出的统计措施以确定单词之间的深层情况外,我们还基于基于粒子,语音部分和单词的信息来确定两个单词之间的情况,以确定两个单词之间的情况含义。 (2)我们竭尽全力确定不可分割的单词及其修饰符之间的深层案例。 (3)可以通过用具有相似概念的注册单词代替EDR字典中未注册单词的深层案例。 (4)我们将包含括号的表达式分为三类,补充,佣金和补充,并将括号的分析添加到鼠尾草中。当前使用上述技术的系统在单词含义上达到了90.2%的精度,在90.0%上,90.0%的精度在90.0%上的精度为90.0%。来自EDR语料库的句子的深度案例和87.0%和86.8%的新闻文章分别为Internet。在加速方面,我们设计了一个线性订单算法,包括两个决定单词含义和深层案例的步骤。我们首先看到修改后的单词如何影响修饰符的含义,然后以概率表示。之后,我们使用自上而下的方法确定每个子句的含义。我们通过算法实施了大约10万次的速度。此外,我们将访问EDR字典所需的时间减少到了原始时间的第五个,并将整个系统从序言版本转换为C版本,因此实现了另外5次的速度。

项目成果

期刊论文数量(29)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
原田実, 田淵和幸, 大野博之: "日本語意味解析システムSAGEの高速化・高精度化とコーパスによる精度評価"情報処理学会論文誌. Vol.43,No.9. 2894-2902 (2002)
Minoru Harada、Kazuyuki Tabuchi、Hiroyuki Ohno:“提高日语语义分析系统 SAGE 的速度和准确性并使用语料库评估准确性”,《日本信息处理学会汇刊》第 43 卷,第 9 期。2894-2902。 (2002)
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Yamagishi, K., Muramatsu, T., Harada, M.: "Development of demonstrative pronoun resolution system Anasys/D using similarity of word meaning"IPSJ-SIG-Notes. NL-153. 17-23 (2003)
Yamagishi, K.、Muramatsu, T.、Harada, M.:“利用词义相似性开发指示代词解析系统 Anasys/D”IPSJ-SIG-Notes。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Oono, H., Harada, M.: "Proposal of the Case frame expression of complex sentences and enhancing of the semantic analysis system SAGE to complex sentences"Proceedings of the 64^<th> National Conference of Information Processing Society of Japan. No.2. 49-5
Oono, H., Harada, M.:“提出复杂句子的案例框架表达和增强复杂句子的语义分析系统SAGE”第64届日本信息处理学会全国会议论文集。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Minami, A., Harada, M.: "Development of anaphoric analysis system which uses similarity of vocabulary"Proceedings of the 64^<th> National Conference of Information Processing Society of Japan. No.2. 53-54 (2002)
Minami, A., Harada, M.:“利用词汇相似性的照应分析系统的开发”第64届日本信息处理学会全国会议论文集。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
大野 博之, 原田 実: "複文の格表現の提案と意味解析システムSAGEの複文への拡張"情報処理学会第64回全国大会論文集. 3M-4. 49-50 (2002)
Hiroyuki Ohno、Minoru Harada:“复杂句子的案例表达式和语义分析系统 SAGE 到复杂句子的扩展”第 64 届日本信息处理学会全国会议记录 3M-4 (2002)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

HARADA Minoru其他文献

HARADA Minoru的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('HARADA Minoru', 18)}}的其他基金

Development research of highly accurate Question Answering system doing precise matching of meaning
语义精准匹配的高精度问答系统开发研究
  • 批准号:
    16500085
  • 财政年份:
    2004
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
A Research of machine learning of object oriented analysis knowledge by induvtive reasoning
归纳推理面向对象分析知识的机器学习研究
  • 批准号:
    09680377
  • 财政年份:
    1997
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
A Research of Reverse Engineering Tool which generates a non-procedural specification from COBOL programs
从COBOL程序生成非过程规范的逆向工程工具的研究
  • 批准号:
    07680434
  • 财政年份:
    1995
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)

相似海外基金

Computational models of word meaning in use
使用中词义的计算模型
  • 批准号:
    RGPIN-2019-06917
  • 财政年份:
    2022
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Discovery Grants Program - Individual
Computational models of word meaning in use
使用中词义的计算模型
  • 批准号:
    RGPIN-2019-06917
  • 财政年份:
    2021
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Discovery Grants Program - Individual
Computational models of word meaning in use
使用中词义的计算模型
  • 批准号:
    RGPIN-2019-06917
  • 财政年份:
    2020
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Discovery Grants Program - Individual
Computational models of word meaning in use
使用中词义的计算模型
  • 批准号:
    DGECR-2019-00037
  • 财政年份:
    2019
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Discovery Launch Supplement
Computational models of word meaning in use
使用中词义的计算模型
  • 批准号:
    RGPIN-2019-06917
  • 财政年份:
    2019
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Discovery Grants Program - Individual
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了