文脈自由言語より広い言語に対する構文解析アルゴリズムとシステム開発

比上下文无关语言更广泛的语言的解析算法和系统开发

基本信息

  • 批准号:
    12780248
  • 负责人:
  • 金额:
    $ 0.83万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
  • 财政年份:
    2000
  • 资助国家:
    日本
  • 起止时间:
    2000 至 2001
  • 项目状态:
    已结题

项目摘要

本研究では,文脈自由言語より広いクラスの言語に対する新しい構文解析法を考案した.大きく分けて,構文解析法に確率を導入しないで解析できる言語のクラス解析する方式(1.)と,確率を導入して構文解析木の生起確率や情報の抽出をおこなう方式(2.)の二つ手法を提案している.1.文脈自由言語より広い言語の構文解析アルゴリズムの展開文脈自由言語の部分クラスを構文解析する方法としてLR構文解析法が知られているが,そのLR構文解析の拡張として,文法規則の導出のとき,先読み文字列を非終端記号とし,導出する文法規則より右側の非終端記号列を部分木の親とする構文解析法(unrestricted LR(k)構文解析)を提案した.加えて,この構文解析法は,先読み文字列数k>1となるような複数個必要な文法でも,先読み文字をk=1に削減する文法規則の変換法ついて明らかにした.2.確率構文解析アルゴリズムの展開これまで構文解析木の生成確率には,文法規則の生起確率を利用していたが,構文解析木の高さ方向の情報を考慮していない.そのため,必ずしも精密な構文解析木の生起確率が求められてはいなかった.それに対し,本研究では,入力文字のLC親と1つ前の入力時に生成される生成規則の組み合わせを数え上げることによって,入力文字列や部分文字列から得られる構文解析木の生起確率をこれまでよりも精密に求めることができることを示した.日本電子化辞書研究所(EDR)の日本語コーパスを用いて,非文(構文解析木の存在しない入力)の構文解析の生起確率はすべての文で正しい生起確率を求めることができた.また,毎日新聞94年度版を利用して数値情報を抽出して,適合率83.2%,再現率74.8%を得た.
在这项研究中,我们设计了一种新的解析方法,用于与无上下文的语言更宽的语言。从广义上讲,我们提出了两种方法:一种用于语言类别分析的类分析方法,可以分析,而无需将概率引入解析方法(1.),以及一种通过引入概率提取解析树的发生概率和信息的方法。1。 Expanding parsing algorithms for languages ​​with wider than context-free language The LR parsing method is known as a method for parsing partial classes of a context-free language, but as an extension of LR parsing, when deriving grammar rules, when deriving grammar rules, the parsing method is unrestricted, in which the non-terminal string on the right side of the derivation grammar rules are the parent of the subtree (不受限制的)其中衍生语法规则右侧的非末端字符串是子树的父母。此外,已经提出了这种解析方法来创建一种语法规则转换方法,该方法将预读字符的数量减少到k = 1,即使对于需要多个语法的语法,例如预读字符串k> 1.2的语法数量。扩展概率分析算法到目前为止,使用语法规则发生的概率用于生成解析树的概率,但是在解析树高度方向上的信息尚未考虑。因此,不一定确定出现精确解析树的概率。相反,在这项研究中,输入特征的LC母体以及通过计算上一个输入期间产生的发电规则的组合,这表明可以比以前更精确地获得从输入字符串和子字中获得的解析树的概率。使用电子词典研究所(EDR)的日本语料库,可以确定出现非句子的解析的可能性(在解析树中不存在的输入)可以确定以获得所有句子中解析树发生的出现的正确概率。此外,使用Mainichi Shimbun的1994年版提取数值信息,并且匹配率为83.2%,并获得了召回率。

项目成果

期刊论文数量(12)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
椎名広光: "条件付確率の変更による確率一般化LR構文解析の拡張"言語処理学会第6回年次大会論文誌. 203-206 (2000)
Hiromitsu Shiina:“通过改变条件概率扩展概率广义 LR 解析”语言处理学会第六届年会杂志 203-206(2000 年)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Hiromitsu Shiina: "Unrestricted LR(k) grammars and its parser, where k=0, 1"京都大学数理解析研究所講究録. 1205. 154-159 (2001)
Hiromitsu Shiina:“无限制 LR(k) 语法及其解析器,其中 k=0, 1”京都大学数学科学研究所 Kokyuroku。1205. 154-159 (2001)
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
椎名広光: "The Unrestricted LR (k) Grammar and its Parser, where k=0,1"京都大学数理解析研究所講究禄. (2001)
Hiromitsu Shiina:“无限制 LR (k) 语法及其解析器,其中 k=0,1”京都大学数学科学研究所 Kokyuroku(2001 年)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
小林伸行: "新聞記事からの数値情報の抽出と数値化"情報処理学会第64回全国大会講演論文集. (2002)
Nobuyuki Kobayashi:“报纸文章中数字信息的提取和数字化”第 64 届日本信息处理学会全国会议记录(2002 年)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
椎名広光: "確率一般化LR構文解析の先読み方式変更による拡張"京都大学数理解析研究所講究禄. No.1148. 170-174 (2000)
Hiromitsu Shiina:“通过改变前瞻方法扩展概率广义 LR 解析”京都大学数学科学研究所 Kōkyuroku No. 1148. 170-174 (2000)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

椎名 広光其他文献

字幕データ付き VOD 講義の単語頻度に対するカーネル密度推定による映像区間推定
使用核密度估计对带有字幕数据的 VOD 讲座的词频进行视频片段估计
  • DOI:
  • 发表时间:
    2010
  • 期刊:
  • 影响因子:
    0
  • 作者:
    小山登;小林伸行;椎名 広光;北川文 夫
  • 通讯作者:
    北川文 夫

椎名 広光的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('椎名 広光', 18)}}的其他基金

Development of Classroom Utterance Analysis System Using Advanced Algorithms
利用先进算法开发课堂话语分析系统
  • 批准号:
    23K11378
  • 财政年份:
    2023
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)

相似海外基金

組織に蓄積された訓練情報を活用した訓練項目・達成指標抽出システム技術の開拓
开发利用组织中积累的培训信息提取培训项目和成果指标的系统技术
  • 批准号:
    24K15243
  • 财政年份:
    2024
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
静的局所環境の学習によるタンパク質動的構造情報の抽出
通过学习静态局部环境提取蛋白质动态结构信息
  • 批准号:
    23K24942
  • 财政年份:
    2024
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
コストセンシティブ論文メタ情報抽出器とサイバーフィジカル論文ブラウザの開発
开发成本敏感的纸张元信息提取器和网络物理纸张浏览器
  • 批准号:
    23K25158
  • 财政年份:
    2024
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
新開発「RIKEN-LMS」で挑む南極深層アイスコアからの天文情報抽出
使用新开发的“RIKEN-LMS”从南极洲深层冰芯提取天文信息
  • 批准号:
    24H00255
  • 财政年份:
    2024
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
異なる規模の空間的異質性を抽出する:地理情報分析に基づく地域の特徴把握に向けて
提取不同尺度的空间异质性:基于地理信息分析理解区域特征
  • 批准号:
    23K20972
  • 财政年份:
    2024
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了