構文解析木を対象とするデータ解析法の研究

针对解析树的数据分析方法研究

基本信息

  • 批准号:
    09204234
  • 负责人:
  • 金额:
    $ 0.83万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
  • 财政年份:
    1997
  • 资助国家:
    日本
  • 起止时间:
    1997 至 无数据
  • 项目状态:
    已结题

项目摘要

本研究は、これまでの統計的手法等のデータ解析では見出せなかった新しい知識発見法を適用し、構造を持つデータの解析を行うもので、研究の進め方は以下のように分類できる。構造を持つデータ、例えば時系列データや構文木などを対象とする分析法を開発するには、以下の方法が考えられる。(2-1)構造自体を種々の観点から数値パラメータ化し通常の属性/属性値対からなる表式データに変換し解析する。(2-2)知識発見法の分類法であるID3法を拡張して、構造を直接取り扱う新しい分析法を開発する。平成9年度は、(2-2)のシステムの開発とその応用をおこなった。1.(2-2)の構造を持つデータについては構文解析木の構造を直接扱い分析できる新しい方法論を確立し、アルゴリズムを作成した。本方法は、構文解析木の中で特定の節点を指定しこれをviewpointとしてこの周辺構造のパターンを探索的求めるものである。分析の方法は、解析木の各節点のトポロジー的な属性と構文木のもつ品詞や意味構造などの属性に着目し、これらの属性を統一的に取り扱うために凶viewpoint周辺の連結された節点の集合field-of-viewを定義し、その内部構造を拡張されてID3法で分析した。2.1.の方法でSYKDシステムの開発をWindows上でC++を用いて行った。システムは使いやすさを考慮してwindows画面で計算制御を行うことができる。3.SYKDシステムを使って、EDR日本語データベースを解析する実験を行った。膨大なEDRコーパスデータからSYKD用にデータを引き出すためのPro-Defシステムを開発した。4.助詞「が」と「は」の周辺構造の差異を調べるためにEDRコーパスから10,000以上の文例を抜き出してSYKDシステムを使って分析をおこなった。助詞「が」と「は」の周辺における構造的特徴や使用頻度の高いパターンや少ないパターンなどを発見できた。5.6種類の助詞「が」「は」「と」「て」「に」「で」のそれぞれについて、7000文例以上を対象にその周辺構造を調べた。研究成果は論文と口頭で発表した。
这项研究应用了在数据分析(例如统计方法)中找不到的新知识发现方法,并使用结构分析数据,并且可以将研究过程分类如下。可以考虑以下方法来开发针对结构数据的分析方法,例如时间序列数据和句法树。 (2-1)从各个角度将结构本身从数值上进行了参数化,转换为由正常属性/属性值对组成的表格数据,并进行了分析。 (2-2)我们将扩展ID3方法,即知识发现的分类方法,并开发一种直接处理结构的新分析方法。 1997年,我们开发并应用了(2-2)系统。 1.对于具有结构(2-2)的数据,建立了一种新的方法,该方法允许直接处理解析树的结构,并创建了算法。该方法使用搜索来确定该外围结构的模式,通过在解析树中指定特定节点并将其用作视点。分析方法侧重于分析树中每个节点的拓扑属性,以及诸如语法树的语音和语义结构等属性。为了统一处理这些属性,定义了不良视点周围连接的节点的视野集,并使用ID3方法扩展和分析了节点的内部结构。使用2.1中描述的方法在Windows上使用C ++开发了SYKD系统。考虑到易用性,该系统可以在Windows屏幕上执行计算控制。 3。使用SYKD系统进行了一个实验,以分析EDR日本数据库。我们已经开发了一个Pro-DEF系统,用于从SYKD的大量EDR语料库数据中提取数据。 4。为了研究颗粒“ GA”和“ HA”的外围结构的差异,从EDR语料库中提取了超过10,000个句子示例,并使用SYKD系统进行了分析。我们能够发现粒子“ GA”和“ HA”周围的结构特征,这些图案经常使用且很少使用。 5。对粒子“ ga”,“ ha”,“ to”,“ te”,“ ni”和“ de”的周围结构进行了7,000多个句子的检查。研究结果在论文和口头中提出。

项目成果

期刊论文数量(6)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
雄山真弓: "知識発見法を用いた読点データからの作家の特徴抽出" 関西学院大学情報科学研究. 11号. 53-61 (1996)
Mayumi Oyama:“使用知识发现方法从逗号数据中提取作家特征”关西学院大学信息科学研究11,第53-61期(1996)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
雄山真弓(比嘉): "知識発見法による探索的データ解析" 日本計算機統計学会誌. 9巻1号. 1-12 (1996)
Mayumi Oyama(比嘉):“使用知识发现方法进行探索性数据分析”,日本计算机统计学会杂志,第 9 卷,第 1. 1-12 期(1996 年)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
岡田 孝: "知識発見サポートシステムDLX" 関西学院大学情報科学研究. 11号. 23-35 (1996)
冈田隆:《知识发现支持系统DLX》《关西学院大学信息科学研究》第11期第23-35期(1996年)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

比嘉 真弓其他文献

比嘉 真弓的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

相似海外基金

NICHD Maternal Fetal Medicine Units Network
NICHD 母胎医学单位网络
  • 批准号:
    7389676
  • 财政年份:
    2006
  • 资助金额:
    $ 0.83万
  • 项目类别:
Washington Obstetric-Fetal Pharmacology Research Unit
华盛顿产胎儿药理学研究单位
  • 批准号:
    7695403
  • 财政年份:
    2004
  • 资助金额:
    $ 0.83万
  • 项目类别:
構文解析木を対象とするデータ解析法の研究
针对解析树的数据分析方法研究
  • 批准号:
    10111231
  • 财政年份:
    1998
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas (A)
構文解析木を対象とするデータ解析法の研究
针对解析树的数据分析方法研究
  • 批准号:
    08207228
  • 财政年份:
    1996
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
構文解析木を対象とするデータ解析法の研究
针对解析树的数据分析方法研究
  • 批准号:
    07207236
  • 财政年份:
    1995
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了