構文解析木を対象とするデータ解析法の研究

针对解析树的数据分析方法研究

基本信息

  • 批准号:
    09204234
  • 负责人:
  • 金额:
    $ 0.83万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
  • 财政年份:
    1997
  • 资助国家:
    日本
  • 起止时间:
    1997 至 无数据
  • 项目状态:
    已结题

项目摘要

本研究は、これまでの統計的手法等のデータ解析では見出せなかった新しい知識発見法を適用し、構造を持つデータの解析を行うもので、研究の進め方は以下のように分類できる。構造を持つデータ、例えば時系列データや構文木などを対象とする分析法を開発するには、以下の方法が考えられる。(2-1)構造自体を種々の観点から数値パラメータ化し通常の属性/属性値対からなる表式データに変換し解析する。(2-2)知識発見法の分類法であるID3法を拡張して、構造を直接取り扱う新しい分析法を開発する。平成9年度は、(2-2)のシステムの開発とその応用をおこなった。1.(2-2)の構造を持つデータについては構文解析木の構造を直接扱い分析できる新しい方法論を確立し、アルゴリズムを作成した。本方法は、構文解析木の中で特定の節点を指定しこれをviewpointとしてこの周辺構造のパターンを探索的求めるものである。分析の方法は、解析木の各節点のトポロジー的な属性と構文木のもつ品詞や意味構造などの属性に着目し、これらの属性を統一的に取り扱うために凶viewpoint周辺の連結された節点の集合field-of-viewを定義し、その内部構造を拡張されてID3法で分析した。2.1.の方法でSYKDシステムの開発をWindows上でC++を用いて行った。システムは使いやすさを考慮してwindows画面で計算制御を行うことができる。3.SYKDシステムを使って、EDR日本語データベースを解析する実験を行った。膨大なEDRコーパスデータからSYKD用にデータを引き出すためのPro-Defシステムを開発した。4.助詞「が」と「は」の周辺構造の差異を調べるためにEDRコーパスから10,000以上の文例を抜き出してSYKDシステムを使って分析をおこなった。助詞「が」と「は」の周辺における構造的特徴や使用頻度の高いパターンや少ないパターンなどを発見できた。5.6種類の助詞「が」「は」「と」「て」「に」「で」のそれぞれについて、7000文例以上を対象にその周辺構造を調べた。研究成果は論文と口頭で発表した。
本研究通过应用统计方法等传统数据分析无法发现的新知识发现方法来分析结构化数据。研究过程可分为以下几类。可以考虑以下方法来开发结构化数据的分析方法,例如时间序列数据和语法树。 (2-1)将结构本身转换为各种视点的数值参数,转换为由普通属性/属性值对组成的表格数据,并进行分析。 (2-2)通过扩展ID3方法(知识发现方法的分类方法),我们将开发一种直接处理结构的新分析方法。 1997年,我们开发了系统(2-2)并应用。 1. 对于具有(2-2)所示结构的数据,我们建立了一种可以直接处理和分析解析树结构的新方法,并创建了算法。该方法指定解析树中的特定节点,并使用该节点作为视点来搜索周围结构中的模式。该分析方法重点关注解析树中各个节点的拓扑属性以及句法树的词性、语义结构等属性,为了统一处理这些属性,我们定义了视点周围的连接节点设定视场并使用扩展ID3方法分析其内部结构。 SYKD系统是在Windows上使用C++开发的,采用2.1中描述的方法。为了方便使用,系统可以在Windows屏幕上控制计算。 3.我们使用SYKD系统进行了EDR日语数据库分析实验。我们开发了一个Pro-Def系统,用于从大量EDR语料数据中提取SYKD数据。 4. 为了考察助词“ga”和“wa”周围结构的差异,我们从EDR语料库中提取了10000多个句例,并使用SYKD系统进行了分析。我们能够发现粒子“ga”和“wa”周围的结构特征,以及经常使用的模式和不经常使用的模式。 5. 六种粒子“ga”、“ha”、“to”、“te”、“ni”、“de”的周围结构分别为使用 7000 多个句子示例进行调查。研究结果以论文和口头形式呈现。

项目成果

期刊论文数量(6)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
雄山真弓: "知識発見法を用いた読点データからの作家の特徴抽出" 関西学院大学情報科学研究. 11号. 53-61 (1996)
Mayumi Oyama:“使用知识发现方法从逗号数据中提取作家特征”关西学院大学信息科学研究11,第53-61期(1996)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
雄山真弓(比嘉): "知識発見法による探索的データ解析" 日本計算機統計学会誌. 9巻1号. 1-12 (1996)
Mayumi Oyama(比嘉):“使用知识发现方法进行探索性数据分析”,日本计算机统计学会杂志,第 9 卷,第 1. 1-12 期(1996 年)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
岡田 孝: "知識発見サポートシステムDLX" 関西学院大学情報科学研究. 11号. 23-35 (1996)
冈田隆:《知识发现支持系统DLX》《关西学院大学信息科学研究》第11期第23-35期(1996年)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

比嘉 真弓其他文献

比嘉 真弓的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

相似海外基金

PRIVACY PRESERVING COLLABORATIVE FILTERING BASED ON INFORMATION GEOMETRY
基于信息几何的隐私保护协同过滤
  • 批准号:
    22500142
  • 财政年份:
    2010
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
論理簡単化を応用した決定ルール発見に関する研究
应用逻辑简化的决策规则发现研究
  • 批准号:
    16700214
  • 财政年份:
    2005
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
Development of Time Series Analysis Software Based on State-Space Modeling
基于状态空间建模的时间序列分析软件开发
  • 批准号:
    13558025
  • 财政年份:
    2001
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
構文解析木を対象とするデータ解析法の研究
针对解析树的数据分析方法研究
  • 批准号:
    10111231
  • 财政年份:
    1998
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas (A)
構文解析木を対象とするデータ解析法の研究
针对解析树的数据分析方法研究
  • 批准号:
    08207228
  • 财政年份:
    1996
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了