構文解析木を対象とするデータ解析法の研究
针对解析树的数据分析方法研究
基本信息
- 批准号:08207228
- 负责人:
- 金额:$ 0.83万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research on Priority Areas
- 财政年份:1996
- 资助国家:日本
- 起止时间:1996 至 无数据
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本研究は,文のデータ解析に知識発見法を利用するが、研究の進め方は以下のように分類できる。(1)作家・作品毎の文データに含まれる計量データを表形式のデータとして探索的なデータ解析法を行う。(2)構文木を解析対象として(2-1)構文木データを数値パラメータ化し,通常の属性/属性値対からなる表式データに変換し(1)の方法で解析する,(2-2)ID3法を拡張して,構文木の構造を直接扱う新しい分析法を開発する。平成8年度の研究計画の策定においては,(1)と(2-2)を中心としてシステムの開発と応用を行った。1.上記(1)の作家の文体研究に関しては,金氏らにより収集された表形式データに対する解析を,本年度も継続して推進し、作家の文体上の特徴を発見する方法を知識発見法Datalogic/Rを用いておこなった。2.解析結果の解釈で必要な視覚化作業を支援する,知識発見サポートシステムDLXの開発も継続して行った。3.得られた結果は,通常の多変量解析によるものと比較して非常に理解しやすいものであり,今後の文体研究に多く使われていくと考えられる。これらの成果は論文として発表した。4.(2-2)の解析木の構造を直接扱い分析を行う新しい方法論を確立し、アルゴリズムの作成、システムの開発をおこなった。昨年度段階の方法論では,構文木のトポロジー的な属性のみを対象としたが、本年度は解析木中の各節点に多くの属性が付随していることに着目し、これらの属性を統一的に取り扱うためにviewpointと周辺の連結された節点の集合field-of-viewを定義し,その内部の属性すべてを拡張されたID3法で分析するシステムの開発を行った。5.4.に述べたシステムを国語学の研究課題として長い歴史を持つ「が」と「は」の用法に適用し知識発見を行った。また利用すべきデータについては,最近市販されたEDRコーパスのその構文情報を用いた。6.5.で得られた結果は、助詞「が」、「は」に関する既知の文法的制約をいくつか発見できたばかりではなく、これら助詞の使用法に関する統計的な性質に対して多くの知見を得ることができた。7.以上で述べた(2-2)の方向での研究成果のまとめは,本重点領域研究の数量的分析班主催の公開シンポジウム「人文科学と数量的分析」で報告した。
本研究采用知识发现方法进行句子数据分析,研究方法可分为以下几类。 (1) 使用每个作者的句子数据中包含的定量数据进行探索性数据分析方法,并将其作为表格数据。 (2)以语法树为分析对象,(2-1)将语法树数据转换为数值参数,转换为由普通属性/属性值对组成的表格数据,并使用(1)中的方法进行分析; (2-2) ) 通过扩展ID3方法,我们开发了一种直接处理语法树结构的新分析方法。在制定1996年研究计划时,我们重点开发和应用了(1)和(2-2)的系统。 1. 关于上述(1)中提到的作家写作风格的研究,今年我们将继续分析 Kaneji 等人收集的表格数据。这是使用 Datalogic/R 完成的。 2.我们继续开发知识发现支持系统DLX,支持解释分析结果所需的可视化工作。 3.得到的结果比普通的多元分析得到的结果更容易理解,我们相信它们将在未来的文体研究中得到广泛的应用。这些结果以论文形式发表。我们建立了一种直接处理和分析4.(2-2)中分析树结构的新方法,创建了算法,并开发了系统。去年的方法论只关注语法树的拓扑属性,但今年,我们关注的是解析树中的每个节点都有很多属性,并且会以统一的方式处理这些属性,为此,我们定义了一个字段—— of-view 是围绕视点的一组连接节点,并开发了一个使用扩展 ID3 方法分析视场内所有属性的系统。我们将5.4中描述的系统应用于“ga”和“ha”的使用,这两个词作为日语语言学的研究主题有着悠久的历史,以发现知识。至于要使用的数据,我们使用了最近商用的 EDR 语料库中的句法信息。第 6.5 节中获得的结果不仅让我们发现了一些关于助词“ga”和“wa”的已知语法约束,而且还为这些助词 I 的使用的统计特性提供了很多见解。能够做到这一点。 7、上述方向(2-2)的研究成果总结在该优先研究领域定量分析组主办的“人文与定量分析”公开研讨会上进行了汇报。
项目成果
期刊论文数量(6)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
雄 山 真 弓: "知識発見法による探索的データ解析" 日本計算機統計学会誌.
Mayumi Yuyama:“使用知识发现方法进行探索性数据分析”日本计算机统计学会杂志。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
雄山 真弓其他文献
雄山 真弓的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('雄山 真弓', 18)}}的其他基金
構文解析木を対象とするデータ解析法の研究
针对解析树的数据分析方法研究
- 批准号:
07207236 - 财政年份:1995
- 资助金额:
$ 0.83万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
相似海外基金
PRIVACY PRESERVING COLLABORATIVE FILTERING BASED ON INFORMATION GEOMETRY
基于信息几何的隐私保护协同过滤
- 批准号:
22500142 - 财政年份:2010
- 资助金额:
$ 0.83万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
論理簡単化を応用した決定ルール発見に関する研究
应用逻辑简化的决策规则发现研究
- 批准号:
16700214 - 财政年份:2005
- 资助金额:
$ 0.83万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
Development of Time Series Analysis Software Based on State-Space Modeling
基于状态空间建模的时间序列分析软件开发
- 批准号:
13558025 - 财政年份:2001
- 资助金额:
$ 0.83万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
構文解析木を対象とするデータ解析法の研究
针对解析树的数据分析方法研究
- 批准号:
10111231 - 财政年份:1998
- 资助金额:
$ 0.83万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas (A)
構文解析木を対象とするデータ解析法の研究
针对解析树的数据分析方法研究
- 批准号:
09204234 - 财政年份:1997
- 资助金额:
$ 0.83万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas