最適パターン発見に基づく大規模半構造データからの知的情報獲得システムの開発

基于最优模式发现的大规模半结构化数据智能信息获取系统开发

基本信息

  • 批准号:
    14019070
  • 负责人:
  • 金额:
    $ 3.97万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
  • 财政年份:
    2002
  • 资助国家:
    日本
  • 起止时间:
    2002 至 无数据
  • 项目状态:
    已结题

项目摘要

ネットワーク上に分散したウェブページやXML等の半構造データの急速な増大に対して,これらのコンテンツに直接アクセスするための効率良い手法の開発が緊急の課題となっている.本研究では,大規模半構造データからのデータマイニング(ウェブマイニング)に基づき,大量のデータ解析を対話的に支援する効率的なツールとして,従来の情報検索システムを超えた新しい情報アクセスシステムの開発を目指す.そのための鍵となる技術として,最適パターン発見を木やグラフ構造に拡張して,半構造データに対する頑健かつ高速な最適化パターン発見アルゴリズムを開発する.さらに,ウェブマイニングを(a)有用な情報源の発見,および(b)特徴的なパターンの発見,(c)情報抽出の3つの過程ととらえ,これらを有機的に結合して,半構造データを対象とした知識獲得システムの効率良い実現方式を明らかにすることを目標とする.また,計算量理論と計算学習理論の最新成果を援用し,計算量に徹底的に配慮した高速なアルゴリズムの開発を目指すのも特色である.平成14年度は,次の研究成果を得た.(a)「有用な情報源の発見」に関しては,従来より表現力の高いパターンである可変長変数パターン(VLDCパターン)に対する新しいテキスト索引構造を開発し,これを用いて,効率よい最適化マイニングアルゴリズムを開発した.(b)「特徴的なパターンの発見」に関しては,XML-MessagingとSOAPへの応用を目指して,昨年開発した半構造データマイニング手法FREQTを元に,高速な半構造データストリームマイニングSTREAMTを開発した.これは,非常に少なく資源を使いながらデータストリームを監視し、有用なパターンを逐次報告するアルゴリズムである.また,FREQTの最適化マイニングへの拡張と理論的性能解析を行い,この方式の最適性を示した.(c)「情報抽出」に関しては,XMLデータ処理の基本技術である符号語列上のパターン照合機械技術を開発し,XMLパターン検索への応用を考察した.
为了响应半结构化数据的快速增加,例如网络分布的网页和XML,开发直接访问这些内容的有效方法已成为一个紧迫的问题。在这项研究中,我们旨在开发新的信息访问系统,这些系统将超越传统信息搜索系统作为有效的工具,这些工具基于大规模半结构数据的数据挖掘(Web挖掘)进行交互式支持大量数据分析。作为此的关键技术,我们将将最佳模式发现扩展到树木和图形结构,以开发用于半结构数据的强大而快速的优化模式发现算法。此外,我们将Web挖掘视为三个过程:(a)发现有用的信息源,(b)发现独特的模式,以及(c)提取信息,并有机地结合这些模式,以揭示一种有效的方法,以实现针对半结构数据数据的知识获取系统。我们还使用计算复杂理论和计算学习理论的最新结果来考虑计算复杂性的高速算法。另一个独特的特征是我们旨在发展Gorm。在2002年,我们获得了以下研究结果。 (a)“发现有用的信息源”,我们为可变长度变量模式(VLDC模式)开发了一种新的文本索引结构,该结构比以前更具有表现力,并开发了有效的优化挖掘算法。 (b)“发现独特的模式”,这是一种半结构化数据挖掘方法,其目的是应用于XML-Messaging和SOAP。基于FREQT,我们开发了一个快速的半结构数据流挖掘流。这是一种算法,可监视数据流,同时使用很少的资源和报告有用的模式。我们还扩展了FREQT,以优化采矿和理论性能分析,以证明该方法的最佳性。 (c)关于“信息提取”,我们在CodeWord字符串上开发了一种模式匹配的机器技术,这是一种用于XML数据处理的基本技术,并讨论了其在XML模式搜索中的应用。

项目成果

期刊论文数量(12)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
竹田 正幸, 篠原 歩: "圧縮されたテキスト上のパターン照合-データ圧縮とパターン照合の新展開-"情報処理学会学会誌. 43(7). 763-769 (2002)
Masayuki Takeda、Ayumu Shinohara:“压缩文本的模式匹配 - 数据压缩和模式匹配的新发展”日本信息处理学会杂志 43(7) (2002)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
有村 博紀, 坂本 比呂志: "データマイニングにおける最適パターン発見"応用数理,応用数理学会. 12(4). 32-44 (2002)
Hiroki Arimura、Hiroshi Sakamoto:“发现数据挖掘中的最佳模式”应用数学,应用数学学会 12(4) (2002)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
K.Abe et al.: "Optimized Substructure Discovery for Semi-structured Data"Proc. 6th European Conf. on Principles and Practice of Knowledge Discovery in Databases(PKDD-2002). LNAI2431. 1-14 (2002)
K.Abe 等人:“半结构化数据的优化子结构发现”Proc。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
T.Asai et al.: "Efficient Substructure Discovery from Large Semi-structured Data"Proc. Second SIAM International Conference on Data Mining(SDM'02). 158-174 (2002)
T.Asai 等人:“从大型半结构化数据中进行有效的子结构发现”Proc。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
T.Asai et al.: "Online Algorithms for Mining Semi-structured Data Stream"Proc. IEEE International Conference on Data Mining(ICDM'02). 27-34 (2002)
T.Asai 等人:“挖掘半结构化数据流的在线算法”Proc。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

有村 博紀其他文献

ルールリストに対するRashomon集合の厳密計算と予測多重性解析
规则列表罗生门集的精确计算和预测多重性分析
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    又 康太;金森 憲太朗;有村 博紀
  • 通讯作者:
    有村 博紀
Parallel vertex and facet enumeration with mplrs
使用 mplrs 进行并行顶点和面枚举
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    佐々木 耀一,渋谷 哲朗,大森 亮介,伊藤 公人;有村 博紀;Thomas Zeugmann;Skip Jordan
  • 通讯作者:
    Skip Jordan
Variable Importance Cloudの要約方法と決定木に対する実験的評価
变量重要性云汇总方法和决策树的实验评估
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    又 康太;金森 憲太朗;有村 博紀
  • 通讯作者:
    有村 博紀
Fairness-aware Edit of Thresholds in a Learned Decision Tree Using a Mixed Integer Programming Formulatio
使用混合整数规划公式对学习决策树中的阈值进行公平感知编辑
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    金森 憲太朗;有村 博紀
  • 通讯作者:
    有村 博紀
順序決定木に対する正則化パラメータ推定の高速化
加速排序树的正则化参数估计
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    金森 憲太朗;石畠 正和;湊 真一;有村 博紀
  • 通讯作者:
    有村 博紀

有村 博紀的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('有村 博紀', 18)}}的其他基金

Development of Next-generation Semi-Structured Data Mining Technology Towards The Real-World Knowledge Creation Infrastructure
面向现实世界知识创造基础设施的下一代半结构化数据挖掘技术的开发
  • 批准号:
    20H00595
  • 财政年份:
    2020
  • 资助金额:
    $ 3.97万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
最適パターン発見に基づく大規模半構造データからの知的情報獲得システムの開発
基于最优模式发现的大规模半结构化数据智能信息获取系统开发
  • 批准号:
    15017268
  • 财政年份:
    2003
  • 资助金额:
    $ 3.97万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
最適パターン発見に基づく大規模半構造データからの知的情報獲得システムの開発
基于最优模式发现的大规模半结构化数据智能信息获取系统开发
  • 批准号:
    13224073
  • 财政年份:
    2001
  • 资助金额:
    $ 3.97万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas (C)
高度知識ベースを対象とした知識獲得システムの研究
针对高级知识库的知识获取系统研究
  • 批准号:
    11780277
  • 财政年份:
    1999
  • 资助金额:
    $ 3.97万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
超大規模データからの高速データマイニング・システムの研究
超大规模数据高速数据挖掘系统研究
  • 批准号:
    09230215
  • 财政年份:
    1997
  • 资助金额:
    $ 3.97万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
高度知識ベースを対象とした知識獲得システムの研究
针对高级知识库的知识获取系统研究
  • 批准号:
    09780343
  • 财政年份:
    1997
  • 资助金额:
    $ 3.97万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
大規模オブジェクト指向データベースを対象とした知識獲得システムの研究
大规模面向对象数据库知识获取系统研究
  • 批准号:
    08780371
  • 财政年份:
    1996
  • 资助金额:
    $ 3.97万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
大規模オブジエクト指向データベースを対象とした知識獲得システムの研究
大规模面向对象数据库知识获取系统研究
  • 批准号:
    07780339
  • 财政年份:
    1995
  • 资助金额:
    $ 3.97万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
プログラム自動合成システムにおける一般化を用いた効率的学習の基礎的研究
自动程序合成系统中泛化高效学习的基础研究
  • 批准号:
    04750354
  • 财政年份:
    1992
  • 资助金额:
    $ 3.97万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)

相似海外基金

Designing drug products suitable for the youngest patient. Enabling access to medicines for the most vulnerable and complex patient population.
设计适合最年轻患者的药品。
  • 批准号:
    2304056
  • 财政年份:
    2019
  • 资助金额:
    $ 3.97万
  • 项目类别:
    Studentship
Investigation on the most suitable morphology of orthodontic HAo/Col coating onplant by using finite element method
有限元法研究正畸HAo/Col涂层最适合种植体的形貌
  • 批准号:
    15K11341
  • 财政年份:
    2015
  • 资助金额:
    $ 3.97万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Establishment of Evidence for the most suitable Position to Perform Excretion on a Bed
建立最适合在床上排泄的姿势的证据
  • 批准号:
    15K20682
  • 财政年份:
    2015
  • 资助金额:
    $ 3.97万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
Establishment of the most suitable method to evaluate the adhesive strength
建立最合适的粘合强度评估方法
  • 批准号:
    15K14150
  • 财政年份:
    2015
  • 资助金额:
    $ 3.97万
  • 项目类别:
    Grant-in-Aid for Challenging Exploratory Research
Analysis on the most suitable allocation of resources of the emissions trading scheme (ETS) assuming maximization behavior of national interests by national sovereignty
假设国家主权国家利益最大化行为下碳排放权交易体系(ETS)资源最适宜配置分析
  • 批准号:
    26550110
  • 财政年份:
    2014
  • 资助金额:
    $ 3.97万
  • 项目类别:
    Grant-in-Aid for Challenging Exploratory Research
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了