Research on statistical discovery of a wide var i ety of patterns with low frequencies and its applications

多种低频模式的统计发现及其应用研究

基本信息

  • 批准号:
    21650031
  • 负责人:
  • 金额:
    $ 2.09万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Challenging Exploratory Research
  • 财政年份:
    2009
  • 资助国家:
    日本
  • 起止时间:
    2009 至 2011
  • 项目状态:
    已结题

项目摘要

The goal of this research is to develop a framework to, given large text data, discover patterns which do not appear frequently. To achieve this goal, we review our existing researches from the following two viewpoints : Mapping of letters for pattern discovery : Using an approximate pattern matching, we have proposed a pattern discovery and evaluated by experiments. In this method, we have found that mapping from several letters into one digit plays an important role. Metric space for pattern discovery : The goal of this topic is to distinguish patterns from non用atterns. Instead of a rigid metric space, we first find usual substructures, and then we find a pattern as a combination of usual substructures. We have evaluated this method by experiments on genome sequences and Web documents.
这项研究的目的是开发一个框架,以鉴于大量的文本数据,发现不经常出现的模式。为了实现这一目标,我们从以下两个观点回顾了现有的研究:用于模式发现字母的映射:使用近似模式匹配,我们提出了一个模式发现并通过实验进行了评估。在这种方法中,我们发现将几个字母映射到一个数字中起着重要作用。模式发现的度量空间:该主题的目标是将模式与非模式区分开。我们首先找到通常的子结构,而不是刚性的度量空间,然后找到一种模式作为通常的子结构的组合。我们已经通过基因组序列和Web文档的实验评估了这种方法。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
変化点検出を応用した時系列データからの突発現象の前兆検出アルゴリズム
使用变化点检测从时间序列数据中检测突发事件迹象的算法
  • DOI:
  • 发表时间:
    2010
  • 期刊:
  • 影响因子:
    0
  • 作者:
    徳永旭将;池田大輔;中村和幸;樋口知之;吉川顕正;魚住禎司;藤本晶子;森岡昭;湯元清文;CPMN Group
  • 通讯作者:
    CPMN Group
FFTを用いた不一致を許す文字列照合アルゴリズムの精度評価,査読有,情報処理学会論文誌
使用 FFT 进行允许不匹配的字符串匹配算法的准确性评估,同行评审,日本信息处理学会杂志
  • DOI:
  • 发表时间:
    2009
  • 期刊:
  • 影响因子:
    0
  • 作者:
    中藤i哲也;馬場謙介;池田大輔;森雅生;廣川佐千男'
  • 通讯作者:
    廣川佐千男'
Graph Clustering Based on Optimization of A Macroscopic Structure of Clusters
基于簇宏观结构优化的图聚类
  • DOI:
  • 发表时间:
    2011
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Xin Kang;Fuji Ren;Yuta Taniguchi and Daisuke Ikeda
  • 通讯作者:
    Yuta Taniguchi and Daisuke Ikeda
FFTを用いた不一致を許す文字列照合アルゴリズムの精度評価
使用 FFT 允许不匹配的字符串匹配算法的精度评估
String Matching with Mismatches by Real-valued FFT
通过实值 FFT 进行不匹配的字符串匹配
  • DOI:
  • 发表时间:
    2010
  • 期刊:
  • 影响因子:
    0
  • 作者:
    比嘉由紀子;Nguyen Thi Yen;Tran Hai Son;Hoang Minh Duc;高木正洋;八田珠郎・宮脇律郎・根本清子・篠原也寸志・真木太一・山田裕久・田村堅志;Kensuke Baba
  • 通讯作者:
    Kensuke Baba
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

IKEDA Daisuke其他文献

IKEDA Daisuke的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('IKEDA Daisuke', 18)}}的其他基金

Hierarchical Discovery of Sub-structures and Rare Patterns of Them in Large Text Data
大文本数据中子结构及其罕见模式的分层发现
  • 批准号:
    24300059
  • 财政年份:
    2012
  • 资助金额:
    $ 2.09万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Test of Radar Echo Detection using Electron Beam for Future Large Air Shower Observatory
未来大型风淋室天文台电子束雷达回波探测试验
  • 批准号:
    23654078
  • 财政年份:
    2011
  • 资助金额:
    $ 2.09万
  • 项目类别:
    Grant-in-Aid for Challenging Exploratory Research
Evolution of fast skeletal myosin heavy chain genes of fish
鱼类快速骨骼肌球蛋白重链基因的进化
  • 批准号:
    23780214
  • 财政年份:
    2011
  • 资助金额:
    $ 2.09万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
The origin and purpose of fast skeletal muscle myosin heavy chain gene cluster of vertebrates
脊椎动物快骨骼肌肌球蛋白重链基因簇的起源和目的
  • 批准号:
    21780198
  • 财政年份:
    2009
  • 资助金额:
    $ 2.09万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
Pattern Discovery from Large Text Data Based on the Property of Languages Being Scale-Free
基于语言无标度特性的大文本数据模式发现
  • 批准号:
    19700150
  • 财政年份:
    2007
  • 资助金额:
    $ 2.09万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
Study of High-speed Data Mining Algorithms from Massive Data Streams
海量数据流高速数据挖掘算法研究
  • 批准号:
    15300036
  • 财政年份:
    2003
  • 资助金额:
    $ 2.09万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)

相似海外基金

テキストマイニングを用いたレビュー分析にみる観光地へのニーズと影響要因
基于文本挖掘的评论分析中的旅游目的地需求及影响因素
  • 批准号:
    24K15556
  • 财政年份:
    2024
  • 资助金额:
    $ 2.09万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
テキストマイニングを活用した中国語会話学習プラットフォームの開発
基于文本挖掘的汉语会话学习平台的开发
  • 批准号:
    24K04084
  • 财政年份:
    2024
  • 资助金额:
    $ 2.09万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
帝国議会議事速記録のコーパス化とテキストマイニングによる近代日本語史の解明
通过帝国国会会议记录的语料库记录和文本挖掘阐明现代日本的历史
  • 批准号:
    23K25329
  • 财政年份:
    2024
  • 资助金额:
    $ 2.09万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
選挙期間中に候補者が発信するソーシャルメディアのコンテンツ分析
选举期间候选人发布的社交媒体内容分析
  • 批准号:
    23K11766
  • 财政年份:
    2023
  • 资助金额:
    $ 2.09万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
テキストマイニングによるIASB概念フレームワークの本質的特徴の析出
使用文本挖掘分析 IASB 概念框架的基本特征
  • 批准号:
    23K17557
  • 财政年份:
    2023
  • 资助金额:
    $ 2.09万
  • 项目类别:
    Grant-in-Aid for Challenging Research (Exploratory)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了