文字列集合からの高速パターン抽出アルゴリズムの開発と実働化

字符串集高速模式提取算法的开发与实现

基本信息

  • 批准号:
    14780226
  • 负责人:
  • 金额:
    $ 2.05万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
  • 财政年份:
    2002
  • 资助国家:
    日本
  • 起止时间:
    2002 至 2004
  • 项目状态:
    已结题

项目摘要

昨年度まで,入力として与えられた文字列集合から,それを特徴付ける一つのパターンを高速に見つけるアルゴリズムの開発をさまざまなパターン族に対して行ってきた.最終年度にあたる本年度は,それをさらに推し進め,複数のパターンの組み合わせによってより柔軟な表現を可能にすることを目指した.当然のことながらこの拡張を行うと,探索空間がさらに広がるために計算時間の増大が問題となる.我々は,接尾辞木を巧妙に活用することによって,与えられた文字列集合を特徴づけるのに最もよいパターン対を効率よく見つけるアルゴリズムの開発に成功した.接尾辞木は,線形サイズとはいえ領域効率があまりよくないため,大規模な文字列に対しては適用しにくくなる.そこで我々は,より領域効率のよい接尾辞配列を用いて接尾辞木を模倣することによって,実装上の観点からも有効なアルゴリズムを与え,計算機実験によってその効果を実証した.また,2つのパターン対の出現する位置の相対距離に関する条件を自由に与えることによって,より表現力を高めたパターン発見問題についても,効率のよいアルゴリズムを与えることができた.さらに,候補となるパターンが与えられた文字列に合致するかどうかを高速に判定するためのデータ構造として,3分木を活用した有向無閉路文字列グラフや,圧縮無閉路文字列グラフについての考察を行った.そしてこの一連のパターン発見問題に関する我々の研究を関連研究と比較しながら総括した.
直到去年,我们已经开发了一种算法,以查找一个图案,该模式是从今年的弦乐集中进行的,这是我们的旨在促进更多灵活性的。通过将模式组合起来,如果执行此扩展,探索空间将进一步扩展,因此我们将增加计算时间辞职并不是很好的线性,因此很难使用较大的尺寸字符串,该效果通过计算器实验证明,另外,为图案发现问题提供了有效的算法,该算法通过自由提供两种模式的相对距离来提高表现力。匹配高速给定的字符串,它是一个不均匀的尾随字符串,使用3分钟的树和压缩。 。

项目成果

期刊论文数量(14)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Masahiro Hirao et al.: "A practical algorithm to find the best subsequences patterns"Theoretical Computer Science. Vol.292. 465-479 (2003)
Masahiro Hirao 等人:“寻找最佳子序列模式的实用算法”理论计算机科学。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
S.Inenaga et al.: "The Minimum DAWG for All Suffixes of a String and Its Applications"Lecture Notes in Computer Science. 2373. 151-165 (2002)
S.Inenaga 等人:“字符串所有后缀的最小 DAWG 及其应用”计算机科学讲义。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
M.Hirao et al.: "A practical algorithm to find the best subsequences patterns"Theoretical Computer Science. 292(2). 465-479 (2003)
M.Hirao 等人:“寻找最佳子序列模式的实用算法”理论计算机科学。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
S.Inenaga et al.: "Space-Economical Construction of Index Structures for All-Suffixes of a String"Lecture Notes in Computer Science. 2534. 86-97 (2002)
S.Inenaga 等人:“字符串所有后缀索引结构的空间经济构造”计算机科学讲义。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
H.Bannai et al.: "A String Pattern Regression Algorithm and Its Application to Pattern Discovery in Long Introns"Genome Informatics. 13. 3-11 (2002)
H.Bannai 等人:“字符串模式回归算法及其在长内含子模式发现中的应用”基因组信息学。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

篠原 歩其他文献

Algorithmic Learning Theory with Elementary Formal Systems
具有基本形式系统的算法学习理论
  • DOI:
  • 发表时间:
    1992
  • 期刊:
  • 影响因子:
    0
  • 作者:
    S. Arikawa;有川 節夫;S. Miyano;宮野 悟;A. Shinohara;篠原 歩;T. Shinohara;篠原 武;Akihiro Yamamoto;山本 章博
  • 通讯作者:
    山本 章博
Learnability of Subsequence Languages
后续语言的可学习性
  • DOI:
  • 发表时间:
    1996
  • 期刊:
  • 影响因子:
    0
  • 作者:
    松本 哲志;篠原 歩
  • 通讯作者:
    篠原 歩
セキュアな全文検索手法の提案
一种安全的全文检索方法的提出
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    石野 明;篠原 歩
  • 通讯作者:
    篠原 歩
Learning Elementary Formal Systems and an Application to Discovering Motifs in Proteins
学习基本形式系统和发现蛋白质基序的应用
  • DOI:
  • 发表时间:
    1991
  • 期刊:
  • 影响因子:
    0
  • 作者:
    S. Miyano;宮野 悟;A. Shinohara;篠原 歩;T. Shinohara;篠原 武
  • 通讯作者:
    篠原 武
パラメタ化パターン照合のための索引グラフ構造
用于参数化模式匹配的索引图结构
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    中島 克仁;藤里 法輝;ディプタラマ ヘンリアン;中島 祐人;吉仲 亮 ;稲永 俊介;坂内 英夫;篠原 歩;竹田 正幸
  • 通讯作者:
    竹田 正幸

篠原 歩的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('篠原 歩', 18)}}的其他基金

Data Compression: theoretical and practical approaches to the smallest grammar problem
数据压缩:解决最小语法问题的理论和实践方法
  • 批准号:
    21K11745
  • 财政年份:
    2021
  • 资助金额:
    $ 2.05万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
非明示的表現に対するアルゴリズムの開発
隐式表示算法的开发
  • 批准号:
    16092220
  • 财政年份:
    2004
  • 资助金额:
    $ 2.05万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
遺伝子ネットワークの解析と可視化システムの開発
基因网络分析与可视化系统开发
  • 批准号:
    13208025
  • 财政年份:
    2001
  • 资助金额:
    $ 2.05万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas (C)
遺伝子ネットワークの解析と可視化システムの開発
基因网络分析与可视化系统开发
  • 批准号:
    12208036
  • 财政年份:
    2000
  • 资助金额:
    $ 2.05万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas (C)
探索アルゴリズムの理論とその実働化に関する研究
搜索算法理论及其实际应用研究
  • 批准号:
    11780278
  • 财政年份:
    1999
  • 资助金额:
    $ 2.05万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
領域予測のための機械発見システムの研究
区域预测机器发现系统研究
  • 批准号:
    09272219
  • 财政年份:
    1997
  • 资助金额:
    $ 2.05万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
発見的探索アルゴリズムの理論と実働化
启发式搜索算法的理论与实际应用
  • 批准号:
    09780344
  • 财政年份:
    1997
  • 资助金额:
    $ 2.05万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
機械学習と機械発見による生物情報の概念形成
通过机器学习和机器发现形成生物信息的概念
  • 批准号:
    08283217
  • 财政年份:
    1996
  • 资助金额:
    $ 2.05万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
発見的探索アルゴリズムの理論と実働化
启发式搜索算法的理论与实际应用
  • 批准号:
    08780366
  • 财政年份:
    1996
  • 资助金额:
    $ 2.05万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
確率論的近似学習と計算論的教示の理論
概率近似学习理论与计算教学
  • 批准号:
    07780334
  • 财政年份:
    1995
  • 资助金额:
    $ 2.05万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)

相似海外基金

データマイニングに基づく最適加工条件の逆予測手法の検証と加工制御への応用
基于数据挖掘的最佳加工条件逆预测方法验证及其在加工控制中的应用
  • 批准号:
    24K00781
  • 财政年份:
    2024
  • 资助金额:
    $ 2.05万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
マルチスケール構造モデリングの実現による行動変容を促す検索・推薦システムの開発
开发通过实现多尺度结构建模促进行为改变的搜索和推荐系统
  • 批准号:
    23H03503
  • 财政年份:
    2023
  • 资助金额:
    $ 2.05万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Building a predictive model of L2 Japanese development from intermediate to advanced level for Korean and Chinese learners
为韩语和中文学习者构建从中级到高级的第二语言发展预测模型
  • 批准号:
    23K00636
  • 财政年份:
    2023
  • 资助金额:
    $ 2.05万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
データ融合による信頼性の高い金融市場モデル構築
通过数据融合构建可靠的金融市场模型
  • 批准号:
    22KJ0544
  • 财政年份:
    2023
  • 资助金额:
    $ 2.05万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
Clinical Process Mining using Program Executive Logs
使用程序执行日志进行临床流程挖掘
  • 批准号:
    23K11219
  • 财政年份:
    2023
  • 资助金额:
    $ 2.05万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了