大規模ゲノム情報の高度な検索・比較に関する基礎技術開発とデータマイニングへの応用
大规模基因组信息高级搜索、比对基础技术开发及其在数据挖掘中的应用
基本信息
- 批准号:17018023
- 负责人:
- 金额:$ 2.3万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research on Priority Areas
- 财政年份:2005
- 资助国家:日本
- 起止时间:2005 至 无数据
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
ゲノム研究に関わるデータは巨大なものが多い.ゲノム自身が巨大な文字列データであることをはじめ,遺伝子やたんぱく質,生物種など,多くの項目を持つデータがある.また,マイクロアレイ技術の発達により,多くの実験を短時間で行えるようになったことも,実験結果のデータを巨大化させている.これら巨大なデータベースを解析し,全体的な特徴の観察や、類似する項目の発見・グループ分け(類似検索・クラスタリング),確からしいルール・特徴ある部分構造の発見(ルール/データマイニング)を行うことは,ゲノム研究において非常に重要な位置を占める.しかし,データが巨大であるため,従来の素朴な方法では計算に莫大な時間がかかる.しかし,この種の問題では,出力する解の数は全ての組合せよりはるかに小さいことが多い.類似する項目を例に挙げれば,一つの項目は他の高々数個の項目とのみ類似する場合が多い.そもそも,非常に多くの項目が類似するようなデータベースは,類似する項目を全て列挙すること自体に意味がない.全ての項目を総当りで比較するのではなく,効率良く類似する可能性のあるペアだけを絞り込むことができれば,極めて短時間で計算を終了することが可能である.本研究班では,ゲノム情報学に現れる基礎的なデータベース解析問題や最適化問題に対して,精度が高くかつ高速なアルゴリズムを開発することとその解析を目指して研究を行った.具体的には、トランザグションデータあるいは各項目が正負のみをとるデータが与えられたとき,その中から真である項目の多くに当てはまるが偽である項目にはほとんど当てはまらないようなパターンの列挙を考え,確率的解析を通して生成されたパターンの信頼性に対する指針を与えた.また,トランザクションデータベースから頻出集合を見つける問題や,文字列データの中から頻出する極大モチーフを全て発見する問題に対して効率良いアルゴリズムを開発した.
基因组研究中涉及的许多数据都是巨大的。除了基因组本身是巨大的弦数据之外,还有许多项目,例如基因,蛋白质和物种。此外,由于微阵列技术的发展,可以在短时间内进行许多实验,从而使实验结果的数据更加巨大。分析了这些巨大的数据库,并观察到整体特征,发现和分组相似的项目(相似的搜索和聚类),依此类推。发现规则和独特的子结构(规则/数据挖掘)在基因组研究中处于非常重要的地位。但是,由于数据是巨大的,因此传统的天真方法需要大量时间来计算。但是,在这种类型的问题中,要输出的解决方案的数量通常比所有组合都小得多。以类似的项目为例,一个项目通常与其他几个项目相似。首先,大量项目相似。对于数据库,列举所有类似的项目是没有意义的。如果只能有效地缩小可能只有相似的对,就可以在很短的时间内完成计算,而是在很短的时间内完成计算,而是在很短的时间内完成计算。该研究团队进行了研究,目的是为基本数据库分析和基因组信息学中出现的基本数据库分析和优化问题开发高精度和快速算法。具体而言,当将数据提供给事务数据或仅积极和负面的数据时,人们认为,适用于许多项目的模式的枚举,这些模式适用于真实的项目,但很少适用于虚假项目,并为通过概率分析生成的模式的可靠性提供了指南。此外,我们为查找从事务数据库中经常发生的集合以及发现字符串数据中经常出现的所有最大图案的问题开发了有效的算法。
项目成果
期刊论文数量(4)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
A randomness based analysis on the data size needed for generating reliable rules
对生成可靠规则所需的数据大小进行基于随机性的分析
- DOI:
- 发表时间:2006
- 期刊:
- 影响因子:0
- 作者:K.Haragucni;M.Yagiura
- 通讯作者:M.Yagiura
Measuring Over-generalization in the Minimal Multiple Generalizations of Biosequences
测量生物序列最小多重泛化中的过度泛化
- DOI:
- 发表时间:2005
- 期刊:
- 影响因子:0
- 作者:Y.K.Ng;H.Ono;T.Shinohara
- 通讯作者:T.Shinohara
A Polynomial Space and Polynomial Delay Algorithm for Enumeration of Maximal Motifs in a Sequence
用于枚举序列中最大图案的多项式空间和多项式延迟算法
- DOI:
- 发表时间:2005
- 期刊:
- 影响因子:0
- 作者:H.Arimura;T.Uno
- 通讯作者:T.Uno
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
柳浦 睦憲其他文献
Local Search Algorithms for the Two-Dimensional Cutting Stock Problem with a Given Number of Different Patterns (数理最適化から見た「凸性の深み、非凸性の魅惑」研究集会報告集)
给定数量不同模式的二维下料问题的局部搜索算法(数学优化角度凸性深度与非凸性魅力研究会报告)
- DOI:
- 发表时间:
2004 - 期刊:
- 影响因子:0
- 作者:
今堀 慎治;柳浦 睦憲;足達 信也;茨木 俊秀;梅谷 俊治 - 通讯作者:
梅谷 俊治
柳浦 睦憲的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('柳浦 睦憲', 18)}}的其他基金
物流を支える基盤技術としての数理最適化とメタ戦略
数学优化和元策略作为支持物流的基础技术
- 批准号:
23K20268 - 财政年份:2024
- 资助金额:
$ 2.3万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
物流を支える基盤技術としての数理最適化とメタ戦略
数学优化和元策略作为支持物流的基础技术
- 批准号:
20H02388 - 财政年份:2020
- 资助金额:
$ 2.3万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
大規模ゲノムデータ処理に対する高速高精度アルゴリズムの開発
开发用于大规模基因组数据处理的高速、高精度算法
- 批准号:
18017015 - 财政年份:2006
- 资助金额:
$ 2.3万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
大規模組合せ最適化問題に対するハイブリッドメタ戦略アルゴリズムの開発と評価
针对大规模组合优化问题的混合元策略算法的开发和评估
- 批准号:
17700016 - 财政年份:2005
- 资助金额:
$ 2.3万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
大規模かつ複雑な組合せ最適化問題に対する効率的かつ汎用的メタ戦略の開発と応用
针对大规模复杂组合优化问题的高效通用元策略的开发和应用
- 批准号:
14750333 - 财政年份:2002
- 资助金额:
$ 2.3万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
大規模組合せ最適化問題に対する効率的メタ戦略の設計と評価
大规模组合优化问题的有效元策略的设计和评估
- 批准号:
11750350 - 财政年份:1999
- 资助金额:
$ 2.3万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
大規模組合せ最適化問題に対するメタ戦略のロバスト性に関する実験的解析
大规模组合优化问题元策略鲁棒性的实验分析
- 批准号:
09750453 - 财政年份:1997
- 资助金额:
$ 2.3万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
大規模組合せ最適化問題に対するメタ戦略のロバスト性に関する研究
大规模组合优化问题元策略的鲁棒性研究
- 批准号:
08750479 - 财政年份:1996
- 资助金额:
$ 2.3万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
相似海外基金
大規模ゲノムデータ処理に対する高速高精度アルゴリズムの開発
开发用于大规模基因组数据处理的高速、高精度算法
- 批准号:
18017015 - 财政年份:2006
- 资助金额:
$ 2.3万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas