構造データからパタン発見に関する効率的で大規模化可能なアルゴリズムに関する研究
从结构数据中发现模式的高效且可扩展的算法研究
基本信息
- 批准号:04F04734
- 负责人:
- 金额:$ 1.54万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for JSPS Fellows
- 财政年份:2004
- 资助国家:日本
- 起止时间:2004 至 2005
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
研究実績は以下のとおり.1.前年度開発したDryadeアルゴリズムは木構造データに対して飽和頻出木を完全探索可能であるが,より一般的なグラフ構造データへの拡張が可能かどうかを検討し,以下の2点の改良を実施した.(a)ループを含まないグラフに対しては,Dryadeアルゴリズムの要であるフッキング操作をそのまま適用可能であり,非循環有向グラフ(DAG : Directed Acyclic Graph)を効率的に処理出来るよう拡張した.(b)(a)のDryadeアルゴリズムの出力は飽和頻出木なので,その結果を分析して飽和頻出非循環グラフを発見するポストプロセッシングシステムを開発した.2.上記(a),(b)を実装し,DNAマイクロアレイデータ(バイオデータ)の解析に適用した.約5000個のノードからなる非循環グラフから多頻度飽和部分グラフを5分以下で発見出来,十分実用的であることを確認した.3.ループを含む一般グラフ構造に対する効率的な完全探索アルゴリズムを検討し原理的には可能であるとの結論を得た.4.Dryadeの木の包含関係は親子関係だけでなく,祖先まで遡る包含関係を許す一般なものであり,他の木マイニングアルゴリズムと性能を直接比較出来ないという問題があった.そのため,他のアルゴリズムと同じ定義の包含関係を扱えるようなバージョンDryadeParentを別に作成した.現状最速であると報告されている飽和頻出木マイニングアルゴリズムCMTreeMinerと多くの人工データで,木の深さと木の平均分岐数をパラメータとして比較した結果,高平均分岐数の場合には,DryadeParentの方がCMTreeMinerより約10,000倍高速であるとの良好な結果を得た.
研究结果如下: 1.去年开发的Dryade算法能够完全搜索树结构数据的饱和频繁树,但我们正在考虑是否可以将其扩展到更通用的图结构数据,我们实现了。以下两个改进: (a) 对于不包含循环的图,可以按原样应用作为 Dryade 算法核心的 hooking 操作,并且(b) 由于 (a) 中 Dryade 算法的输出是饱和频繁树,我们开发了一个后处理系统来分析结果并发现饱和频繁非循环图 2. 实现上述 (a) 和 (b)。收集 DNA 微阵列数据(生物数据)。 )应用于包括循环在内的一般图结构的分析。可以在不到5分钟的时间内从由约5000个节点组成的无环图中发现频繁饱和的子图,并证实其具有足够的实用性。 3.提出了一种高效的完整搜索算法,并得出原则上可行的结论。 4.包含关系是一种通用的关系,不仅允许父子关系,还允许追溯到祖先的包含关系,并且存在一个问题,即性能无法与我创建的单独版本的其他树挖掘算法进行直接比较。可以处理关系的DryadeParent。据悉是目前最快的。以树的深度和树的平均分支数为参数,将已报道的饱和频繁树挖掘算法 CMTreeMiner 与大量人工数据进行比较,结果发现,在平均树分支数较高的情况下,分支,DryadeParent 大约比 CMTreeMiner 大 10,000 倍,我们获得了快两倍的良好结果。
项目成果
期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Cl-GBI : A Novel Strategy to Extract Typical Patterns from Graph Data
Cl-GBI:一种从图数据中提取典型模式的新策略
- DOI:
- 发表时间:2004
- 期刊:
- 影响因子:0
- 作者:P.C.Nguyen
- 通讯作者:P.C.Nguyen
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
元田 浩其他文献
リサンプリング法に基づくギャップ分析を用いた高中心性ノードの同定
基于重采样方法的间隙分析识别高中心度节点
- DOI:
- 发表时间:
2014 - 期刊:
- 影响因子:0
- 作者:
大原 剛三;斉藤 和巳;木村 昌弘;元田 浩 - 通讯作者:
元田 浩
社会ネットワーク上の強影響度ノード同定のためのリサンプリングに基づく予測シミュレーション法の提案
提出一种基于重采样的预测模拟方法来识别对社交网络有强烈影响的节点
- DOI:
- 发表时间:
2014 - 期刊:
- 影响因子:0
- 作者:
大原 剛三;斉藤 和巳;木村 昌弘;元田 浩 - 通讯作者:
元田 浩
Active mining : new directions of data mining
主动挖掘:数据挖掘的新方向
- DOI:
10.13182/nt76-a31578 - 发表时间:
2002 - 期刊:
- 影响因子:1.5
- 作者:
元田 浩 - 通讯作者:
元田 浩
Graph-Based Induction による化学構造データからの知識発見
使用基于图的归纳法从化学结构数据中发现知识
- DOI:
- 发表时间:
2000-03-21 - 期刊:
- 影响因子:0
- 作者:
松田 喬;堀内 匡;元田 浩;鷲尾 隆 - 通讯作者:
鷲尾 隆
元田 浩的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('元田 浩', 18)}}的其他基金
複雑な知識構造を有す体系からの有意属性の構成的帰納基盤技術の研究
复杂知识结构系统显着属性构造归纳基础技术研究
- 批准号:
11878062 - 财政年份:1999
- 资助金额:
$ 1.54万 - 项目类别:
Grant-in-Aid for Exploratory Research
知識の世代交代が容易な可塑性型知識ベースの構築方法に関する研究
如何构建促进知识代际变革的塑料知识库研究
- 批准号:
09878068 - 财政年份:1997
- 资助金额:
$ 1.54万 - 项目类别:
Grant-in-Aid for Exploratory Research
相似海外基金
FRR: Semi-Structured, Under-Specified, Partially-Observable Robotic Rearrangement
FRR:半结构化、未指定、部分可观察的机器人重排
- 批准号:
2309866 - 财政年份:2023
- 资助金额:
$ 1.54万 - 项目类别:
Standard Grant
Elucidating patient and healthcare practitioner decision-making about chemotherapy-induced peripheral neuropathy-related treatment changes
阐明患者和医疗保健从业者对化疗引起的周围神经病变相关治疗变化的决策
- 批准号:
468581 - 财政年份:2022
- 资助金额:
$ 1.54万 - 项目类别:
Operating Grants
Understanding why clinical investigators launch early phase clinical trials
了解临床研究人员为何开展早期临床试验
- 批准号:
486069 - 财政年份:2022
- 资助金额:
$ 1.54万 - 项目类别:
Studentship Programs
Scalable Cleaning, Integration and Analysis of Structured and Semi-Structured Inconsistent Data
结构化和半结构化不一致数据的可扩展清理、集成和分析
- 批准号:
RGPIN-2019-04068 - 财政年份:2022
- 资助金额:
$ 1.54万 - 项目类别:
Discovery Grants Program - Individual
Scalable Cleaning, Integration and Analysis of Structured and Semi-Structured Inconsistent Data
结构化和半结构化不一致数据的可扩展清理、集成和分析
- 批准号:
RGPIN-2019-04068 - 财政年份:2022
- 资助金额:
$ 1.54万 - 项目类别:
Discovery Grants Program - Individual