面向数据密集型计算的局部模式挖掘与搜索方法
项目介绍
AI项目解读
基本信息
- 批准号:61702161
- 项目类别:青年科学基金项目
- 资助金额:26.0万
- 负责人:
- 依托单位:
- 学科分类:F0202.系统软件、数据库与工业软件
- 结题年份:2020
- 批准年份:2017
- 项目状态:已结题
- 起止时间:2018-01-01 至2020-12-31
- 项目参与者:张墨华; 赵贞贞; 谢佳; 付楠; 李晓光; 付聪聪;
- 关键词:
项目摘要
There are several factors that affect the local pattern mining and search in data-intensive computing environments, which are execution performance, direct search rather than mining, and constrained query of local pattern. To make current local pattern processing technologies or systems much more efficient, effective and reliable, this project thus proposes methods from three key aspects, such as the computing framework of parallel mining, indexing structure and model, and query method. Firstly, this project gives a computing framework to reduce the data amount of transfer, and designs mining method for multi-type local patterns. Secondly, to directly search local pattern from the raw intensive data, it proposes a query method based on a double-layer index, which can improve the analysis performance of intensive data. Thirdly, it introduces constrained query methods based on domain knowledge, and utilizes the reptile technology to extract domain knowledge, which can alleviate the situation that lacks of domain knowledge. In summary, this project provides a practical solution for the efficient analysis of intensive data in data intensive computing environments.
本项目针对密集型计算环境下局部模式的挖掘与搜索问题,围绕局部模式并行挖掘的执行性能问题、避开批量挖掘而直接从源数据中搜索出符合特定要求的局部模式的问题、以及基于领域知识的局部模式约束查询问题,从设计高效的数据挖掘、索引结构与查询方法三方面入手,开展以基因表达数据为代表的密集型数据中局部模式挖掘、索引与搜索方法的研究。首先提出密集型计算环境下减少数据交互量的计算框架,在此基础上设计挖掘多种类型的局部模式的并行算法。其次,为了从源数据中直接搜索符合特定要求的多类型的局部模式,提出基于双层索引的查询方法,提升了密集型数据的分析效率。第三,提出利用领域知识的约束查询方法,以提升查询的相关性,在此基础上,提出了基于爬虫技术的领域知识提取方法,缓解了领域知识匮乏的现状。本项目将为密集型数据的有效分析提供切实可行的解决方案,具有重要的理论意义和应用价值。
结项摘要
局部模式的挖掘与搜索已经成为生物信息学与数据库领域的研究热点。本项目针对针对密集型计算环境下局部模式的挖掘与搜索问题,研究了高效的数据挖掘、索引结构与查询方法等方案。取得了一些研究成果,发表学术论文10篇,出版个人专著1本,申请专利1项。项目代表性成果包括:(1)提出密集型计算环境下减少数据交互量的计算框架,在此基础上设计挖掘多种类型的局部模式的并行算法;(2)提出基于前缀树的索引方法pfTree,给出利用行和列表头来搜索正、负和时延OPSM的优化技术pIndex,通过在线共享查询技术来加速频繁的搜索。(3)综述了包含局部模式的约束查询在内的基因表达数据中局部模式的挖掘方法研究综述。这些研究成果为密集型数据的有效分析提供切实可行的解决方案,具有重要的理论意义和应用价值。
项目成果
期刊论文数量(8)
专著数量(1)
科研奖励数量(0)
会议论文数量(2)
专利数量(1)
Statistical relational learning based automatic data cleaning
基于统计关系学习的自动数据清洗
- DOI:10.1007/s11704-018-7066-4
- 发表时间:2019-01
- 期刊:Frontiers of Computer Science
- 影响因子:4.2
- 作者:Weibang Li;Ling Li;Zhanhuai Li;Mengtian Cui
- 通讯作者:Mengtian Cui
基于序列格的隐私时序模式挖掘方法
- DOI:--
- 发表时间:2020
- 期刊:电子学报
- 影响因子:--
- 作者:彭慧丽;金凯忠;付聪聪;付楠;张啸剑
- 通讯作者:张啸剑
Predicting Stage-Specific Recurrent Aberrations From Somatic Copy Number Dataset
从体细胞拷贝数数据集预测特定阶段的复发性畸变
- DOI:10.3389/fgene.2020.00160
- 发表时间:2020-02-26
- 期刊:FRONTIERS IN GENETICS
- 影响因子:3.7
- 作者:Aouiche, Chaima;Chen, Bolin;Shang, Xuequn
- 通讯作者:Shang, Xuequn
基因表达数据中的局部模式挖掘研究综述
- DOI:--
- 发表时间:2018
- 期刊:计算机研究与发展
- 影响因子:--
- 作者:姜涛;李战怀
- 通讯作者:李战怀
A functional network construction method to interpret the pathological process of colorectal cancer
功能网络构建方法解读结直肠癌病理过程
- DOI:10.1504/ijdmb.2020.107879
- 发表时间:2020-01-01
- 期刊:INTERNATIONAL JOURNAL OF DATA MINING AND BIOINFORMATICS
- 影响因子:0.3
- 作者:Chen, Bolin;Yang, Manting;Shang, Xuequn
- 通讯作者:Shang, Xuequn
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
长江短颌鲚耳石Sr/Ca值变化特征及其江海洄游履历
- DOI:--
- 发表时间:2014
- 期刊:水产学报
- 影响因子:--
- 作者:徐钢春;顾若波;刘洪波;姜涛;杜富宽;聂志娟;杨健;徐跑
- 通讯作者:徐跑
未来我国人口、经济、资源、环境与可持续发展的情景分析
- DOI:--
- 发表时间:--
- 期刊:系统工程理论与实践
- 影响因子:--
- 作者:何林;袁建华;许屹;姜涛
- 通讯作者:姜涛
维甲酸诱导基因I信号同路在西尼罗病毒感染中的作用
- DOI:--
- 发表时间:--
- 期刊:解放军医学杂志
- 影响因子:--
- 作者:姜涛;秦成峰;赵慧;张强;于曼;陈水平;秦鄂德;邓永强
- 通讯作者:邓永强
泡球蚴感染小鼠肝M2型巨噬细胞的变化
- DOI:--
- 发表时间:2018
- 期刊:山东医药
- 影响因子:--
- 作者:李斌;王亮;刘玉梅;杨宁;闫怡;姜涛;高剑;丁剑冰;马秀敏;阿曼古丽·牙生
- 通讯作者:阿曼古丽·牙生
基于VMD循环随机跳跃状态网络的时间序列长期预测
- DOI:10.13195/j.kzyjc.2019.0060
- 发表时间:2020
- 期刊:控制与决策
- 影响因子:--
- 作者:韩敏;姜涛;冯守渤
- 通讯作者:冯守渤
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}