面向数据密集型计算的局部模式挖掘与搜索方法

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61702161
  • 项目类别:
    青年科学基金项目
  • 资助金额:
    26.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0202.系统软件、数据库与工业软件
  • 结题年份:
    2020
  • 批准年份:
    2017
  • 项目状态:
    已结题
  • 起止时间:
    2018-01-01 至2020-12-31

项目摘要

There are several factors that affect the local pattern mining and search in data-intensive computing environments, which are execution performance, direct search rather than mining, and constrained query of local pattern. To make current local pattern processing technologies or systems much more efficient, effective and reliable, this project thus proposes methods from three key aspects, such as the computing framework of parallel mining, indexing structure and model, and query method. Firstly, this project gives a computing framework to reduce the data amount of transfer, and designs mining method for multi-type local patterns. Secondly, to directly search local pattern from the raw intensive data, it proposes a query method based on a double-layer index, which can improve the analysis performance of intensive data. Thirdly, it introduces constrained query methods based on domain knowledge, and utilizes the reptile technology to extract domain knowledge, which can alleviate the situation that lacks of domain knowledge. In summary, this project provides a practical solution for the efficient analysis of intensive data in data intensive computing environments.
本项目针对密集型计算环境下局部模式的挖掘与搜索问题,围绕局部模式并行挖掘的执行性能问题、避开批量挖掘而直接从源数据中搜索出符合特定要求的局部模式的问题、以及基于领域知识的局部模式约束查询问题,从设计高效的数据挖掘、索引结构与查询方法三方面入手,开展以基因表达数据为代表的密集型数据中局部模式挖掘、索引与搜索方法的研究。首先提出密集型计算环境下减少数据交互量的计算框架,在此基础上设计挖掘多种类型的局部模式的并行算法。其次,为了从源数据中直接搜索符合特定要求的多类型的局部模式,提出基于双层索引的查询方法,提升了密集型数据的分析效率。第三,提出利用领域知识的约束查询方法,以提升查询的相关性,在此基础上,提出了基于爬虫技术的领域知识提取方法,缓解了领域知识匮乏的现状。本项目将为密集型数据的有效分析提供切实可行的解决方案,具有重要的理论意义和应用价值。

结项摘要

局部模式的挖掘与搜索已经成为生物信息学与数据库领域的研究热点。本项目针对针对密集型计算环境下局部模式的挖掘与搜索问题,研究了高效的数据挖掘、索引结构与查询方法等方案。取得了一些研究成果,发表学术论文10篇,出版个人专著1本,申请专利1项。项目代表性成果包括:(1)提出密集型计算环境下减少数据交互量的计算框架,在此基础上设计挖掘多种类型的局部模式的并行算法;(2)提出基于前缀树的索引方法pfTree,给出利用行和列表头来搜索正、负和时延OPSM的优化技术pIndex,通过在线共享查询技术来加速频繁的搜索。(3)综述了包含局部模式的约束查询在内的基因表达数据中局部模式的挖掘方法研究综述。这些研究成果为密集型数据的有效分析提供切实可行的解决方案,具有重要的理论意义和应用价值。

项目成果

期刊论文数量(8)
专著数量(1)
科研奖励数量(0)
会议论文数量(2)
专利数量(1)
Statistical relational learning based automatic data cleaning
基于统计关系学习的自动数据清洗
  • DOI:
    10.1007/s11704-018-7066-4
  • 发表时间:
    2019-01
  • 期刊:
    Frontiers of Computer Science
  • 影响因子:
    4.2
  • 作者:
    Weibang Li;Ling Li;Zhanhuai Li;Mengtian Cui
  • 通讯作者:
    Mengtian Cui
基于序列格的隐私时序模式挖掘方法
  • DOI:
    --
  • 发表时间:
    2020
  • 期刊:
    电子学报
  • 影响因子:
    --
  • 作者:
    彭慧丽;金凯忠;付聪聪;付楠;张啸剑
  • 通讯作者:
    张啸剑
Predicting Stage-Specific Recurrent Aberrations From Somatic Copy Number Dataset
从体细胞拷贝数数据集预测特定阶段的复发性畸变
  • DOI:
    10.3389/fgene.2020.00160
  • 发表时间:
    2020-02-26
  • 期刊:
    FRONTIERS IN GENETICS
  • 影响因子:
    3.7
  • 作者:
    Aouiche, Chaima;Chen, Bolin;Shang, Xuequn
  • 通讯作者:
    Shang, Xuequn
基因表达数据中的局部模式挖掘研究综述
  • DOI:
    --
  • 发表时间:
    2018
  • 期刊:
    计算机研究与发展
  • 影响因子:
    --
  • 作者:
    姜涛;李战怀
  • 通讯作者:
    李战怀
A functional network construction method to interpret the pathological process of colorectal cancer
功能网络构建方法解读结直肠癌病理过程
  • DOI:
    10.1504/ijdmb.2020.107879
  • 发表时间:
    2020-01-01
  • 期刊:
    INTERNATIONAL JOURNAL OF DATA MINING AND BIOINFORMATICS
  • 影响因子:
    0.3
  • 作者:
    Chen, Bolin;Yang, Manting;Shang, Xuequn
  • 通讯作者:
    Shang, Xuequn

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

长江短颌鲚耳石Sr/Ca值变化特征及其江海洄游履历
  • DOI:
    --
  • 发表时间:
    2014
  • 期刊:
    水产学报
  • 影响因子:
    --
  • 作者:
    徐钢春;顾若波;刘洪波;姜涛;杜富宽;聂志娟;杨健;徐跑
  • 通讯作者:
    徐跑
未来我国人口、经济、资源、环境与可持续发展的情景分析
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    系统工程理论与实践
  • 影响因子:
    --
  • 作者:
    何林;袁建华;许屹;姜涛
  • 通讯作者:
    姜涛
维甲酸诱导基因I信号同路在西尼罗病毒感染中的作用
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    解放军医学杂志
  • 影响因子:
    --
  • 作者:
    姜涛;秦成峰;赵慧;张强;于曼;陈水平;秦鄂德;邓永强
  • 通讯作者:
    邓永强
泡球蚴感染小鼠肝M2型巨噬细胞的变化
  • DOI:
    --
  • 发表时间:
    2018
  • 期刊:
    山东医药
  • 影响因子:
    --
  • 作者:
    李斌;王亮;刘玉梅;杨宁;闫怡;姜涛;高剑;丁剑冰;马秀敏;阿曼古丽·牙生
  • 通讯作者:
    阿曼古丽·牙生
基于VMD循环随机跳跃状态网络的时间序列长期预测
  • DOI:
    10.13195/j.kzyjc.2019.0060
  • 发表时间:
    2020
  • 期刊:
    控制与决策
  • 影响因子:
    --
  • 作者:
    韩敏;姜涛;冯守渤
  • 通讯作者:
    冯守渤

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码