泛数据双向包容连接查询处理关键技术研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61373023
  • 项目类别:
    面上项目
  • 资助金额:
    76.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0202.系统软件、数据库与工业软件
  • 结题年份:
    2017
  • 批准年份:
    2013
  • 项目状态:
    已结题
  • 起止时间:
    2014-01-01 至2017-12-31

项目摘要

Join and Similarity Join are basic but important research problems of the data management field. Researchers have conducted a lot of research works on the similarity joins on various data types, including relations, vectors, strings, trees, graphs. Especially, the problem of similarity joins on massive heterogeneous socialized data attracts attention of more and more people. However, research results in this field are far from satisfying people's needs for real applications. This project aims to propose and study concepts, techniques and methods of bi-containment join queries for universal data. 1) Design an extended relational algebra supporting bi-containment queries for universal data. 2) Propose bi-domain-indices-based query processing algorithms on bi-containment join processing for universal data, which include both expectation domain and fact domain. 3) Propose approximate-bi-containment join query processing algorithms for universal data based on the divide-and-conquer policy, and that based on the normalizing policy. 4) Establish the automatic data mapping model for universal data, and propose effective approximate-bi-containment join query processing algorithms for massive universal data based on MapReduce. It is the problem of bi-containment joins that has important theoretical significance and practical value. The research results of this project are expected to be widely used in key areas of social production and life, such as friend making, house leases, and jobs & recruitment.
连接及相似连接是数据管理领域的一个基础而重要的研究问题,学者们已在关系、向量、字符串、树及图等众多类型数据的相似连接方面做了大量研究工作。尤其随着大数据时代的来临,海量异构社会化数据的相似连接问题吸引着越来越多人的关注。然而,该方向已有研究成果还远不能满足现实中的应用需求。本项目旨在提出并研究泛数据双向包容连接查询的概念、技术和方法。设计支持泛数据双向包容连接查询的扩展关系代数;提出基于期望域和事实域双域索引的泛数据双向包容连接查询处理算法;基于分治策略的泛数据近似双向包容连接查询处理技术,以及基于归一策略的泛数据近似双向包容连接查询处理技术;建立泛数据的自动数据映射模型,提出基于MapReduce的大规模泛数据近似双向包容连接的有效查询处理算法。泛数据双向包容连接问题具有重要的理论研究意义和实际应用价值,本项目的研究成果有望广泛应用于交友推荐、房屋租赁、求职招聘等社会生产生活关键领域。

结项摘要

本项目旨在提出并研究泛数据双向包容连接查询处理问题。通过4年的研究工作,课题组在IEEE TKDE、IEEE TIP、IEEE TSIPN、PVLDB、AAAI、IJCAI、《软件学报》等国内外期刊和会议上发表论文35篇。这些论文包括SCI论文6篇、EI论文15篇、CCF A类长文12篇,申请国家发明专利6项、软件著作权2项,获得国内外最佳会议论文奖2项。.课题组深入分析交友、求职等类型的多维复杂数据的匹配问题,通过引入定义在多种数据类型上的满足操作符和每条数据的独立阈值,将研究问题凝练形成一种新的相似连接概念——泛化双向相似连接,扩展了相似连接的应用范围。这种新的连接支持泛化数据类型(包括数值、数值范围、枚举、布尔、字符串等)的事实属性与对应期望属性的交叉比较;通过为每个比较对象设置独立阈值,使得连接结果更加符合用户客观需求。针对泛化双向相似连接查询处理问题,提出子连接集算法和映射-过滤-验证算法。对于映射-过滤-验证算法,还提出了 3 种映射方法,包括单射方法、等步长映射方法和启发式映射方法。其中,启发式映射方法在性能上优于单射和等步长映射,能进一步提高算法效率。.在深入分析交友等应用场景的过程中,课题组尝试针对用户以及社区进行深入的建模与分析。针对偏好的非传递性,提出了用户的多标准偏好模型,使用多个潜在特征向量表示同一个用户,以及该模型的若干种变体,如潜在特征模型、内容特征模型和混合特征模型,适用于不同的应用场景。针对完全非平衡标签信息下的网络表示学习问题,提出了一种新的半监督网络表示学习方法RSDNE,一方面考虑了网络的结构特性,另一方面通过近似地保证特征空间中类内相似性与类间差异性来合理利用完全非平衡的标注信息。针对天际线群组问题,提出了最小支配图结构,包含且仅包含所有的候选点,进而提出两种不同的深度优先搜索技术和一种基于组合的优化技术,快速找出所有的天际线群组。针对社区发现结果精度较低的问题,提出一种基于深度稀疏自动编码器的社区发现算法,能够基于已知网络拓扑结构,提高使用现有经典方法进行社区发现的准确性。针对拓扑不完备情况下的社区发现问题,提出了两种在非连通图上进行社区发现的新方法。针对社区搜索问题,提出了一种结合网络的拓扑结构和节点属性信息的图优化方法。

项目成果

期刊论文数量(18)
专著数量(0)
科研奖励数量(2)
会议论文数量(17)
专利数量(6)
泛化双向相似连接
  • DOI:
    --
  • 发表时间:
    2017
  • 期刊:
    软件学报
  • 影响因子:
    --
  • 作者:
    王昶平;王朝坤;汪浩;王萌;陈俊
  • 通讯作者:
    陈俊
CoDeT: An Easy-to-Use Community Detection Tool
CoDeT:易于使用的社区检测工具
  • DOI:
    --
  • 发表时间:
    2017
  • 期刊:
    International Journal of Data Mining and Bioinformatics
  • 影响因子:
    0.3
  • 作者:
    Yue Yifei;Wang Chaokun;Ying Xiang;Qian Jun
  • 通讯作者:
    Qian Jun
Community Detection in Social Networks: An In-depth Benchmarking Study with a Procedure-Oriented Framework
社交网络中的社区检测:采用面向过程的框架进行深入的基准研究
  • DOI:
    --
  • 发表时间:
    2015
  • 期刊:
    Proceedings of Very Large Data Bases
  • 影响因子:
    --
  • 作者:
    Wang Meng;Wang Chaokun;Yu Jeffrey Xu;Zhang Jun
  • 通讯作者:
    Zhang Jun
全动态多维网络局部介数中心度算法
  • DOI:
    10.11897/sp.j.1016.2015.01852
  • 发表时间:
    2015
  • 期刊:
    计算机学报
  • 影响因子:
    --
  • 作者:
    杨建祥;王朝坤;王萌;陈俊
  • 通讯作者:
    陈俊
Inferring Directions of Undirected Social Ties
推断无向社会关系的方向
  • DOI:
    10.1109/tkde.2016.2605081
  • 发表时间:
    2016
  • 期刊:
    IEEE Transactions on Knowledge and Data Engineering
  • 影响因子:
    8.9
  • 作者:
    Zhang Jun;Wang Chaokun;Wang Jianmin;Yu Jeffrey Xu;Chen Jun;Wang Changping
  • 通讯作者:
    Wang Changping

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

一种面向无线数字图书馆的评价排序算法
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    计算机应用与软件
  • 影响因子:
    --
  • 作者:
    王建民;郑伟;王朝坤;郭笑侬
  • 通讯作者:
    郭笑侬
一种基于随机游走模型的多标签分类算法
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    计算机学报
  • 影响因子:
    --
  • 作者:
    郑伟;王朝坤;刘璋;王建民
  • 通讯作者:
    王建民
Individual recommendation method
个人推荐法
  • DOI:
    10.1007/978-3-319-32025-0_20
  • 发表时间:
    2015-01-21
  • 期刊:
    Complex.
  • 影响因子:
    --
  • 作者:
    王朝坤;陈俊;王建民
  • 通讯作者:
    王建民
复杂条件下的社区搜索方法
  • DOI:
    10.13328/j.cnki.jos.005699
  • 发表时间:
    2019
  • 期刊:
    软件学报
  • 影响因子:
    --
  • 作者:
    竺俊超;王朝坤
  • 通讯作者:
    王朝坤
基于云架构的视频转码技术研究
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    计算机研究与发展
  • 影响因子:
    --
  • 作者:
    戴鹏飞;刘璋;岳永胜;王朝坤;王建民
  • 通讯作者:
    王建民

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

王朝坤的其他基金

面向多类型数据库的一体化数据模型与查询语言研究
  • 批准号:
    62372264
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
复杂条件社区发现关键技术研究
  • 批准号:
    61872207
  • 批准年份:
    2018
  • 资助金额:
    65.0 万元
  • 项目类别:
    面上项目
社会网络中潜在重要节点发现关键技术研究
  • 批准号:
    61170064
  • 批准年份:
    2011
  • 资助金额:
    59.0 万元
  • 项目类别:
    面上项目
Native音乐数据模型及查询语言的研究
  • 批准号:
    60803016
  • 批准年份:
    2008
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码