众包数据库的基础理论与关键技术研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61632016
  • 项目类别:
    重点项目
  • 资助金额:
    280.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0202.系统软件、数据库与工业软件
  • 结题年份:
    2021
  • 批准年份:
    2016
  • 项目状态:
    已结题
  • 起止时间:
    2017-01-01 至2021-12-31

项目摘要

Crowdsourcing is a new computing model, which utilizes the wisdom of the crowd to address the data management and analytics tasks that cannot be completely addressed by automated processes. However existing works studied the crowdsourcing problems cases by cases from the application level. There is lack of studies from the system level that devise efficient crowdsourced databases to help requesters manage their tasks. Thus it calls for a crowdsourced database to process the crowdsourced tasks, which is similar to the traditional database designed to manage files. Crowdsourced databases pose three new research challenges. First, there is lack of crowdsourcing metric to describe the characteristics of the crowd. Second, there is lack of crowdsourcing theory to control the cost, quality and latency. Third, there is lack of crowdsourcing optimization mechanism to optimize complex crowdsourced tasks. The key scientific problem summarized in this proposal is metric model, controllable theory and optimization mechanism. The research problems include crowdsourcing theory, crowdsourcing operator, crowdsourcing optimization, and crowdsourcing interface. The objective is to establish the crowdsourcing theory, address the key problems, construct a crowdsourced database, make breakthroughs, and train innovative talents.
现有众包研究一般都是从应用层角度出发,通过调用众包平台的底层接口,逐个解决特定的众包应用问题(例如实体识别),而缺少一个高层的管理系统来统一支持不同的众包应用。众包数据库系统(简称众包数据库)就是为了解决通用的众包问题而提出的研究,因此类似于提出数据库系统来替代传统文件系统的研究。众包数据库面临三个挑战: (1)缺乏众包计算的可度量模型来刻画众包工人的计算特点; (2)缺少众包计算的可控理论来控制众包计算的质量、代价和延迟; (3)缺少众包计算的可优化理论来指导众包算法的优化设计。为了解决这些挑战,项目凝练的关键科学问题是众包计算的可度量、可控制、可优化问题。研究内容包括: (1)众包数据库基础理论; (2)众包数据库算子设计; (3)众包数据库查询优化; (4)众包数据库查询接口。最终建立众包数据库的基础理论,突破关键技术,研制众包数据库系统,取得国际领先的研究成果,培养若干高水平人才。

结项摘要

针对传统众包方法缺少众包基础理论和管理系统这一挑战性问题,本项目研究了“众包计算的可度量模型、可控理论、可优化机理”这一关键科学问题,研制了众包数据库系统,并取得了如下创新成果。.(1)众包数据库系统的基础理论:建立了众包计算的可度量、可控制、可优化理论,设计了质量感知的众包计算模型,提出了基于迭代决策的代价优化模型,设计了资源受限情况下延迟优化方法,突破了众包数据库查询优化模型。.(2)众包数据库的算子设计:提出了一系列核心众包算子设计算法,包括基于激励机制的众包收集操作算子、基于打分和两两比较的Top-k算子、基于众包的数据连接算子,显著优化了众包计算代价和延迟。.(3)众包数据库的查询优化:设计了基于图模型的众包查询优化方法,提出了基于知识图谱的智能任务调度方法,突破了基于博弈的众包查询优化模型,建立了一套众包数据库优化理论和方法。.(4)众包数据库查询接口:提出了基于收集操作的智能任务设计方法,设计了交互式在线任务分配方法,封装了通用的众包数据库接口。.(5)研制了一个通用的众包数据库管理系统,同时支持数据库传统查询以及众包查询。该系统通过类SQL语言与用户进行交互,封装了复杂的人机协作过程。与国际众包平台(如AMT等)打通,支持跨平台部署。系统应用于华为、好未来、腾讯、神州专车等公司,产生了较大的经济效益。例如应用于华为数据湖,用于海量数据的数据准备工作,提升了数据准备的效率与质量;应用于好未来题目标注,高效标注6000万道题目,具有较高的准确率;应用于腾讯公司广告数据融合,在大规模真实的微信广告数据集上进行了实验,验证了该方法的性能优势,提升了社交广告的业务指标;应用于神州专车的上车点推荐,提升推荐的效率与精度。.本项目发表了98篇为CCFA类论文,申请了22项专利,获得了国际科技进步二等奖、江苏省科技进步一等奖,获得了CIKM17最佳论文、ICDE19最佳论文、Best of KDD18、ICDE18、VLDB20。1人次获得杰青资助,2人次获得优青资助,2名博士生获得CCF优博。

项目成果

期刊论文数量(59)
专著数量(0)
科研奖励数量(4)
会议论文数量(41)
专利数量(22)
Efficient k-Regret Query Algorithm with Restriction-free Bound for any Dimensionality
任意维度无限制边界的高效 k-Regret 查询算法
  • DOI:
    10.1145/3183713.3196903
  • 发表时间:
    2018
  • 期刊:
    Proceedings of the 2018 International Conference on Management of Data - SIGMOD '18
  • 影响因子:
    --
  • 作者:
    Min Xie;Raymond Chi Wing Wong;Jian Li;Cheng Long;Ashwin Lall
  • 通讯作者:
    Ashwin Lall
A game-based framework for crowdsourced data labeling
基于游戏的众包数据标记框架
  • DOI:
    10.1007/s00778-020-00613-w
  • 发表时间:
    2020
  • 期刊:
    VLDB J.
  • 影响因子:
    --
  • 作者:
    Yang Jingru;Fan Ju;Wei Zhewei;Li Guoliang;Liu Tongyu;Du Xiaoyong
  • 通讯作者:
    Du Xiaoyong
基于人工智能方法的数据库智能诊断
  • DOI:
    10.13328/j.cnki.jos.006177
  • 发表时间:
    2021
  • 期刊:
    软件学报
  • 影响因子:
    --
  • 作者:
    金连源;李国良
  • 通讯作者:
    李国良
Context-aware result inference in crowdsourcing
众包中的上下文感知结果推断
  • DOI:
    10.1016/j.ins.2018.05.050
  • 发表时间:
    2018
  • 期刊:
    Inf. Sci.
  • 影响因子:
    --
  • 作者:
    Fang Yili;Sun Hailong;Li Guoliang;Zhang Richong;Huai Jingpeng
  • 通讯作者:
    Huai Jingpeng
Adapative algorithms for crowd-aided categorization
人群辅助分类的自适应算法
  • DOI:
    10.1007/s00778-021-00685-2
  • 发表时间:
    --
  • 期刊:
    VLDB Journal
  • 影响因子:
    4.2
  • 作者:
    Li Yuanbing;Wu Xian;Jin Yifei;Li Jian;Li Guoliang;Feng Jianhua
  • 通讯作者:
    Feng Jianhua

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

柴油理化特性对高压共轨柴油机微粒粒度分布的影响
  • DOI:
    --
  • 发表时间:
    2013
  • 期刊:
    农业机械学报
  • 影响因子:
    --
  • 作者:
    孙万臣;李国良;杜家坤;赖春杰
  • 通讯作者:
    赖春杰
巴楚隆起西段色力布亚断裂演化及其封闭性研究
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    石油天然气学报
  • 影响因子:
    --
  • 作者:
    赵明;李国良;岳勇;孙兆玉
  • 通讯作者:
    孙兆玉
J 波综合征:从2004 到2014
  • DOI:
    --
  • 发表时间:
    2015
  • 期刊:
    中华心律失常学杂志
  • 影响因子:
    --
  • 作者:
    薛小临;李国良;崔长琮;孙超峰
  • 通讯作者:
    孙超峰
拐折非连通断层加载失稳的热辐射演化特征
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    岩石力学与工程学报
  • 影响因子:
    --
  • 作者:
    李国良;陈群龙;张艳博;刘善军;吴立新
  • 通讯作者:
    吴立新
关角隧道断层地应力特征与应用
  • DOI:
    10.13807/j.cnki.mtt.2018.03.008
  • 发表时间:
    2018
  • 期刊:
    现代隧道技术
  • 影响因子:
    --
  • 作者:
    陈志敏;余云燕;赵德安;李国良
  • 通讯作者:
    李国良

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

李国良的其他基金

机器学习使能的分布式数据管理理论与技术
  • 批准号:
    62232009
  • 批准年份:
    2022
  • 资助金额:
    285 万元
  • 项目类别:
    重点项目
基于大数据的科学化疫情防控
  • 批准号:
    62041204
  • 批准年份:
    2020
  • 资助金额:
    20 万元
  • 项目类别:
    专项基金项目
数据库理论与系统
  • 批准号:
  • 批准年份:
    2019
  • 资助金额:
    400 万元
  • 项目类别:
    国家杰出青年科学基金
基于位置的社交网络关键技术研究
  • 批准号:
    61373024
  • 批准年份:
    2013
  • 资助金额:
    80.0 万元
  • 项目类别:
    面上项目
数据库的新型查询技术研究
  • 批准号:
    61003004
  • 批准年份:
    2010
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码