管理与决策大数据的模式识别与敏感内容挖掘研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    91746209
  • 项目类别:
    重大研究计划
  • 资助金额:
    240.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    G0112.信息系统与管理
  • 结题年份:
    2021
  • 批准年份:
    2017
  • 项目状态:
    已结题
  • 起止时间:
    2018-01-01 至2021-12-31

项目摘要

Big data has been a focus in sciences and technology. It is recognized as a strategic resource by companies and governments. The core of big data is intelligent data analysis and forecasting, and the studies on big data mainly concern the vital demand from governments. Conventional algorithms in machine learning and data mining deal with small amounts of data, solving problems related to generalizing extrinsic knowledge to the true nature. The challenges posed by big data to traditional techniques from machine learning and big data include not only the quantity of data, but also how to learn the nature of data. The latter task is essential for learning strategy design. To solve these problems, we propose novel theories and methods that benefit the national strategic interests. This proposal cuts in the multi-source and heterogeneous characteristics with big data, investigating the presentation, inter-semantic aggregation, evolutionary pattern recognition based on time-variant traits, efficient dividing mechanisms and methods, online sparse learning, interconnection mining and boosting properties analysis, noise handling, sensitive content assessment, privacy protection and other methods concerning with learning and mining of chaotic big data. Our project team has gained a solid foundation in this research topic, and aims to develop a series of innovative breakthroughs.
大数据研究是企业和国家的重要战略方向。大数据的核心是智能分析与预测,传统的机器学习与数据挖掘方法属于小数据里的算法和理论,解决认知中的“质”的问题。大数据研究不仅需要解决质的问题,而且需要解决量的问题。本课题以大数据的多源异构性为切入点,围绕三个关键科学问题,即大数据的表示与演化规律、大数据的学习与拓扑融合机理,以及大数据的敏感内容挖掘,以个性化普适医疗为应用验证研究平台,分别研究大数据知识表示、大数据的跨语义聚合方法、基于时序特性的大数据演化规律发现、大数据的高效分拆机制与方法、大数据的在线稀疏学习、大数据关联挖掘与涌现特性分析、大数据的噪音数据处理机制、大数据的敏感内容评估理论,以及大数据的隐私保护机制与方法等一系列面向大数据学习与挖掘的新理论与新算法。课题组在所涉及领域均具有深厚的研究基础,预期将取得一系列具有创新性及突破性的研究成果。

结项摘要

大数据的特性使传统的机器学习与数据挖掘的方式方法同时面临数据处理“量”和“质”的问题。数据“量”的激增是大数据区别于传统数据的最显著特征,涉及对多源、异构的数据的存储和表示问题;同时,大数据的“量”的动态性,衍生出大数据的演化规律与特征涌现等问题;大数据的知识获取,也即如何从多源、异构、价值密度低,且包含噪音、错误等的大数据中挖掘出有价值或感兴趣的知识,是实现大数据从“量”转变到“质”的核心问题。针对这些问题,本项目以(1)大数据的表示与演化规律,(2)大数据学习与拓扑融合机理,以及(3)大数据的敏感内容挖掘,三个关键科学问题为核心;以碎片化家谱知识服务系统(华谱系统)为应用载体,重点研究了大数据的分布式计算及图数据划分技术、表示学习模型、演化与分类问题、学习算法、因果特征选择、信息提取与分析、子图挖掘与搜索、推荐与决策,以及大数据应用与治理框架等一系列面向大数据处理与信息挖掘的新理论与新算法。同时,我们基于所提出的大数据应用与治理框架,进行了碎片化家谱知识服务系统(华谱系统)的研究与系统开发。以上研究成果为管理与决策大数据平台的知识获取与处理、知识组织与表示、数据分析与挖掘等方面提供了一系列的基础理论与方法,为管理与决策大数据的应用前景奠定了基础。.在本项目实施过程中,项目组取得了丰硕的阶段性成果。已发表SCI期刊论文62篇(包括ACM和IEEE Transactions 31篇),国际会议论文31篇(包括SIGKDD、AAAI、WWW、ICDM顶级国际会议论文8篇),国内核心期刊论文6篇(其中,软件学报3篇,其中2篇获选为高影响力论文,自动化学报1篇),获批授权专利3项,在申请专利21项,培养博士生11名、硕士生33名。在此项目研究工作的基础上,项目负责人成功获批1项国际(地区)合作与交流项目(No.62120106008),入选俄罗斯工程院外籍院士。项目参与人李磊成功获批1项国家基金面上项目(No.62076087)。题为“Knowledge Graph for China’s Genealogy”的论文获2020年国际知识图谱会议最佳论文奖。

项目成果

期刊论文数量(66)
专著数量(0)
科研奖励数量(1)
会议论文数量(30)
专利数量(24)
Local Graph Edge Partitioning
局部图边划分
  • DOI:
    10.1145/3466685
  • 发表时间:
    2021-09
  • 期刊:
    ACM Transactions on Intelligent Systems and Technology
  • 影响因子:
    5
  • 作者:
    Shengwei Ji;Chenyang Bu;Lei Li;Xindong Wu
  • 通讯作者:
    Xindong Wu
面向知识图谱的信息抽取
  • DOI:
    --
  • 发表时间:
    2020
  • 期刊:
    数据挖掘
  • 影响因子:
    --
  • 作者:
    赵海霞;李磊;吴信东;何进
  • 通讯作者:
    何进
Combining embedding-based and symbol-based methods for entity alignment
结合基于嵌入和基于符号的方法进行实体对齐
  • DOI:
    10.1016/j.patcog.2021.108433
  • 发表时间:
    2021-11
  • 期刊:
    Pattern Recognition
  • 影响因子:
    8
  • 作者:
    Tingting Jiang;Chenyang Bu;Yi Zhu;Xindong Wu
  • 通讯作者:
    Xindong Wu
When Does Diversity Help Generalization in Classification Ensembles?
多样性何时有助于分类集成的泛化?
  • DOI:
    10.1109/tcyb.2021.3053165
  • 发表时间:
    2021-02-26
  • 期刊:
    IEEE TRANSACTIONS ON CYBERNETICS
  • 影响因子:
    11.8
  • 作者:
    Bian, Yijun;Chen, Huanhuan
  • 通讯作者:
    Chen, Huanhuan
Learning Kullback-Leibler Divergence-Based Gaussian Model for Multivariate Time Series Classification
学习基于 Kullback-Leibler 散度的高斯模型进行多元时间序列分类
  • DOI:
    10.1109/access.2019.2943474
  • 发表时间:
    2019-01-01
  • 期刊:
    IEEE ACCESS
  • 影响因子:
    3.9
  • 作者:
    Wu, Gongqing;Zhang, Huicheng;Li, Lei
  • 通讯作者:
    Li, Lei

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

基于稀疏编码多尺度空间潜在语义分析的图像分类
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    计算机学报,已录用
  • 影响因子:
    --
  • 作者:
    赵仲秋;季海峰;高隽;胡东辉;吴信东
  • 通讯作者:
    吴信东
普适医疗信息管理与服务的关键技术与挑战
  • DOI:
    --
  • 发表时间:
    2012
  • 期刊:
    计算机学报
  • 影响因子:
    --
  • 作者:
    吴信东;叶明全;胡东辉;吴共庆;胡学钢;王浩
  • 通讯作者:
    王浩
Unsupervised Statistical Text Simplification
无监督统计文本简化
  • DOI:
    10.1109/tkde.2019.2947679
  • 发表时间:
    2019-10
  • 期刊:
    IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING
  • 影响因子:
    8.9
  • 作者:
    强继朋;吴信东
  • 通讯作者:
    吴信东
一种求解MPMGOOC问题的启发式算法
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    计算机学报
  • 影响因子:
    --
  • 作者:
    武优西;江贺;吴信东;闵帆
  • 通讯作者:
    闵帆
基于社交网络的社交行为分析
  • DOI:
    --
  • 发表时间:
    2017
  • 期刊:
    电子与信息学报
  • 影响因子:
    --
  • 作者:
    李磊;汪萌;吴信东
  • 通讯作者:
    吴信东

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

吴信东的其他基金

社交媒体大数据分析、处理及应用
  • 批准号:
    62120106008
  • 批准年份:
    2021
  • 资助金额:
    251 万元
  • 项目类别:
    国际(地区)合作与交流项目
从关系数据库中提取领域知识的自动知识获取研究
  • 批准号:
    68975025
  • 批准年份:
    1989
  • 资助金额:
    3.5 万元
  • 项目类别:
    面上项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码