基于多域离散数据的深度学习

项目介绍
AI项目解读

基本信息

  • 批准号:
    61702327
  • 项目类别:
    青年科学基金项目
  • 资助金额:
    26.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0605.模式识别与数据挖掘
  • 结题年份:
    2020
  • 批准年份:
    2017
  • 项目状态:
    已结题
  • 起止时间:
    2018-01-01 至2020-12-31

项目摘要

Deep learning has achieved great success in cognitive pattern recognition tasks such as image and speech recognition by leveraging the capacity of deep neural network and the big data. However, on more widely data mining applications such as recommender systems and computational advertising etc., the advantages of deep learning have not been obviously revealed yet. The reason is the data type of most data mining tasks is multi-field categorical and sequential discrete data, on which few deep learning models are proposed to work. Therefore, this project aims to study the capability of deep learning models working on multi-field categorical and sequential discrete data. The main contributions are summarized as follows. (1) To design the end-to-end neural network architecture specifically working on multi-field categorical and sequential discrete data in order to address the problem of learning representation and mining inter-field data interaction patterns and thus improve the prediction performance. (2) Based on the studied neural network architecture, to propose efficient learning algorithm and automatic hyperparameter search methods to reduce the model complexity and get the model learning process accelerated and hands-free. (3) To deploy the proposed neural network model and learning algorithm onto at least two real-world large-scale-data intelligent applications, including editor article recommendation and user ad click prediction, to evaluate the efficacy and robustness of the solution. Overall, the output of this project would provide useful and insightful guidelines for the deep learning solutions for the various intelligent systems based on multi-field discrete data.
深度学习通过构建深层的神经网络模型结合大数据训练从而在图像和语音识别等感知任务中取得卓越的模式识别和预测效果。而深度学习的优势还并未明显体现在更多数据挖掘领域,例如推荐系统和计算广告等应用中,原因是这些问题的数据大多是多域的类别型或序列型的离散数据,之前少有神经网络模型直接工作在此类数据上。因此,本项目拟对基于多域离散数据的深度学习模型的有效性进行分析,具体包括:(1)设计面向此类数据的端到端神经网络架构,解决多域离散数据的表示及其交互模式的自动挖掘,提高深度学习模型的预测精准性。(2)基于新型神经网络架构,提出快速学习算法和超参数搜索算法,减低模型计算复杂度,提高模型的收敛效率和自动化程度。(3)将提出的模型和学习算法在至少两个大数据场景中落地实践,包括编辑稿件推荐和用户广告点击预测,并探讨模型的有效性和鲁棒性。研究成果将为深度学习在基于多域离散数据上的多种智能应用提供有益参考和借鉴。

结项摘要

本项目主要对基于多域离散数据的深度学习模型的有效性进行分析并提出新型深度学习模型。项目首先设计面向此类数据的端到端神经网络架构,解决多域离散数据的表示及其交互模式的自动挖掘,提高深度学习模型的预测精准性。其次,基于新型神经网络架构,提出快速学习算法和超参数搜索算法,减低模型计算复杂度,提高模型的收敛效率和自动化程度。此外,将提出的模型和学习算法在至少两个大数据场景中落地实践。在项目期2018年至2020年,项目组在本项目研究方向发表国际学术论文47篇,其中CCF-A类论文36篇;申请5项技术发明专利;培养了8名研究生;开源工程代码8项以上到Github。项目研究产出的深度学习模型落地在华为手机应用市场推荐系统平台和阿里巴巴广告推荐平台上,皆取得了令人满意的效果,提升了平台的业务指标。

项目成果

期刊论文数量(4)
专著数量(0)
科研奖励数量(2)
会议论文数量(42)
专利数量(5)
QA4IE: A Question Answering Based System for Document-Level General Information Extraction
QA4IE:基于问答的文档级通用信息提取系统
  • DOI:
    10.1109/access.2020.2970119
  • 发表时间:
    2020
  • 期刊:
    IEEE Access
  • 影响因子:
    3.9
  • 作者:
    Qiu Lin;Ru Dongyu;Long Quanyu;Zhang Weinan;Yu Yong
  • 通讯作者:
    Yu Yong
Product-Based Neural Networks for User Response Prediction over Multi-Field Categorical Data
基于产品的神经网络用于多领域分类数据的用户响应预测
  • DOI:
    10.1145/3233770
  • 发表时间:
    2019-01-01
  • 期刊:
    ACM TRANSACTIONS ON INFORMATION SYSTEMS
  • 影响因子:
    5.6
  • 作者:
    Qu, Yanru;Fang, Bohui;He, Xiuqiang
  • 通讯作者:
    He, Xiuqiang
Bi-Level Actor-Critic for Multi-Agent Coordination
用于多智能体协调的双层 Actor-Critic
  • DOI:
    10.1609/aaai.v34i05.6226
  • 发表时间:
    2020
  • 期刊:
    Proceedings of the AAAI Conference on Artificial Intelligence
  • 影响因子:
    --
  • 作者:
    Haifeng Zhang;Weizhe Chen;Zeren Huang;Minne Li;Yaodong Yang;Weinan Zhang;Jun Wang
  • 通讯作者:
    Jun Wang
Truth Inference With a Deep Clustering-Based Aggregation Model
使用基于深度聚类的聚合模型进行真相推断
  • DOI:
    10.1109/access.2020.2964484
  • 发表时间:
    2020-01
  • 期刊:
    IEEE Access
  • 影响因子:
    3.9
  • 作者:
    Li'ang Yin;Yunfei Liu;Weinan Zhang;Yong Yu
  • 通讯作者:
    Yong Yu
共 4 条
  • 1
前往

其他文献

玉米与淀粉跨产品套利研究---基于价格协整关系的讨论
  • DOI:
    --
  • 发表时间:
    2017
  • 期刊:
    价格理论与实践
  • 影响因子:
    --
  • 作者:
    孙建明;张伟楠;张华
  • 通讯作者:
    张华
共 1 条
  • 1
前往

正在为您生成内容...

张伟楠的其他基金

增进样本效率的多智能体强化学习方法研究
  • 批准号:
  • 批准年份:
    2020
  • 资助金额:
    59 万元
  • 项目类别:
    面上项目