信息多样性和信息摘要的关键问题研究
项目介绍
AI项目解读
基本信息
- 批准号:61272227
- 项目类别:面上项目
- 资助金额:82.0万
- 负责人:
- 依托单位:
- 学科分类:F0211.信息检索与社会计算
- 结题年份:2016
- 批准年份:2012
- 项目状态:已结题
- 起止时间:2013-01-01 至2016-12-31
- 项目参与者:房磊; 胡珀; 朱星玮; 赵立; 陶浩雄; 尼古拉; 李潭澈; 郝宇;
- 关键词:
项目摘要
Many information processing tasks share a common problem that how to generate diverfied results. This problem has constantly been observed in many research tasks such as information retrieval, document summarization, automatic question answering, social recommender systems, information network mining, and so on. This proposal targets at two key issues of the problem: First, what is the representation unit of information diversity, and how to quantify diversity; Second, given an information need, how can we generate a diversified content that can maximally satisfy the average user. Our goal is to propose a method of representing and measuring diversity, and to established a unified framework to be able to generate information content (what we called information summary) that are diverse and relevant. In this framework, different granular information such as document, sentence, or aspect, is termed information unit. Information need, which may be represented by a set of keywords, a natural language question, or a task description, and information unit can be described via a subtopic space. The generated information summary will provide diversified, well-structured content that may consist of various units of different granularities including document, sentence, or aspect, and may have information of different modalities such as text, image, or video. To this end, we will study the representation and measurement methodology of information diversity, the discovery and extraction methods of information structure, the summarization algorithms that take diversity into account, and the selection algorithms of choosing suitable information granularity and modality of content, which is tailored to the information need.
如何保证信息的多样性是许多信息处理问题中的共性问题,广泛地存在于信息检索、文档摘要、自动问答、推荐系统、信息网络挖掘等任务中。本课题旨在解决信息多样性中的两个关键科学问题:(1)信息多样性的基本描述单位和度量方法,即什么样内容具有信息多样性以及多样性的程度如何;(2)给定信息需求,如何获得满足信息多样性要求的信息内容摘要,以最大程度地满足所有用户。我们的总体目标是提出描述信息多样性的表示与度量方法,建立统一计算框架使之产生满足多样性要求的信息内容。在这个框架中,不同粒度的信息被统称为"信息单元",用户需求和信息单元通过子话题空间来描述,信息摘要提供多样化的、结构良好的,多粒度和多模态的内容。为此,我们将研究信息多样性的表示和度量方法;研究信息摘要的组织结构及其抽取方法;建立适用于网络信息处理的考虑信息多样性的摘要算法和理论;研究如何根据信息需求的不同,选择信息摘要的不同表现粒度和不同模态。
结项摘要
如何保证信息的多样性是许多信息处理问题中的共性问题,广泛地存在于信息 检索、文档摘要、自动问答、推荐系统、信息网络挖掘等任务中。本项目从几个方面进行了探索:.1).信息多样性的表示和度量:提出了从子话题树结构的层面进行表示和度量的方法,并进一步基于话题树结构解决信息推荐中的稀疏性问题;.2).信息聚类:如何有效利用先验知识和社交数据中的自然标注进行自动聚类是一个信息摘要中的重要问题,提出了一种基于统计约束的词汇短语聚类方法,可以鲁棒地处理低频和高频的上下文信息;.3).信息摘要算法:提出了一种考虑短语属性的结构化摘要生成算法,提出了利用“流行度”和“专属度”这两个短语属性进行短语生成式摘要算法;.4).信息的表示和度量:从文档表示、句子表示、句子对表示、结构化知识表示等多个层面探索了如何进行对文本信息进行表示和度量,分别提出了跨领域的文档表示,考虑词性知识的句子表示,建模句子间依赖关系的句子对表示,考虑流型嵌入、关系多义性、子图结构等多种结构化知识表示模型。.发表CCF A类期刊论文1篇,CCF A类会议论文7篇(主要包括IJCAI、AAAI、ACL、SIGIR等),CCF B类会议论文8篇;申请专利5项,获得专利授权2项,实现专利技术转让2项。.培养博士生3名、硕士生2名。
项目成果
期刊论文数量(6)
专著数量(0)
科研奖励数量(0)
会议论文数量(15)
专利数量(0)
考虑TF-IDF因子的图排序算法的微博用户兴趣建模
- DOI:--
- 发表时间:2016
- 期刊:中国邮电高校学报(英文版)
- 影响因子:--
- 作者:屠守中;黄民烈
- 通讯作者:黄民烈
在神经网络中编码句法知识
- DOI:--
- 发表时间:2016
- 期刊:ACM TOIS
- 影响因子:--
- 作者:Minlie Huang;Qiao Qian;Xiaoyan Zhu
- 通讯作者:Xiaoyan Zhu
评论选择中的特征评级估计
- DOI:--
- 发表时间:2014
- 期刊:Knowl. Inf. Syst.
- 影响因子:--
- 作者:Chong Long;Jie Zhang;Minlie Huang;Xiaoyan Zhu
- 通讯作者:Xiaoyan Zhu
基于层次化长短期记忆模型的对话意图分类
- DOI:--
- 发表时间:2016
- 期刊:International Conference on Natural Language Processing and Knowledge Engineering. 2016
- 影响因子:--
- 作者:Xiaoji Ding;Biao Liu;Xiaoyan Zhu
- 通讯作者:Xiaoyan Zhu
一种半监督的中文垃圾微博过滤方法
- DOI:--
- 发表时间:2016
- 期刊:中文信息学报
- 影响因子:--
- 作者:姚子瑜;屠守中;黄民烈;朱小燕
- 通讯作者:朱小燕
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
面向语义关系的生物文本检索算法
- DOI:--
- 发表时间:--
- 期刊:中国科学技术大学学报
- 影响因子:--
- 作者:朱小燕;黄民烈;余浩;李姣;丁石林
- 通讯作者:丁石林
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}

内容获取失败,请点击重试

查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图

请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
黄民烈的其他基金
自然语言对话交互的基础理论和方法
- 批准号:
- 批准年份:2019
- 资助金额:302 万元
- 项目类别:重点项目
开放领域人机对话技术研究
- 批准号:61876096
- 批准年份:2018
- 资助金额:65.0 万元
- 项目类别:面上项目
基于图结构的文献挖掘算法研究
- 批准号:60803075
- 批准年份:2008
- 资助金额:21.0 万元
- 项目类别:青年科学基金项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}