排序主题模型及其应用研究
项目介绍
AI项目解读
基本信息
- 批准号:61272369
- 项目类别:面上项目
- 资助金额:80.0万
- 负责人:
- 依托单位:
- 学科分类:F0607.知识表示与处理
- 结题年份:2016
- 批准年份:2012
- 项目状态:已结题
- 起止时间:2013-01-01 至2016-12-31
- 项目参与者:唐焕玲; 蒋剑平; 邱勇; 刘智; 余远; 陈飞; 肖智博; 刘娜; 牛盼盼;
- 关键词:
项目摘要
Topic model is a kind of probabilistic model which can extract latent semantic structure from discrete data, and is effective to discover hidden meaningful topic from very large scale data. It can be applied widely in information retrieval, automatic summarization and recommender systems. Bearing the principle of focussing small topics, this project intents to research on one particular important topic model - - - ranking topic model. Two kinds of ranking topic models are proposed and to be applied in real-world applications: query-independent ranking topic models intent to get the ranked topic distributions without query words by evaluating relationships between terms and using active learning methods, and query-dependent ranking topic models intent to solve the problem of getting ranked topic distribution with query words by adopting learning-to-rank methods. Meanwhile, the project also intent to propose a new parametric inference method to enhance the model performance, which aims to reduce the computation complexity and raise the inference accuracy. At last, the project will apply the proposed ranking topic models to multi-document automatic summarization and academic paper recommender system. With two system established, the algorithms proposed in the project are evaluated and applied.
主题模型是近年来兴起的可以从离散数据集中自动提取隐含语义结构的一种生成概率模型,是从海量数据中发现隐含语义主题的有效工具,可广泛应用于信息检索、自动文摘及推荐系统等领域。本项目遵循"小题精做"的原则,对一类重要的主题模型- - 排序主题模型进行深入研究,主要针对两种排序主题模型开展算法及其应用基础研究:第一种是查询无关的排序主题模型,通过度量词项之间的关系并结合主动学习方法,解决没有查询词情况下获得有序主题分布的问题;第二种是面向查询的排序主题模型,借鉴排序学习的思想,解决存在查询词情况下得到有序主题分布的问题。其次,本项目还将进行主题模型的参数推断方法研究,力求在提高推断精度的同时尽可能降低计算复杂度。最后,本项目拟将所提出的排序主题模型应用于多文本自动文摘和论文推荐系统中,研制开发两套应用系统,达到既验证算法又促进算法实用化的目的。
结项摘要
主题模型(Topic Models) 是一种可以从大规模离散数据集中自动提取其中隐含语义主题的生成概率模型,是从海量数据中发现隐含语义主题的有效工具,可广泛应用于信息检索、自动文摘及推荐系统等领域。自2003 年提出以来,主题模型逐渐成为机器学习、自然语言处理、机器视觉领域中的重要研究课题,并且在文本挖掘、观点挖掘、社交网络分析、视频场景理解、蛋白质结构分析、金融数据分析等领域获得了广泛的应用。然而,随着待分析语料库规模越来越大,主题模型分析出的主题数目也越来越多,主题模型产生的结果越来越难以利用。. 本项目针对主题模型的发展、演化以及各种模型的特点,遵循"小题精做"的原则,对一类重要的主题模型- - 排序主题模型进行深入研究,主要针对两种排序主题模型开展了算法及其应用基础研究:第一种是查询无关的排序主题模型,通过度量词项之间的关系并结合主动学习方法,解决没有查询词情况下获得有序主题分布的问题;第二种是面向查询的排序主题模型,借鉴排序学习的思想,解决存在查询词情况下得到有序主题分布的问题。. 其次,本项目进行了基于主题模型的多文档自动摘要方法、主题模型过滤方法、主题模型优化方法、利用主题模型增加推荐系统的惊喜度以及主题模型与其它学习方法的融合等研究工作,此外还开展了主题模型的参数推断方法研究,力求在提高推断精度的同时,尽可能降低计算复杂度。. 最后,本项目将所提出的排序主题模型应用于多文本自动文摘系统、科技论文推荐系统和航运领域大规模文献的自动分类系统中,研制开发三套应用系统,达到了既验证算法又促进算法实用化的目的。
项目成果
期刊论文数量(28)
专著数量(1)
科研奖励数量(3)
会议论文数量(7)
专利数量(0)
基于模糊K-调和均值的单词-文档谱聚类方法
- DOI:--
- 发表时间:2012
- 期刊:控制与决策
- 影响因子:--
- 作者:刘娜;肖智博;鲁明羽
- 通讯作者:鲁明羽
粒子滤波算法
- DOI:--
- 发表时间:2014
- 期刊:计算机学报
- 影响因子:--
- 作者:王法胜;鲁明羽;赵清杰;袁泽剑
- 通讯作者:袁泽剑
Does more randomness help increasing diversity in ensemble learning
更多随机性是否有助于增加集成学习的多样性
- DOI:--
- 发表时间:2012
- 期刊:Journal of Convergence Information Technology
- 影响因子:--
- 作者:Zhibo Xiao;Ping Li;Yingliang Fu;Mingyu Lu
- 通讯作者:Mingyu Lu
Ordered Over-relaxation based Langevin Monte Carlo Sampling for Visual Tracking
用于视觉跟踪的基于朗之万蒙特卡罗采样的有序过度松弛
- DOI:10.1016/j.ekir.2018.09.011
- 发表时间:--
- 期刊:Neurocomputing
- 影响因子:6
- 作者:Fasheng Wang;Peihua Li;Xucheng Li;Mingyu Lu
- 通讯作者:Mingyu Lu
Image Enhancement based Improved Multi-scale Hessian Matrix for Coronary Angiography
基于图像增强的改进多尺度Hessian矩阵冠状动脉造影
- DOI:10.5120/ijca2015906196
- 发表时间:2015
- 期刊:International Journal of Computer Applications
- 影响因子:--
- 作者:Kaifeng Chen;Mingyu Lu
- 通讯作者:Mingyu Lu
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
有监督主题模型的SLDA-TC文本分类新方法
- DOI:cnki:sun:dzxu.0.2019-06-017
- 发表时间:2019
- 期刊:电子学报
- 影响因子:--
- 作者:唐焕玲;宋英杰;窦全胜;鲁明羽;于立萍
- 通讯作者:于立萍
Tr-SLDA: 一种面向交叉领域的迁移主题模型
- DOI:--
- 发表时间:2021
- 期刊:电子学报
- 影响因子:--
- 作者:唐焕玲;郑涵;刘艳红;马思源;窦全胜;鲁明羽
- 通讯作者:鲁明羽
基于Hamiltonian马氏链蒙特卡罗方法的突变运动跟踪
- DOI:--
- 发表时间:2014
- 期刊:软件学报
- 影响因子:--
- 作者:王法胜;李绪成;肖智博;鲁明羽
- 通讯作者:鲁明羽
关联规则在冠心病中医临床证型诊断中的应用
- DOI:--
- 发表时间:--
- 期刊:广西师范大学学报(自然科学版)
- 影响因子:--
- 作者:时丽莎;鲁明羽;李丹
- 通讯作者:李丹
基于Hamiltonian马氏链蒙特卡罗方法的突变运动跟踪
- DOI:--
- 发表时间:2014
- 期刊:软件学报
- 影响因子:--
- 作者:王法胜;李绪成;肖智博;鲁明羽
- 通讯作者:鲁明羽
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
鲁明羽的其他基金
基于自然语言处理和反绎学习的航运信用评估模型研究
- 批准号:62372077
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
基于半监督学习和集成学习的文本分类方法研究
- 批准号:61073133
- 批准年份:2010
- 资助金额:32.0 万元
- 项目类别:面上项目
分析挖掘冠心病中医诊疗临床规律的智能技术研究
- 批准号:60773084
- 批准年份:2007
- 资助金额:31.0 万元
- 项目类别:面上项目
循证医学信息化的智能技术研究
- 批准号:60473115
- 批准年份:2004
- 资助金额:21.0 万元
- 项目类别:面上项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}