面向查询的社会化短文本自动摘要研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61363039
  • 项目类别:
    地区科学基金项目
  • 资助金额:
    47.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0211.信息检索与社会计算
  • 结题年份:
    2017
  • 批准年份:
    2013
  • 项目状态:
    已结题
  • 起止时间:
    2014-01-01 至2017-12-31

项目摘要

Social networks such as Twitter and Weibo have become an important channel for individuals and organizations to publish, disseminate, or access information. It is an urgent issue to extract and summarize information efficiently and effectively from the query-related short text collection, which typically has multiple topics, complex relationships, and fragmental and massive contents. In consideration of the typical features of the socialized short texts come from a social network, in this project, we will explore the theories and technologies of query-oriented socialized short text summarization, with the goal of returning satisfactory and multi-style summaries to users. This project focuses on the topic model, user model and text representation model of socialized short text, and the strategies of scoring, extracting, and reordering candidate summary contents. The main contributions of this project are as follows: ① it proposes an extended Latent Dirichlet Allocation topic model, LDA for Socialized Short text (SS-LDA), that takes both contents and social relationships in short text collection into consideration; ② it presents a text representation model, multiple reinforcement graph for socialized short text (SS-MRG), that describes the typical features for summarization such as social relationships, user queries, user interests and so on;③ it develops a scoring strategy for candidate summary contents, 4S-QIDU, that integrates social relationships, user queries, user interests, the information user has been read, and the diversity requirement of a summary. The models, strategies and methods proposed in this project will not only enrich the summarization theories and short text processing technologies, but also promote the development of social network by providing more efficient and effective services, which have both extensive applied value and potential commercial value.
社会网络平台成为现代社会个体及组织进行信息发布、传播与获取的重要途径,如何对查询相关的、主题多样、内容碎化、关系复杂、数量巨大的短文本进行浓缩,是从中高效获取信息所迫切需要解决的问题。本项目充分考虑社会网络平台中短文本的复杂"社会关系"等特点,研究面向查询的社会化短文本自动摘要理论与技术,包括社会化短文本主题模型和用户模型、文本表示模型、摘要内容评分策略、摘要抽取及重排策略等,以提供尽可能满足用户查询意图且表现形式多样的摘要。本项目主要创新拟表现在:综合考虑短文本内容和社会关系的扩展LDA主题模型;充分刻画社会关系、查询需求、用户兴趣等多种因素的多重增强图表示模型;基于多重增强图,集成社会关系、查询、用户兴趣与背景信息及多样性要求的候选摘要内容评分策略等。开展本研究不仅能丰富文本自动摘要理论和短文本处理技术,而且能通过提高服务效率和质量推动社会网络平台发展,具有广泛应用价值和潜在商业价值。

结项摘要

社会网络平台成为现代社会个体及组织发布、传播与获取信息的重要途径。为了从社会化短文本中高效地获取用户需要的信息,需要对用户查询和短文本内容进行多角度的分析处理。.社会化短文本主题多样、内容碎化、关系复杂、富含情感,根据这些特点,本项目主要研究了:①社会化短文本情感分析;②语义分析与主题模型;③社会化短文本检索与摘要模型;④查询处理与反馈;⑤社会化短文本作者心理健康分析等内容。.取得的主要研究成果有:①提出了基于分类的cNSEm模型,从社会化短文本中自动抽取新情感词,分析了六类特征的作用,cNSEm能适应名词类型的情感词抽取,抽取的新情感词对短文本情感分类的帮助作用优于手工情感词典,获COAE 2014新情感词抽取任务第二名;②针对商品评论类文本,设计了语义角色标注与依存句法分析相结合的评价对象-情感词对抽取规则,能有效识别出缺省和隐含的评价对象;③构建了基于词聚类先验知识的LDA主题模型WC-LDA和基于语义关联约束的LDA主题模型SRC-LDA,解决了LDA无法凸显短文本中中低频率词的问题, 改善了LDA 对主题词的语义理解和识别能力;④提出了基于句法语义特征的中文实体关系抽取方法,较好地解决了数据分布不均衡带来的关系抽取问题;⑤将机器学习方法与规则相结合,提出了基于协陪义动词的中文隐式实体关系抽取方法,借助显式实体关系对隐式实体关系进行推理;⑥针对社会化短文本的半结构化特点,提出了基于主题概括能力的半结构化文本中结点权重自动设置模型,用以区分不同位置出现查询词时对检索或摘要的不同影响;⑦提出了基于多重增强图和主题分析的社会化短文本检索模型,利用文本间的社会关系及主题分析,克服文本短对检索和摘要的影响;⑧提出了基于隐马尔可夫模型的查询关键词语义分析方法,解决了半结构化文本上查询词约束(语义)不明确的问题;⑨定义了两种新的top-k查询语义及提出了基于动态规划的高效查询处理算法,使得搜索空间尽可能小;⑩分析了利用准私密社交网络文本数据检测用户心理健康的可行性,并提出基于多特征融合的在线论坛用户心理健康自动评估模型,在ACL CLPsych2017 评测上获第一名;构建了包含1万余条短文本心理危机原因标注数据集和45个微博用户自杀原因标注数据集。.项目成果丰富了文本挖掘理论和社会媒体处理技术,具有广泛应用价值,其中利用社会化短文本分析用户心理健康具有重要社会意义。

项目成果

期刊论文数量(21)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Novel Semantics of the Top-k Queries on Uncertainly Fused Multi-Sensory Data
不确定融合多感官数据的 Top-k 查询的新颖语义
  • DOI:
    10.6688/jise.2015.31.1.10
  • 发表时间:
    2015
  • 期刊:
    Journal of Information Science and Engineering
  • 影响因子:
    1.1
  • 作者:
    Dexi Liu
  • 通讯作者:
    Dexi Liu
基于伪反馈的有效XML查询扩展
  • DOI:
    --
  • 发表时间:
    2016
  • 期刊:
    计算机科学与探索
  • 影响因子:
    --
  • 作者:
    钟敏娟;万常选;刘德喜;江腾蛟;刘爱红
  • 通讯作者:
    刘爱红
Interpreting XML keyword query using hidden Markov model
使用隐马尔可夫模型解释 XML 关键字查询
  • DOI:
    --
  • 发表时间:
    2016
  • 期刊:
    Tehnički vjesnik
  • 影响因子:
    --
  • 作者:
    Xiping Liu;Changxuan Wan;Dexi Liu
  • 通讯作者:
    Dexi Liu
一种词聚类LDA的商品特征提取算法
  • DOI:
    --
  • 发表时间:
    2015
  • 期刊:
    小型微型计算机系统
  • 影响因子:
    --
  • 作者:
    彭云;万常选;江腾蛟;刘德喜;刘喜平
  • 通讯作者:
    刘喜平
Mining Opinion Word from Customer Review
从客户评论中挖掘意见词
  • DOI:
    10.1017/gmh.2017.29
  • 发表时间:
    2016
  • 期刊:
    International Journal of Database and Theory and Application
  • 影响因子:
    --
  • 作者:
    Jiang Tengjiao;Zhong Minjuan;Liao Shumei;Luo Siwen
  • 通讯作者:
    Luo Siwen

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

基于基本要素向量空间的英文多文档自动摘要
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    计算机工程
  • 影响因子:
    --
  • 作者:
    何炎祥;杨华;姬东鸿;刘德喜
  • 通讯作者:
    刘德喜
基于多特征融合的在线论坛用户心理健康自动评估
  • DOI:
    --
  • 发表时间:
    2019
  • 期刊:
    计算机学报
  • 影响因子:
    --
  • 作者:
    刘德喜;夏先益;万常选;刘喜平;江腾蛟;付淇
  • 通讯作者:
    付淇
基于基本要素的文摘内容连贯性评测模型
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    计算机学报
  • 影响因子:
    --
  • 作者:
    姬东鸿;刘德喜
  • 通讯作者:
    刘德喜
XML检索中的标签权重设置模型
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    计算机科学与探索
  • 影响因子:
    --
  • 作者:
    刘喜平;万常选;刘德喜;焦贤沛
  • 通讯作者:
    焦贤沛
基于伪反馈的有效XML查询扩展
  • DOI:
    --
  • 发表时间:
    2015
  • 期刊:
    计算机科学与探索
  • 影响因子:
    --
  • 作者:
    万常选;刘德喜;江腾蛟;刘爱红
  • 通讯作者:
    刘爱红

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

刘德喜的其他基金

主题与策略感知的在线心理支持自动问答研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    54 万元
  • 项目类别:
    面上项目
基于社会化短文本主题模型的社会网络用户心理健康分析
  • 批准号:
    61762042
  • 批准年份:
    2017
  • 资助金额:
    38.0 万元
  • 项目类别:
    地区科学基金项目
面向查询的XML文本自动文摘研究
  • 批准号:
    60803105
  • 批准年份:
    2008
  • 资助金额:
    19.0 万元
  • 项目类别:
    青年科学基金项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码