关键词抽取与社会标签推荐相结合的中文文本主题词自动标注方法研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61170196
  • 项目类别:
    面上项目
  • 资助金额:
    60.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0211.信息检索与社会计算
  • 结题年份:
    2015
  • 批准年份:
    2011
  • 项目状态:
    已结题
  • 起止时间:
    2012-01-01 至2015-12-31

项目摘要

主题词是人们快速了解文本内容、把握其主题的重要方式之一。文本主题词标注已广泛应用于搜索引擎、新闻服务、电子图书馆等领域,具有重要的科学意义和广泛的应用价值。本项目将进行以下几方面的研究:构建面向典型应用的大规模Web主题词标注语料库;研究适合中文主题词标注的词语边界和粒度确定方法;研究关键词抽取和关键词分配相结合的主题词标注方法;研究在社会标签推荐中充分引入标签之间关系的方法;研究适合中文社会标签系统特点的动力学模型和演化模式分析模型;研究综合考虑主题词粒度、边界和演化等特性,能够与时间基本同步的中文主题词自动标注方法及系统,并在热点事件跟踪、用户兴趣发现等典型任务上验证其有效性。本项目预期成果将大大丰富和深化中文主题词自动标注的研究,在相关计算方法和技术上实现一次跃迁,对Web规模的信息组织与检索乃至网络时代的中文信息处理研究具有重要意义。

结项摘要

主题词是人们快速了解文本内容、把握其主题的重要方式之一。文本主题词标注已广泛应用于搜索引擎、新闻服务、电子图书馆等领域,具有重要的科学意义和广泛的应用价值。本项目面向互联网场景的主题词自动标注问题,着重开展了以下几方面的研究:.(1)构建面向典型应用的大规模主题词标注语料库,研究适合中文主题词标注的词语边界和粒度确定方法,研究在社会标签推荐中充分引入标签之间关系的方法,面向社会媒体用户、政府工作报告等场景,提出一系列有效的主题词标注算法,整理开源了THULAC中文词法分析工具包,THUTag关键词抽取与社会标签推荐工具包。.(2)吸收深度学习与表示学习的最新研究成果,研究适用于关键词和社会标签的表示学习模型,充分利用维基百科等在线知识库信息,研究综合考虑主题词粒度、边界和演化等特性,能够与时间基本同步的中文主题词自动标注方法及系统。.(3)在热点事件跟踪、用户兴趣发现等典型任务上验证本项目成果的有效性,成功用于社会媒体用户、政府工作报告等的主题词分析,在新浪微博等国内著名社交媒体上开发微博关键词应用,根据用户发表微博抽取反映其兴趣的主题词,截至目前已经获得超过350万注册用户,获得较为广泛的社会反响。.本项目在上述研究方面均取得了很有价值的研究结果。已经发表和录用的相关学术论文共23篇(国际期刊论文1篇,国内期刊论文6篇,国际会议论文11篇,全国性学术会议论文5篇),其中包括中国计算机学会A类会议论文(人工智能领域顶级会议IJCAI和AAAI)5篇,B类会议/期刊论文5篇(主要为EMNLP和COLING,均属于自然语言处理领域顶级国际会议),并有多项发明专利正在申请,圆满完成了本项目提出的研究目标。.在人才培养方面,参加本项目的研究人员中,研究生已有8名毕业(获得博士学位4人,硕士学位4人)。另有9名博士生、3名硕士生在读。.总之,本项目按照项目任务书上的研究内容和年度计划开展研究工作,完成了项目申请书上规定的各项研究任务,同时进行了必要的研究扩展。本项目的研究成果对中文主题词自动标注研究以及相关应用具有重要的参考价值。

项目成果

期刊论文数量(9)
专著数量(0)
科研奖励数量(0)
会议论文数量(17)
专利数量(0)
社会媒体用户标签的分析与推荐
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    图书情报工作
  • 影响因子:
    --
  • 作者:
    孙茂松
  • 通讯作者:
    孙茂松
微博转发者的个性化排序
  • DOI:
    --
  • 发表时间:
    2014
  • 期刊:
    山东大学学报(理学版)
  • 影响因子:
    --
  • 作者:
    匡冲;刘知远;孙茂松
  • 通讯作者:
    孙茂松
Tag Correspondence Model for User Tag Suggestion
用户标签建议的标签对应模型
  • DOI:
    10.1007/s11390-015-1582-6
  • 发表时间:
    2015-09
  • 期刊:
    Journal of Computer Science and Technology
  • 影响因子:
    0.7
  • 作者:
    涂存超;刘知远;孙茂松
  • 通讯作者:
    孙茂松
语言计算的重要国际前沿
  • DOI:
    --
  • 发表时间:
    2014
  • 期刊:
    中文信息学报
  • 影响因子:
    --
  • 作者:
    王厚峰;吐尔根·依布拉音;刘群;刘知远
  • 通讯作者:
    刘知远

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

藏文词向量相似度和相关性评测集构建
  • DOI:
    --
  • 发表时间:
    2019
  • 期刊:
    中文信息学报
  • 影响因子:
    --
  • 作者:
    才智杰;孙茂松;才让卓玛
  • 通讯作者:
    才让卓玛
基于迭代式回译策略的藏汉机器翻译方法研究
  • DOI:
    --
  • 发表时间:
    2020
  • 期刊:
    中文信息学报
  • 影响因子:
    --
  • 作者:
    慈祯嘉措;桑杰端珠;孙茂松;周毛先;色差甲
  • 通讯作者:
    色差甲
一种基于向量模型的藏文字拼写检查方法
  • DOI:
    --
  • 发表时间:
    2018
  • 期刊:
    中文信息学报
  • 影响因子:
    --
  • 作者:
    才智杰;孙茂松;才让卓玛
  • 通讯作者:
    才让卓玛
层次短语翻译的神经网络调序模型
  • DOI:
    --
  • 发表时间:
    2014
  • 期刊:
    清华大学学报(自然科学版)
  • 影响因子:
    --
  • 作者:
    李鹏;刘洋;孙茂松
  • 通讯作者:
    孙茂松
表示学习中句子与随机游走序列等价性的一种新证明
  • DOI:
    --
  • 发表时间:
    2020
  • 期刊:
    计算工程与科学
  • 影响因子:
    --
  • 作者:
    孙燕;赵海兴;孙茂松;冶忠林
  • 通讯作者:
    冶忠林

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

孙茂松的其他基金

信息科学十二五学科发展战略研究
  • 批准号:
    60940025
  • 批准年份:
    2009
  • 资助金额:
    20.0 万元
  • 项目类别:
    专项基金项目
汉语复杂网络的性质、结构、演化及其典型应用研究
  • 批准号:
    60873174
  • 批准年份:
    2008
  • 资助金额:
    32.0 万元
  • 项目类别:
    面上项目
中文文本自动分类关键技术研究
  • 批准号:
    60573187
  • 批准年份:
    2005
  • 资助金额:
    26.0 万元
  • 项目类别:
    面上项目
词汇、句法和语义—基于认知实验的汉语加工过程研究
  • 批准号:
    60083005
  • 批准年份:
    2000
  • 资助金额:
    13.0 万元
  • 项目类别:
    专项基金项目
汉语句法排歧知识的自动获取方法研究
  • 批准号:
    69705005
  • 批准年份:
    1997
  • 资助金额:
    12.0 万元
  • 项目类别:
    青年科学基金项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码