中文文本自动分类关键技术研究
项目介绍
AI项目解读
基本信息
- 批准号:60573187
- 项目类别:面上项目
- 资助金额:26.0万
- 负责人:
- 依托单位:
- 学科分类:F0211.信息检索与社会计算
- 结题年份:2008
- 批准年份:2005
- 项目状态:已结题
- 起止时间:2006-01-01 至2008-12-31
- 项目参与者:李景阳; 乔维; 司宪策; 张正操; 谢永芳; 孙帆; 徐枢;
- 关键词:
项目摘要
文本自动分类在文本信息检索、Web搜索引擎、数字图书馆、知识管理、文本信息安全、个性化服务等现实应用中占有重要位置,前景十分广阔,因而成为当前自然语言处理与信息检索的研究前沿与热点之一。本项目将进行以下几方面的研究:一、以半自动的方式,建立一个世界上规模最大的文本分类用中文文本集(训练集和测试集)。二、在所建立的文本集上,对现有主流方法在训练集扩大1-2个数量级条件下的性质进行深入的实验研究。三、基本解决汉语自动分词在文本分类中的地位这一中文文本分类的最大困惑问题。四、对特征基本单元这一文本分类的最大困惑问题进行深入研究,探讨基于"适度理解"策略,即基于半结构化语言信息的方法在提高文本分类精确率上的效用。五、设计并实现一个中文文本分类系统,在本项目所建立的大规模中文文本集上的开放测试中,其F1值应达到90%以上,或者比通行的方法性能有显著提高。
结项摘要
项目成果
期刊论文数量(5)
专著数量(0)
科研奖励数量(0)
会议论文数量(15)
专利数量(0)
中文歌词的统计特征及其检索应用
- DOI:--
- 发表时间:--
- 期刊:郑亚斌, 刘知远, 孙茂松. 中文歌词的统计特征及其检索应用. 中文信息学报, 21卷, 第5期. 2007.61-67
- 影响因子:--
- 作者:
- 通讯作者:
汉语词同现网络的小世界效应和无标度特性
- DOI:--
- 发表时间:--
- 期刊:刘知远,孙茂松. 汉语词同现网络的小世界效应和无标度特性. 中文信息学报:21(6), 2007.
- 影响因子:--
- 作者:
- 通讯作者:
汉语交集型歧义切分字段关于专业领域的统计特性
- DOI:--
- 发表时间:--
- 期刊:乔维,孙茂松. 汉语交集型歧义切分字段关于专业领域的统计特性. 中文信息学报: 4(22), 2008. 10-18
- 影响因子:--
- 作者:
- 通讯作者:
汉语依存句法网络的复杂网络性质
- DOI:--
- 发表时间:--
- 期刊:刘知远 郑亚斌 孙茂松. 汉语依存句法网络的复杂网络性质. 复杂系统与复杂性科学:5(2), 2008
- 影响因子:--
- 作者:
- 通讯作者:
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
藏文词向量相似度和相关性评测集构建
- DOI:--
- 发表时间:2019
- 期刊:中文信息学报
- 影响因子:--
- 作者:才智杰;孙茂松;才让卓玛
- 通讯作者:才让卓玛
基于迭代式回译策略的藏汉机器翻译方法研究
- DOI:--
- 发表时间:2020
- 期刊:中文信息学报
- 影响因子:--
- 作者:慈祯嘉措;桑杰端珠;孙茂松;周毛先;色差甲
- 通讯作者:色差甲
Tag Correspondence Model for User Tag Suggestion
用户标签建议的标签对应模型
- DOI:10.1007/s11390-015-1582-6
- 发表时间:2015-09
- 期刊:Journal of Computer Science and Technology
- 影响因子:0.7
- 作者:涂存超;刘知远;孙茂松
- 通讯作者:孙茂松
一种基于向量模型的藏文字拼写检查方法
- DOI:--
- 发表时间:2018
- 期刊:中文信息学报
- 影响因子:--
- 作者:才智杰;孙茂松;才让卓玛
- 通讯作者:才让卓玛
表示学习中句子与随机游走序列等价性的一种新证明
- DOI:--
- 发表时间:2020
- 期刊:计算工程与科学
- 影响因子:--
- 作者:孙燕;赵海兴;孙茂松;冶忠林
- 通讯作者:冶忠林
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
孙茂松的其他基金
关键词抽取与社会标签推荐相结合的中文文本主题词自动标注方法研究
- 批准号:61170196
- 批准年份:2011
- 资助金额:60.0 万元
- 项目类别:面上项目
信息科学十二五学科发展战略研究
- 批准号:60940025
- 批准年份:2009
- 资助金额:20.0 万元
- 项目类别:专项基金项目
汉语复杂网络的性质、结构、演化及其典型应用研究
- 批准号:60873174
- 批准年份:2008
- 资助金额:32.0 万元
- 项目类别:面上项目
词汇、句法和语义—基于认知实验的汉语加工过程研究
- 批准号:60083005
- 批准年份:2000
- 资助金额:13.0 万元
- 项目类别:专项基金项目
汉语句法排歧知识的自动获取方法研究
- 批准号:69705005
- 批准年份:1997
- 资助金额:12.0 万元
- 项目类别:青年科学基金项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}