蒙古文搜索引擎技术研究
项目介绍
AI项目解读
基本信息
- 批准号:61063018
- 项目类别:地区科学基金项目
- 资助金额:25.0万
- 负责人:
- 依托单位:
- 学科分类:F0211.信息检索与社会计算
- 结题年份:2013
- 批准年份:2010
- 项目状态:已结题
- 起止时间:2011-01-01 至2013-12-31
- 项目参与者:敖其尔; 包文海; 李平; 谢晖; 宋海林; 刘娜;
- 关键词:
项目摘要
蒙文信息资源十分丰富、源远流长,随着蒙文信息电子化和网络化迅速发展,蒙古文网站层出不穷,网上蒙古文信息急剧增长。随之而来的问题是由于缺乏好的搜索引擎而致使蒙古文信息搜索成为了瓶颈。目前所使用的搜索引擎是借用或简单改造其他文字的搜索引擎,远不能满足、也不可能满足蒙古文信息检索的需求。本项目拟以语言模型为框架,以实现蒙古文搜索引擎主要部件为目标,应用概率统计、数据挖掘、网络爬行、计算语言学等理论与技术,针对蒙古文的特点系统地研究蒙古文词干析取、蒙古文信息检索模型、检索结果排名模型和构建蒙古文词关联词典等,解决实现高效的、高性能的蒙古文搜索引擎的关键应用技术,实现一个蒙古文搜索引擎原型。
结项摘要
蒙古文数字化的发展十分迅速,蒙古文网站和图书馆蒙古文数字化大量涌现,网上蒙古文信息急剧增长。但是长时间以来,蒙古文网站和数字化图书馆的有关蒙古文信息检索技术一直搬用英文或汉文的搜索引擎,蒙古文是粘着的、词缀结构复杂的一种文字,其信息检索具有其特殊性,借用和简单的改进其他现有搜索引擎是远不能满足、也不可能满足蒙古文信息检索的需求。因此蒙古文信息检索技术成为蒙古文网站与蒙古文信息应用的瓶颈问题。本项目围绕该问题开展研究蒙古文信息检索的关键技术问题。爬行获取近5万个蒙古文网页,进行预处理形成蒙古文网页库和TREC格式的文本库。基于该文本库,通过统计方法及大量的实验构建了一个基本的蒙古文停用词表。基于蒙古文构词法和统计方法研究实现了适合蒙古文信息检索的词干提取技术和工具。提出一种关联词发现方法,并用此方法构建了蒙古文关联词词典。提出基于语言模型的蒙古文信息检索模型,并运用LEMUR工具集建立索引和实现了这些模型。提出了正负反馈问句扩展模型,设计实现了密度聚类算法,用该算法区分正负反馈文档。基于上述理论、技术和实现的软件工具(蒙古文网页爬行、预处理、词干提取、关联词词典构造、分类等)实现了一个蒙古文搜索引擎原型。为今后更深入的相关研究和产品化奠定了良好的基础,也可为同行的研究工作提供技术支持和借鉴。
项目成果
期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(5)
专利数量(0)
个性化信息检索方法研究
- DOI:--
- 发表时间:2010
- 期刊:计算机科学
- 影响因子:--
- 作者:王俊义
- 通讯作者:王俊义
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
车载自组织网络中的最小延时链路调度算法
- DOI:--
- 发表时间:2014
- 期刊:桂林电子科技大学学报
- 影响因子:--
- 作者:张勇;王俊义;林基明;丁进
- 通讯作者:丁进
基于Spark深度感知决策树的恒星/星系分类应用研究
- DOI:--
- 发表时间:2016
- 期刊:计算机应用研究
- 影响因子:--
- 作者:黄智昌;王俊义;郑霖;符杰林
- 通讯作者:符杰林
基于卷积核网格化二维近程微波全息
- DOI:--
- 发表时间:2014
- 期刊:微波学报
- 影响因子:--
- 作者:王俊义;王锦清;符杰林;仇洪冰
- 通讯作者:仇洪冰
基于中继选择的协作多播能效优化
- DOI:--
- 发表时间:2014
- 期刊:桂林电子科技大学学报
- 影响因子:--
- 作者:陈雅丽;王玫;王俊义
- 通讯作者:王俊义
Femtocell网络中移动用户位置和网络容量的预测
- DOI:--
- 发表时间:2014
- 期刊:桂林电子科技大学学报
- 影响因子:--
- 作者:张艳;王玫;王俊义
- 通讯作者:王俊义
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}

内容获取失败,请点击重试

查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图

请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
王俊义的其他基金
蒙文上网及蒙文全文检索的理论与技术研究
- 批准号:60063001
- 批准年份:2000
- 资助金额:14.5 万元
- 项目类别:地区科学基金项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}