基于本体的Deep Web搜索技术
项目介绍
AI项目解读
基本信息
- 批准号:60973040
- 项目类别:面上项目
- 资助金额:29.0万
- 负责人:
- 依托单位:
- 学科分类:F0202.系统软件、数据库与工业软件
- 结题年份:2012
- 批准年份:2009
- 项目状态:已结题
- 起止时间:2010-01-01 至2012-12-31
- 项目参与者:赫枫龄; 彭涛; 张雪松; 张立彪; 梁浩; 王英; 陈珂锐; 李斌; 王俊华;
- 关键词:
项目摘要
随着Web信息的激增,越来越多的信息开始由静态网页存储的方式向Web服务器维护的数据库即Deep Web转移,与Surface Web相比,Deep Web包含的信息具有更高的质量,同时也是Web上增长速度最快的信息载体,对Deep Web的研究已是Web搜索领域迫在眉睫的任务。.本研究综合应用本体研究Deep Web搜索技术。结合Focused Crawling自动发现Deep Web站点,高效收集Deep Web数据库;准确抽取Deep Web入口表单的属性,获取查询接口的模式信息;设计基于本体的模式匹配算法,指导Deep Web数据库查询接口的模式匹配与融合;研究多数据库入口表单的查询分发与自动填充,实现统一表单接口下多Deep Web数据库的查询;最后以统一的模式将各个Deep Web数据库返回的不同形式查询结果展现给用户。基于上述技术构造某一领域Deep Web搜索的原型系统。
结项摘要
本项目综合应用本体研究Deep Web搜索技术。对Deep Web搜索问题进行了系统、深入的研究,在Deep Web入口发现、表单模式抽取与集成、表单填充、查询分发、查询结果后处理等方面取得了系列化研究成果:(1)Deep Web入口发现是实现Deep Web搜索的基础,为了高效定位Deep Web入口,提出了Deep Web入口发现框架WFF,该框架通过应用主题爬行技术和本体技术以层次形式构造网页分类器(WPC)、表单结构分类器(FSC)和表单内容分类器(FCC),实现了特定领域Deep Web入口的自动发现。(2)查询接口是外部访问Deep Web数据库的门户,为了准确抽取查询接口模式,设计了基于启发式规则信息的查询接口区域定位算法以及基于网页可视化特征和本体的Deep Web查询接口语义属性抽取算法,从而获取查询接口的语义模型。(3)Deep Web接口集成主要完成两个方面的工作:接口模式匹配与接口模式融合。接口模式匹配采用本体概念映射方法,在不同接口模式间建立属性映射关系,实现不同Deep Web数据库查询接口属性的匹配过程。接口模式融合根据接口模式匹配的结果,合并了Deep Web数据库查询接口集合中表示同一语义的属性,保留了一些查询接口中特定的属性,从而得到集成查询接口。(4)Deep Web表单自动填充的本质是用源表单查询构造目标表单查询,为了准确实现查询转换,设计了基于本体的查询转换算法,将用户提交的查询条件分解成与各个Deep Web数据库查询接口相适应的查询条件,实现用户透明的全局统一查询接口向各个Deep Web表单的查询分发与表单自动填充。(5)Deep Web查询结果后处理最终要将从各个Web数据库获得的数据合并为统一的模式返回给用户,为此,设计了基于本体的最大相关度子树算法用于识别查询结果数据区域,并利用混合的启发式规则对数据记录进行分割和抽取,同时,使用本体对抽取的数据进行注释,实现了异构查询结果页面的集成。(6)构建了一个面向图书领域的DeepSearch搜索系统。基于本项目,课题组在SCI期刊、EI国际期刊、国际会议、一级学报和核心期刊上共发表论文26篇,其中SCI国际期刊3篇、EI国际期刊12篇、一级学报3篇。被SCI检索3次、EI检索15次、ISTP检索3次。此外,申请专利1项,软件著作权1项。
项目成果
期刊论文数量(23)
专著数量(0)
科研奖励数量(0)
会议论文数量(3)
专利数量(1)
基于本体的Deep Web查询接口集成
- DOI:--
- 发表时间:--
- 期刊:计算机研究与发展
- 影响因子:--
- 作者:王英;左祥麟;左万利;王鑫
- 通讯作者:王鑫
Ontology-based Filling Forms of Deep Web Entries Automatically
基于本体的深网条目自动填表
- DOI:--
- 发表时间:--
- 期刊:Journal of Computational Information Systems
- 影响因子:--
- 作者:Wanli Zuo;Ying Wang;Xin Wang;Wenyan Ji;Tao Peng
- 通讯作者:Tao Peng
Heterogeneous Deep Web Data Extraction using Ontology Evolution
使用本体进化进行异构深网数据提取
- DOI:--
- 发表时间:--
- 期刊:Journal of Convergence Information Technology
- 影响因子:--
- 作者:Kerui Chen;Wanli Zuo;Fengling He;Yongheng Chen
- 通讯作者:Yongheng Chen
本体定义及本体代数
- DOI:--
- 发表时间:--
- 期刊:吉林大学学报(理学版)
- 影响因子:--
- 作者:王俊华;左万利;赫枫龄;王英
- 通讯作者:王英
Ontology-assisted Schema Matching for Deep Web Query Interface
深度网络查询接口的本体辅助模式匹配
- DOI:--
- 发表时间:--
- 期刊:Journal of Information and Computer Science
- 影响因子:--
- 作者:Ying Wang;Wanli Zuo;Xin Wang;Aiqi Zhang
- 通讯作者:Aiqi Zhang
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
基于本体的Deep Web 查询接口集成
- DOI:--
- 发表时间:--
- 期刊:计算机研究与发展
- 影响因子:--
- 作者:王英;左祥麟;左万利;王鑫
- 通讯作者:王鑫
基于稀疏自学习卷积神经网络的句子分类模型
- DOI:--
- 发表时间:2018
- 期刊:计算机研究与发展
- 影响因子:--
- 作者:高云龙;左万利;王英;王鑫
- 通讯作者:王鑫
基于清晰有理数均值的新匹配聚类算法
- DOI:10.13413/j.cnki.jdxblxb.2018.02.35
- 发表时间:2018
- 期刊:吉林大学学报(理学版)
- 影响因子:--
- 作者:尚靖博;左万利
- 通讯作者:左万利
基于加权非负矩阵分解的链接预测算法
- DOI:--
- 发表时间:2016
- 期刊:电子学报
- 影响因子:--
- 作者:王萌萌;左万利;王英
- 通讯作者:王英
基于本体的语义查询优化
- DOI:--
- 发表时间:--
- 期刊:计算机研究与发展
- 影响因子:--
- 作者:左万利;王英;高金;赵静宇;邵慧勇
- 通讯作者:邵慧勇
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
左万利的其他基金
面向开放域文本的智能化因果关系学习
- 批准号:61976103
- 批准年份:2019
- 资助金额:57 万元
- 项目类别:面上项目
具有增量特性的移动式主题爬行技术
- 批准号:60373099
- 批准年份:2003
- 资助金额:23.0 万元
- 项目类别:面上项目
基于PETRI网的主动型面向对象数据库管理系统
- 批准号:69673015
- 批准年份:1996
- 资助金额:8.0 万元
- 项目类别:面上项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}