基于增量学习的主题爬虫关键技术研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    60603066
  • 项目类别:
    青年科学基金项目
  • 资助金额:
    26.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0207.计算机网络
  • 结题年份:
    2009
  • 批准年份:
    2006
  • 项目状态:
    已结题
  • 起止时间:
    2007-01-01 至2009-12-31

项目摘要

主题爬虫是一种重要的Web资源发现和信息检索方法,有着重要的理论研究价值和应用前景。本课题是针对现有主题爬虫缺乏有效的知识积累和增量学习机制问题提出的,将重点研究基于可靠增量学习机制的主题爬虫模型,以及该模型中的一些关键算法,主要包括:研究基于自动特征加权的超文本聚类算法和超链接结构模式发现算法,来实现对爬行结果的精确挖掘,并生成高可靠爬行知识,从而实现了主题爬虫的知识积累机制;同时还研究能从爬行知识库中增量学习的页面相关度评价算法和超链接评价算法,使主题爬虫实现高可靠增量学习的目标,从而可以不断优化其爬行策略,最终从根本上提高主题爬虫系统的性能。本课题的主要创新之处在于:提出了基于爬行知识库的主题爬虫模型,以及基于爬行知识库的增量式页面相关度评价算法和超链接评价算法。

结项摘要

项目成果

期刊论文数量(5)
专著数量(0)
科研奖励数量(2)
会议论文数量(8)
专利数量(0)
Agglomerative fuzzy K-Means clustering algorithm with selection of number of clusters
带选择簇数的凝聚模糊K均值聚类算法
  • DOI:
    10.1109/tkde.2008.88
  • 发表时间:
    2008-11-01
  • 期刊:
    IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING
  • 影响因子:
    8.9
  • 作者:
    Li, Mark Junjie;Ng, Michael K.;Huang, Joshua Zhexue
  • 通讯作者:
    Huang, Joshua Zhexue
Feature Weighting Random Forest for Detection of Hidden Web Search Interfaces
用于检测隐藏网络搜索界面的特征加权随机森林
  • DOI:
    10.30019/ijclclp.200812.0001
  • 发表时间:
    2008-12
  • 期刊:
    International Journal of Computational Linguistics and Chinese Language Processing.
  • 影响因子:
    --
  • 作者:
    叶允明
  • 通讯作者:
    叶允明
HNBC: Hierarchical Neighborhood-Based Clustering for Rare Events
HNBC:稀有事件的基于分层邻域的聚类
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    计算机科学
  • 影响因子:
    --
  • 作者:
    叶允明
  • 通讯作者:
    叶允明
基于流水线负载平衡模型的并行爬虫研究
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    计算机工程
  • 影响因子:
    --
  • 作者:
    叶允明
  • 通讯作者:
    叶允明
一种新的网络爬虫带宽控制策略
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    微计算机信息
  • 影响因子:
    --
  • 作者:
    叶允明
  • 通讯作者:
    叶允明

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

MultiVCRank With Applications to Image Retrieval
MultiVCRank 及其在图像检索中的应用
  • DOI:
    10.1109/tip.2016.2522298
  • 发表时间:
    2016
  • 期刊:
    IEEE Transactions on Image Processing
  • 影响因子:
    10.6
  • 作者:
    Li Xutao;叶允明;Ng Michael K.
  • 通讯作者:
    Ng Michael K.
Multisource Heterogeneous Domain Adaptation With Conditional Weighting Adversarial Network
具有条件加权对抗网络的多源异构域适应
  • DOI:
    10.1109/tnnls.2021.3105868
  • 发表时间:
    2020-08
  • 期刊:
    IEEE Transactions on Neural Networks and Learning Systems
  • 影响因子:
    10.4
  • 作者:
    Yuan Yao;Xutao Li;Yu Zhang;叶允明
  • 通讯作者:
    叶允明
Parallel Multiple Nonnegative matrices Factorization using Graphics processing unit
使用图形处理单元并行多个非负矩阵分解
  • DOI:
    --
  • 发表时间:
    2016
  • 期刊:
    ICIC Express Letters
  • 影响因子:
    --
  • 作者:
    黄晓辉;Xin Fu;熊李艳;叶允明
  • 通讯作者:
    叶允明
Dynamic Clustering Forest: An ensemble framework to efficiently classify textual data stream with concept drift
动态聚类森林:一种集成框架,可通过概念漂移对文本数据流进行有效分类
  • DOI:
    10.1016/j.ins.2016.03.043
  • 发表时间:
    2016
  • 期刊:
    Information Sciences
  • 影响因子:
    8.1
  • 作者:
    Song Ge;叶允明;Zhang Haijun;Xu Xiaofei;Lau Raymond Y. K.;Liu Feng
  • 通讯作者:
    Liu Feng

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

叶允明的其他基金

基于非欧空间的时空属性图预测方法研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    53 万元
  • 项目类别:
    面上项目
基于非欧空间的时空属性图预测方法研究
  • 批准号:
    62272130
  • 批准年份:
    2022
  • 资助金额:
    53.00 万元
  • 项目类别:
    面上项目
基于大数据的社会行为预测理论和关键技术
  • 批准号:
    U1836107
  • 批准年份:
    2018
  • 资助金额:
    66.0 万元
  • 项目类别:
    联合基金项目
异构多属性网络的多视图聚类关键技术研究
  • 批准号:
    61572158
  • 批准年份:
    2015
  • 资助金额:
    64.0 万元
  • 项目类别:
    面上项目
多关系图的多类标分类关键技术研究
  • 批准号:
    61272538
  • 批准年份:
    2012
  • 资助金额:
    80.0 万元
  • 项目类别:
    面上项目
特定主题社会化媒体内容的动态识别关键技术研究
  • 批准号:
    61073195
  • 批准年份:
    2010
  • 资助金额:
    30.0 万元
  • 项目类别:
    面上项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码