General and Semi-supervised Machine Learning Applied to Bioinformatics

应用于生物信息学的通用和半监督机器学习

基本信息

  • 批准号:
    8149602
  • 负责人:
  • 金额:
    $ 47.01万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
  • 资助国家:
    美国
  • 起止时间:
  • 项目状态:
    未结题

项目摘要

1) Many different methods have been investigated for the purpose of clustering sets of documents with the hope of improving retrieval. Unfortunately these have generally failed to provide improved retrieval capability. Part of the problem is clearly the fact that a given document often involves more than one subject so that it is not possible to make a clean categorization of the documents into definite categories to the exclusion of others. In order to overcome this problem we have developed methods that are designed to identify a theme among a set of documents. The theme need not encompass the whole of any document. It only needs to exist in some subset of the documents in order to be identifiable. Some of these same documents may participate in the definition of several themes. One method of finding themes is based on the EM algorithm and requires an iterative procedure which converges to themes. The method has been implemented and tested and found to be successful. 2) A second approach can be based on the singular value decomposition and essentially is a vector approach. 3) We are also investigating other methods to extract higher level features. One method of interest is the method known as sparse coding, which is the basis of self-taught learning.
1)已经对许多不同的方法进行了研究,目的是将文档集群集,希望改善检索。不幸的是,这些通常无法提供提高的检索能力。问题的一部分显然是一个事实,即给定的文档通常涉及多个主题,因此不可能将文档分类为确定的类别以排除其他主题。为了克服这个问题,我们开发了旨在确定一组文档中主题的方法。该主题不必涵盖所有文档的全部。它只需要在文档的某些子集中存在才能识别。这些相同的文档中的一些可能参与了几个主题的定义。查找主题的一种方法是基于EM算法,需要一个迭代过程,该过程会收敛到主题。该方法已被实施和测试,并发现成功。 2)第二种方法可以基于单数值分解,而本质上是矢量方法。 3)我们还正在研究其他方法以提取更高级别的特征。一种感兴趣的方法是称为稀疏编码的方法,这是自学学习的基础。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Willy Wilbur其他文献

Willy Wilbur的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Willy Wilbur', 18)}}的其他基金

General and Semi-supervised Machine Learning Applied to Bioinformatics
应用于生物信息学的通用和半监督机器学习
  • 批准号:
    8558105
  • 财政年份:
  • 资助金额:
    $ 47.01万
  • 项目类别:
Natural Language Processing Techniques To Enhance Information Access.
增强信息访问的自然语言处理技术。
  • 批准号:
    8943224
  • 财政年份:
  • 资助金额:
    $ 47.01万
  • 项目类别:
Automatic Analysis and Annotation of Document Keywords in Biomedical Literature
生物医学文献中文档关键词的自动分析与标注
  • 批准号:
    8344960
  • 财政年份:
  • 资助金额:
    $ 47.01万
  • 项目类别:
A Document Processing System
文档处理系统
  • 批准号:
    8344939
  • 财政年份:
  • 资助金额:
    $ 47.01万
  • 项目类别:
PubMed Query Log Analysis and Use in Access Inhancement
PubMed 查询日志分析及其在访问增强中的使用
  • 批准号:
    7969244
  • 财政年份:
  • 资助金额:
    $ 47.01万
  • 项目类别:
Automatic Bayesian Methods In Text Retrieval
文本检索中的自动贝叶斯方法
  • 批准号:
    8149591
  • 财政年份:
  • 资助金额:
    $ 47.01万
  • 项目类别:
A Document Processing System
文档处理系统
  • 批准号:
    8149592
  • 财政年份:
  • 资助金额:
    $ 47.01万
  • 项目类别:
A Document Processing System
文档处理系统
  • 批准号:
    9160906
  • 财政年份:
  • 资助金额:
    $ 47.01万
  • 项目类别:
A Document Processing System
文档处理系统
  • 批准号:
    7969199
  • 财政年份:
  • 资助金额:
    $ 47.01万
  • 项目类别:
General and Semi-supervised Machine Learning Applied to Bioinformatics
应用于生物信息学的通用和半监督机器学习
  • 批准号:
    8344948
  • 财政年份:
  • 资助金额:
    $ 47.01万
  • 项目类别:

相似国自然基金

面向肿瘤起源位点预测的DNA甲基化数据不确定性模型研究
  • 批准号:
    61902259
  • 批准年份:
    2019
  • 资助金额:
    25.0 万元
  • 项目类别:
    青年科学基金项目
基于机器学习的结直肠癌肝转移免疫微环境分型及预后预测研究
  • 批准号:
    81901687
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
基于单细胞数据的肿瘤异质性矩阵优化建模
  • 批准号:
    11901575
  • 批准年份:
    2019
  • 资助金额:
    25.0 万元
  • 项目类别:
    青年科学基金项目
大规模蛋白质功能预测的高效算法研究
  • 批准号:
    61872094
  • 批准年份:
    2018
  • 资助金额:
    65.0 万元
  • 项目类别:
    面上项目
基于多源异构数据融合的miRNA与疾病高精度关联预测研究
  • 批准号:
    61873270
  • 批准年份:
    2018
  • 资助金额:
    16.0 万元
  • 项目类别:
    面上项目

相似海外基金

Customizable Artificial Intelligence for the Biomedical Masses: Development of a User-Friendly Automated Machine Learning Platform for Biology Image Analysis.
面向生物医学大众的可定制人工智能:开发用于生物图像分析的用户友好的自动化机器学习平台。
  • 批准号:
    10699828
  • 财政年份:
    2023
  • 资助金额:
    $ 47.01万
  • 项目类别:
Directed evolution of broadly fungible biosensors
广泛可替代生物传感器的定向进化
  • 批准号:
    10587024
  • 财政年份:
    2023
  • 资助金额:
    $ 47.01万
  • 项目类别:
Next generation massively multiplexed combinatorial genetic screens
下一代大规模多重组合遗传筛选
  • 批准号:
    10587354
  • 财政年份:
    2023
  • 资助金额:
    $ 47.01万
  • 项目类别:
High resolution profiling of cellular communities in the tumor microenvironment
肿瘤微环境中细胞群落的高分辨率分析
  • 批准号:
    10572355
  • 财政年份:
    2023
  • 资助金额:
    $ 47.01万
  • 项目类别:
tRNA-derived RNA Fragments (tRF) as Prognostic and Diagnostic Biomarkers for Alzheimer’s Disease
tRNA 衍生的 RNA 片段 (tRF) 作为阿尔茨海默病的预后和诊断生物标志物
  • 批准号:
    10578546
  • 财政年份:
    2023
  • 资助金额:
    $ 47.01万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了