III: Small: Spectral Methods for Active Clustering and Bi-Clustering
III:小:主动聚类和双聚类的谱方法
基本信息
- 批准号:1116458
- 负责人:
- 金额:$ 37.28万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2011
- 资助国家:美国
- 起止时间:2011-07-01 至 2014-06-30
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Clustering or organization of data into groups is a fundamental problem that forms the basis of exploratory data analysis and aids in data management. However, there is often a significant resource and computational cost associated with obtaining and analyzing large-scale datasets that routinely arise in modern systems, such as the Internet, biological and social networks. The ability to discover meaningful clusters in high-dimensional data that is plagued with high noise, outliers and missing observations, will have a significant impact on understanding these systems. This project aims to develop robust clustering methods that can identify clusters very efficiently by selectively querying for the most informative data measurements. Spectral clustering is a popular technique that identifies clusters by analyzing the eigenvectors of a matrix of similarity values between the data points. This project investigates the effect of missing and erroneous data on the eigenvector structure, and leverages this understanding to develop active methods that intelligently guide subsequent data queries. Robust and efficient clustering methods are crucial for identifying groups of proteins and drugs that interact with each other, paving the way for transformative health technologies. These methods are also important for learning and maintaining the organization of computer and social networks, thus promoting seamless exchange of ideas and technology. This PI is involved in disseminating the research through collaborations with the CMU Lane Center for Computational Biology, publishing results and software online (http://www.cs.cmu.edu/~aarti/research_projects), developing and teaching inter-disciplinary courses, as well as the Opportunities for undergraduate women research in Computer Science (OurCS) program at Carnegie Mellon University.
将数据聚类或组织成组是一个基本问题,构成了探索性数据分析并有助于数据管理的基础。但是,通常存在与获取和分析在现代系统(例如互联网,生物学和社交网络)中常规出现的大规模数据集有关的重要资源和计算成本。在高维数据中发现有意义的集群的能力,这些群集困扰着高噪音,离群值和缺失的观察结果,将对理解这些系统产生重大影响。 该项目旨在开发可靠的聚类方法,这些方法可以通过选择性查询最有用的数据测量值来非常有效地识别簇。光谱聚类是一种流行的技术,它通过分析数据点之间相似性值的矩阵的特征向量来识别簇。该项目研究了丢失和错误数据对特征向量结构的影响,并利用这种理解来开发有效的方法,以智能指导后续数据查询。强大而有效的聚类方法对于识别彼此相互作用的蛋白质和药物组至关重要,为变革性健康技术铺平了道路。这些方法对于学习和维护计算机和社交网络的组织也很重要,从而促进了无缝的思想和技术交换。该PI通过与CMU巷计算生物学,发布结果和软件在线(http://wwwwwww.c.cmu.edu/~aarti/~aarti/~aarti/resresearch_projects)的合作,发展和教学跨学科课程以及计算机科学培训的机会(包括计算机科学的人群),参与了计算机科学的机会。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Aarti Singh其他文献
Minimax rates for homology inference
同源推理的极小极大率
- DOI:
- 发表时间:
2011 - 期刊:
- 影响因子:0
- 作者:
Sivaraman Balakrishnan;A. Rinaldo;Don Sheehy;Aarti Singh;L. Wasserman - 通讯作者:
L. Wasserman
Scope of Automation in Semantics-Driven Multimedia Information Retrieval From Web
语义驱动的网络多媒体信息检索的自动化范围
- DOI:
10.4018/978-1-5225-2483-0.ch001 - 发表时间:
2017 - 期刊:
- 影响因子:0
- 作者:
Aarti Singh;N. Dey;A. Ashour - 通讯作者:
A. Ashour
Supercritical carbon dioxide extraction of essential oils from leaves of Eucalyptus globulus L., their analysis and application
超临界二氧化碳萃取蓝桉叶精油及其分析与应用
- DOI:
10.1039/c5ay02009c - 发表时间:
2016 - 期刊:
- 影响因子:3.1
- 作者:
Aarti Singh;Anees Ahmad;R. Bushra - 通讯作者:
R. Bushra
Inventory Mistakes and the Great Moderation
库存错误和大节制
- DOI:
- 发表时间:
2009 - 期刊:
- 影响因子:0
- 作者:
J. Morley;Aarti Singh - 通讯作者:
Aarti Singh
AlphaNet: Improving Long-Tail Classification By Combining Classifiers
AlphaNet:通过组合分类器改进长尾分类
- DOI:
- 发表时间:
2020 - 期刊:
- 影响因子:0
- 作者:
Nadine Chang;Jayanth Koushik;Aarti Singh;M. Hebert;Yu;M. Tarr - 通讯作者:
M. Tarr
Aarti Singh的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Aarti Singh', 18)}}的其他基金
AI Institute for Societal Decision Making (AI-SDM)
人工智能社会决策研究所 (AI-SDM)
- 批准号:
2229881 - 财政年份:2023
- 资助金额:
$ 37.28万 - 项目类别:
Cooperative Agreement
Collaborative Research: New Perspectives on Deep Learning: Bridging Approximation, Statistical, and Algorithmic Theories
合作研究:深度学习的新视角:桥接近似、统计和算法理论
- 批准号:
2134133 - 财政年份:2021
- 资助金额:
$ 37.28万 - 项目类别:
Standard Grant
QuBBD: Collaborative Research: Personalized Predictive Neuromarkers for Stress-Related Health Risks
QuBBD:合作研究:压力相关健康风险的个性化预测神经标志物
- 批准号:
1557572 - 财政年份:2015
- 资助金额:
$ 37.28万 - 项目类别:
Standard Grant
15th IMS New Researchers Conference
第15届IMS新研究员大会
- 批准号:
1301845 - 财政年份:2013
- 资助金额:
$ 37.28万 - 项目类别:
Standard Grant
CAREER: Distilling information structure from big and dirty data: Efficient learning of clusters and graphs in modern datasets
职业:从大数据和脏数据中提取信息结构:现代数据集中集群和图的高效学习
- 批准号:
1252412 - 财政年份:2013
- 资助金额:
$ 37.28万 - 项目类别:
Continuing Grant
BIGDATA: Mid-Scale: DA: Distribution-based machine learning for high dimensional datasets
BIGDATA:中规模:DA:针对高维数据集的基于分布的机器学习
- 批准号:
1247658 - 财政年份:2013
- 资助金额:
$ 37.28万 - 项目类别:
Continuing Grant
相似国自然基金
瞬态低价含磷小分子的光谱探测与机理研究
- 批准号:22303048
- 批准年份:2023
- 资助金额:30.00 万元
- 项目类别:青年科学基金项目
基于低温基质隔离红外光谱研究克里奇中间体与大气相关小分子的反应机理
- 批准号:
- 批准年份:2022
- 资助金额:54 万元
- 项目类别:面上项目
基于低温基质隔离红外光谱研究克里奇中间体与大气相关小分子的反应机理
- 批准号:22273089
- 批准年份:2022
- 资助金额:54.00 万元
- 项目类别:面上项目
面向高光谱影像小目标检测的深度空-谱信息增强方法研究
- 批准号:62101414
- 批准年份:2021
- 资助金额:30 万元
- 项目类别:青年科学基金项目
小岩体成矿机制的蚀变分带光谱模型及提取方法研究
- 批准号:
- 批准年份:2020
- 资助金额:55 万元
- 项目类别:面上项目
相似海外基金
Focused kV X-ray Modulated Conformal Radiotherapy for Small Targets
针对小目标的聚焦 kV X 射线调制适形放射治疗
- 批准号:
10490908 - 财政年份:2021
- 资助金额:
$ 37.28万 - 项目类别:
Multi-spectral Physiologic Visualization Imaging For Non-contact, Real-time Capture of Cardiovascular Vital Signs Using a Novel Optical Engineering Design
使用新颖的光学工程设计非接触式实时捕获心血管生命体征的多光谱生理可视化成像
- 批准号:
10324829 - 财政年份:2021
- 资助金额:
$ 37.28万 - 项目类别:
Endoscope development for the clinical use of near infrared fluorescence molecular probes in the GI tract
近红外荧光分子探针在胃肠道临床应用的内窥镜开发
- 批准号:
10493360 - 财政年份:2021
- 资助金额:
$ 37.28万 - 项目类别:
Focused kV X-ray Modulated Conformal Radiotherapy for Small Targets
针对小目标的聚焦 kV X 射线调制适形放射治疗
- 批准号:
10675046 - 财政年份:2021
- 资助金额:
$ 37.28万 - 项目类别:
Renally clearable ytterbium nanoparticle contrast agents for spectral photon counting computed tomography
用于光谱光子计数计算机断层扫描的肾可清除镱纳米粒子造影剂
- 批准号:
10459234 - 财政年份:2021
- 资助金额:
$ 37.28万 - 项目类别: