III: Small: Collaborative Research: Generalizable Similarity and Proximity Metrics for Data Exploration
III:小:协作研究:数据探索的通用相似性和邻近性度量
基本信息
- 批准号:1421247
- 负责人:
- 金额:$ 23.96万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2014
- 资助国家:美国
- 起止时间:2014-09-01 至 2018-08-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Knowledge bases organize information into graphs of entities, and data exploration algorithms can leverage mathematical properties of these graphs to discover interesting and useful insights about the entities and their relationships. For example, data exploration algorithms can use the graph of Google Knowledge Base to identify people who have common interests, and can discover genes with similar behavior by analyzing the graph of the Genome Knowledge Base. Currently, data exploration tools tend to be quite sensitive to the details of how information is represented in these graphs, making the tools highly effective over some choices of representation but not so effective with others. As a result, data exploration has largely remained the province of experts and data scientists. This project seeks to overcome this dependency and enable a new generation of more general data exploration tools that ordinary users can use to explore data on their own, without an expert by their side.More specifically, this project is creating effective similarity and proximity search algorithms that deliver the same results over various choices of representation for the underlying knowledge base. The key idea of the project is to use statistical metrics to quantify the degree of similarity between entities or patterns, in a manner that is not sensitive to the specific representation of the data. This novel theoretical framework serves as the foundation of more general data exploration algorithms, whose generality and effectiveness is being validated on large real-world knowledge bases.
知识库将信息组织成实体图,数据探索算法可以利用这些图的数学属性来发现有关实体及其关系的有趣且有用的见解。例如,数据探索算法可以利用谷歌知识库的图来识别有共同兴趣的人,并可以通过分析基因组知识库的图来发现具有相似行为的基因。 目前,数据探索工具往往对这些图表中信息如何表示的细节非常敏感,这使得这些工具在某些表示选择上非常有效,但在其他表示选择上则不太有效。 因此,数据探索在很大程度上仍然是专家和数据科学家的领域。 该项目旨在克服这种依赖性,并实现新一代更通用的数据探索工具,普通用户可以使用这些工具自行探索数据,而无需专家在身边。更具体地说,该项目正在创建有效的相似性和邻近搜索算法在底层知识库的各种表示选择上提供相同的结果。 该项目的关键思想是使用统计指标以对数据的具体表示不敏感的方式量化实体或模式之间的相似程度。这种新颖的理论框架是更通用的数据探索算法的基础,其通用性和有效性正在大型现实世界知识库上得到验证。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Marianne Winslett其他文献
Causal Mechanism Transfer Network for Time Series Domain Adaptation in Mechanical Systems
机械系统中时间序列域适应的因果机制传递网络
- DOI:
10.1145/3445033 - 发表时间:
2019-10 - 期刊:
- 影响因子:5
- 作者:
Zijian Li;Ruichu Cai;Hong Wei Ng;Marianne Winslett;Tom Z. J. Fu;Boyan Xu;Xiaoyan Yang;Zhenjie Zhang - 通讯作者:
Zhenjie Zhang
Efficient Similarity Join Based on Earth Mover’s Distance Using MapReduce
使用 MapReduce 基于地球移动器距离的高效相似性连接
- DOI:
10.1109/tkde.2015.2411281 - 发表时间:
2015-08 - 期刊:
- 影响因子:8.9
- 作者:
Jia Xu;Bin Lei;Yu Gu;Marianne Winslett;Ge Yu;Zhenjie Zhang - 通讯作者:
Zhenjie Zhang
Marianne Winslett的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Marianne Winslett', 18)}}的其他基金
EAGER: Identifying and Capitalizing on Schools of Thought as a Basis for Virtual Communities in Computer Science and Engineering Research
EAGER:识别和利用思想流派作为计算机科学和工程研究虚拟社区的基础
- 批准号:
2040714 - 财政年份:2020
- 资助金额:
$ 23.96万 - 项目类别:
Standard Grant
NSF Student Travel Grant for 2017 ACM Conference on Information and Knowledge Management (CIKM)
2017 年 ACM 信息与知识管理会议 (CIKM) 的 NSF 学生旅费补助
- 批准号:
1741803 - 财政年份:2017
- 资助金额:
$ 23.96万 - 项目类别:
Standard Grant
Collaborative Research: Personalized Benchmarks for High Performance Computing Applications
协作研究:高性能计算应用程序的个性化基准
- 批准号:
1535177 - 财政年份:2015
- 资助金额:
$ 23.96万 - 项目类别:
Standard Grant
TC: Medium: Collaborative Research: Towards Formal, Risk-Aware Authorization
TC:媒介:协作研究:迈向正式的、具有风险意识的授权
- 批准号:
0963943 - 财政年份:2010
- 资助金额:
$ 23.96万 - 项目类别:
Continuing Grant
Collaborative Research: Automatic Extraction of Parallel I/O Benchmarks from HEC Applications
协作研究:从 HEC 应用程序中自动提取并行 I/O 基准
- 批准号:
0938064 - 财政年份:2009
- 资助金额:
$ 23.96万 - 项目类别:
Standard Grant
Collaborative Research: Secure Provenance in High-End Computing Systems
协作研究:高端计算系统的安全来源
- 批准号:
0938071 - 财政年份:2009
- 资助金额:
$ 23.96万 - 项目类别:
Standard Grant
III-COR Medium: Collaborative Research: Achieving Compliant Databases
III-COR 媒介:协作研究:实现合规数据库
- 批准号:
0803280 - 财政年份:2008
- 资助金额:
$ 23.96万 - 项目类别:
Continuing Grant
CT-ISG: COLLABORATIVE RESEARCH: SecureWORM: Strong Regulatory-Compliant Storage
CT-ISG:协作研究:SecureWORM:强大的合规存储
- 批准号:
0716532 - 财政年份:2007
- 资助金额:
$ 23.96万 - 项目类别:
Continuing Grant
Presidential Young Investigator Awards
总统青年研究员奖
- 批准号:
8958582 - 财政年份:1989
- 资助金额:
$ 23.96万 - 项目类别:
Continuing Grant
Research Initiation: Relational Databases in a Hierarchical Design Environment
研究启动:分层设计环境中的关系数据库
- 批准号:
8809569 - 财政年份:1989
- 资助金额:
$ 23.96万 - 项目类别:
Standard Grant
相似国自然基金
单细胞分辨率下的石杉碱甲介导小胶质细胞极化表型抗缺血性脑卒中的机制研究
- 批准号:82304883
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
小分子无半胱氨酸蛋白调控生防真菌杀虫活性的作用与机理
- 批准号:32372613
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
诊疗一体化PS-Hc@MB协同训练介导脑小血管病康复的作用及机制研究
- 批准号:82372561
- 批准年份:2023
- 资助金额:49 万元
- 项目类别:面上项目
非小细胞肺癌MECOM/HBB通路介导血红素代谢异常并抑制肿瘤起始细胞铁死亡的机制研究
- 批准号:82373082
- 批准年份:2023
- 资助金额:49 万元
- 项目类别:面上项目
FATP2/HILPDA/SLC7A11轴介导肿瘤相关中性粒细胞脂代谢重编程影响非小细胞肺癌放疗免疫的作用和机制研究
- 批准号:82373304
- 批准年份:2023
- 资助金额:49 万元
- 项目类别:面上项目
相似海外基金
Collaborative Research: III: Small: High-Performance Scheduling for Modern Database Systems
协作研究:III:小型:现代数据库系统的高性能调度
- 批准号:
2322973 - 财政年份:2024
- 资助金额:
$ 23.96万 - 项目类别:
Standard Grant
Collaborative Research: III: Small: High-Performance Scheduling for Modern Database Systems
协作研究:III:小型:现代数据库系统的高性能调度
- 批准号:
2322974 - 财政年份:2024
- 资助金额:
$ 23.96万 - 项目类别:
Standard Grant
Collaborative Research: III: Small: A DREAM Proactive Conversational System
合作研究:III:小型:一个梦想的主动对话系统
- 批准号:
2336769 - 财政年份:2024
- 资助金额:
$ 23.96万 - 项目类别:
Standard Grant
Collaborative Research: III: Small: A DREAM Proactive Conversational System
合作研究:III:小型:一个梦想的主动对话系统
- 批准号:
2336768 - 财政年份:2024
- 资助金额:
$ 23.96万 - 项目类别:
Standard Grant
III: Small: Multiple Device Collaborative Learning in Real Heterogeneous and Dynamic Environments
III:小:真实异构动态环境中的多设备协作学习
- 批准号:
2311990 - 财政年份:2023
- 资助金额:
$ 23.96万 - 项目类别:
Standard Grant