SHF: Medium: Collaborative Research: Computer-Aided Programming for Data Science
SHF:媒介:协作研究:数据科学计算机辅助编程
基本信息
- 批准号:1762299
- 负责人:
- 金额:$ 105万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Continuing Grant
- 财政年份:2018
- 资助国家:美国
- 起止时间:2018-06-01 至 2024-05-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
The goal of this project, named DataWizard, is to dramatically simplify the effort that is currently required for data analytics through the use of computer-aided programming. Specifically, this project aims to semi-automate data collection, querying, and wrangling tasks by automatically generating programs from informal specifications. As a result, the DataWizard project will allow domain scientists to focus on more interesting data analytics and visualization tasks, leaving the "grunt work" of data science to computer-aided programming tools. The project will also advance the state-of-the-art in automated program synthesis and natural language processing and apply these techniques to the burgeoning field of big data analytics. From a technical perspective, the goals of the DataWizard project are three-fold. First, this project develops novel programming-by-example and information extraction techniques to address challenges that arise in data collection, including consolidation of different data sources, transformations between hierarchical and relational data, and extraction of information from unstructured data sources. Second, this project explores new techniques for querying data using natural language descriptions. In particular, this project considers data extraction from relational and noSQL databases as well as semi-structured data sources, such as XML and JSON. Third, this project develops novel program synthesis methods for automating data wrangling, cleaning, and imputation tasks that commonly arise in data analytics. Overall, these techniques make it significantly easier for data scientists to gain insights from messy data.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
该项目的目的名为DataWizard,是通过使用计算机辅助编程来大大简化数据分析所需的精力。具体而言,该项目旨在通过自动从非正式规范生成程序来收集半自动群数据,查询和纠纷任务。结果,DataWizard项目将允许域科学家专注于更有趣的数据分析和可视化任务,将数据科学的“咕unt工作”留给计算机辅助编程工具。该项目还将推进自动化程序合成和自然语言处理的最新技术,并将这些技术应用于大数据分析的新兴领域。从技术的角度来看,数据瓦式项目的目标是三倍。首先,该项目开发了典型编程和信息提取技术,以解决数据收集中出现的挑战,包括整合不同的数据源,层次结构和关系数据之间的转换以及从非结构数据源中提取信息。其次,该项目探讨了使用自然语言描述查询数据的新技术。特别是,该项目考虑了从关系和NOSQL数据库以及半结构化数据源(例如XML和JSON)提取的数据。第三,该项目开发了用于自动化数据分析中通常出现的数据争吵,清洁和插入任务的新型程序合成方法。总体而言,这些技术使数据科学家从杂乱无章的数据中获取见解变得更加容易。该奖项反映了NSF的法定任务,并被认为是值得通过基金会的知识分子优点和更广泛的影响评估标准来通过评估来获得支持的。
项目成果
期刊论文数量(3)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Modeling Fine-Grained Entity Types with Box Embeddings
- DOI:10.18653/v1/2021.acl-long.160
- 发表时间:2021-01
- 期刊:
- 影响因子:0
- 作者:Yasumasa Onoe;Michael Boratko;Greg Durrett
- 通讯作者:Yasumasa Onoe;Michael Boratko;Greg Durrett
Fine-Grained Entity Typing for Domain Independent Entity Linking
- DOI:10.1609/aaai.v34i05.6380
- 发表时间:2019-09
- 期刊:
- 影响因子:0
- 作者:Yasumasa Onoe;Greg Durrett
- 通讯作者:Yasumasa Onoe;Greg Durrett
Interpretable Entity Representations through Large-Scale Typing
- DOI:10.18653/v1/2020.findings-emnlp.54
- 发表时间:2020-04
- 期刊:
- 影响因子:0
- 作者:Yasumasa Onoe;Greg Durrett
- 通讯作者:Yasumasa Onoe;Greg Durrett
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Isil Dillig其他文献
Metric Program Synthesis
度量程序综合
- DOI:
- 发表时间:
2022 - 期刊:
- 影响因子:0
- 作者:
John Feser;Isil Dillig;Armando Solar-Lezama - 通讯作者:
Armando Solar-Lezama
Isil Dillig的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Isil Dillig', 18)}}的其他基金
FMitF: Track I: Program Synthesis for Robot Learning from Demonstrations
FMITF:轨道 I:机器人从演示中学习的程序综合
- 批准号:
2319471 - 财政年份:2023
- 资助金额:
$ 105万 - 项目类别:
Standard Grant
Collaborative Research: SHF: Core: Medium: Program Synthesis for Schema Changes
协作研究:SHF:核心:媒介:模式更改的程序综合
- 批准号:
2210831 - 财政年份:2022
- 资助金额:
$ 105万 - 项目类别:
Standard Grant
Expeditions: Collaborative Research: Understanding the World Through Code
探险:合作研究:通过代码了解世界
- 批准号:
1918889 - 财政年份:2020
- 资助金额:
$ 105万 - 项目类别:
Continuing Grant
SHF: Medium: Collaborative Research: Bridging Automated Formal Reasoning and Continuous Optimization for Provably Safe Deep Learning
SHF:中:协作研究:连接自动形式推理和持续优化以实现可证明安全的深度学习
- 批准号:
1901376 - 财政年份:2019
- 资助金额:
$ 105万 - 项目类别:
Standard Grant
SaTC: CORE: Medium: Collaborative: Effective Formal Reasoning for Mobile Malware
SaTC:核心:媒介:协作:移动恶意软件的有效形式推理
- 批准号:
1908304 - 财政年份:2019
- 资助金额:
$ 105万 - 项目类别:
Standard Grant
I-Corps: An Interactive Query Interface
I-Corps:交互式查询界面
- 批准号:
1831005 - 财政年份:2018
- 资助金额:
$ 105万 - 项目类别:
Standard Grant
SHF: Small: Scalable Program Synthesis using Counterexample-Guided Abstraction Refinement
SHF:小型:使用反例引导的抽象细化的可扩展程序综合
- 批准号:
1811865 - 财政年份:2018
- 资助金额:
$ 105万 - 项目类别:
Standard Grant
SHF:Small:Analysis, Repair, and Synthesis for k-Safety
SHF:Small:k-安全的分析、修复和合成
- 批准号:
1712067 - 财政年份:2017
- 资助金额:
$ 105万 - 项目类别:
Standard Grant
CAREER: UNITY: Bridging the Gap Between Program Analyzers and Deductive Verifiers via Abductive Reasoning
职业:UNITY:通过归纳推理弥合程序分析器和演绎验证器之间的差距
- 批准号:
1453386 - 财政年份:2015
- 资助金额:
$ 105万 - 项目类别:
Continuing Grant
相似国自然基金
复合低维拓扑材料中等离激元增强光学响应的研究
- 批准号:12374288
- 批准年份:2023
- 资助金额:52 万元
- 项目类别:面上项目
基于管理市场和干预分工视角的消失中等企业:特征事实、内在机制和优化路径
- 批准号:72374217
- 批准年份:2023
- 资助金额:41.00 万元
- 项目类别:面上项目
托卡马克偏滤器中等离子体的多尺度算法与数值模拟研究
- 批准号:12371432
- 批准年份:2023
- 资助金额:43.5 万元
- 项目类别:面上项目
中等质量黑洞附近的暗物质分布及其IMRI系统引力波回波探测
- 批准号:12365008
- 批准年份:2023
- 资助金额:32 万元
- 项目类别:地区科学基金项目
中等垂直风切变下非对称型热带气旋快速增强的物理机制研究
- 批准号:42305004
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
相似海外基金
Collaborative Research: SHF: Medium: Differentiable Hardware Synthesis
合作研究:SHF:媒介:可微分硬件合成
- 批准号:
2403134 - 财政年份:2024
- 资助金额:
$ 105万 - 项目类别:
Standard Grant
Collaborative Research: SHF: Medium: Enabling Graphics Processing Unit Performance Simulation for Large-Scale Workloads with Lightweight Simulation Methods
合作研究:SHF:中:通过轻量级仿真方法实现大规模工作负载的图形处理单元性能仿真
- 批准号:
2402804 - 财政年份:2024
- 资助金额:
$ 105万 - 项目类别:
Standard Grant
Collaborative Research: SHF: Medium: Tiny Chiplets for Big AI: A Reconfigurable-On-Package System
合作研究:SHF:中:用于大人工智能的微型芯片:可重新配置的封装系统
- 批准号:
2403408 - 财政年份:2024
- 资助金额:
$ 105万 - 项目类别:
Standard Grant
Collaborative Research: SHF: Medium: Toward Understandability and Interpretability for Neural Language Models of Source Code
合作研究:SHF:媒介:实现源代码神经语言模型的可理解性和可解释性
- 批准号:
2423813 - 财政年份:2024
- 资助金额:
$ 105万 - 项目类别:
Standard Grant
Collaborative Research: SHF: Medium: Enabling GPU Performance Simulation for Large-Scale Workloads with Lightweight Simulation Methods
合作研究:SHF:中:通过轻量级仿真方法实现大规模工作负载的 GPU 性能仿真
- 批准号:
2402806 - 财政年份:2024
- 资助金额:
$ 105万 - 项目类别:
Standard Grant