RAPID: Advanced Topic Modeling Methods to Analyze Text Responses in COVID-19 Survey Data

RAPID:用于分析 COVID-19 调查数据中文本响应的高级主题建模方法

基本信息

  • 批准号:
    2031736
  • 负责人:
  • 金额:
    $ 17.68万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2020
  • 资助国家:
    美国
  • 起止时间:
    2020-05-15 至 2023-04-30
  • 项目状态:
    已结题

项目摘要

As the COVID-19 pandemic continues, public and private organizations are deploying surveys to inform responses and policy choices. Survey designs using multiple choice responses are by far the most common -- "open ended" questions, where survey participants provide a longer-form written response, are used far less. This is true despite the fact that when you allow people to provide unconstrained spoken or text responses, it is possible to obtain richer, fine-grained information clarifying the other responses, as well as useful “bottom up” information that the survey designers did not know to ask for. A key problem is that analyzing the unstructured language in open-ended responses is a labor-intensive process, creating obstacles to using them especially when speedy analysis is needed and resources are limited. Computational methods can help, but they often fail to provide coherent, interpretable categories, or they can fail to do a good job connecting the text in the survey with the closed-end responses. This project will develop new computational methods for fast and effective analysis of survey data that includes text responses, and it will apply these methods to support organizations doing high-impact survey work related to COVID-19 response. This will improve these organizations’ ability to understand and mitigate the impact of the COVID-19 pandemic.This project’s technical approach builds on recent techniques bringing together deep learning and Bayesian topic models. Several key technical innovations will be introduced that are specifically geared toward improving the quality of information available in surveys that include both closed- and open-ended responses. A common element in these approaches is the extension of methods commonly used in supervised learning settings, such as task-based fine-tuning of embeddings and knowledge distillation, to unsupervised topic modeling, with a specific focus on producing diverse, human-interpretable topic categories that are well aligned with discrete attributes such as demographic characteristics, closed-end responses, and experimental condition. Project activities include assisting in the analysis of organizations' survey data, conducting independent surveys aligned with their needs to obtain additional relevant data, and the public release of a clean, easy to use computational toolkit facilitating more widespread adoption of these new methods.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
随着Covid-19的大流行的继续,公共和私人组织正在部署调查以告知回应和政策选择。使用多项选择响应的调查设计是迄今为止最常见的 - “开放式”问题,调查参与者提供了更长形式的书面响应,使用的使用要少得多。这是真正的目的地,当您允许人们提供不受限制的口语或文本响应时,可以获得更丰富,细粒度的信息来阐明其他响应,并获得调查设计师不知道要要求的有用的“自下而上”信息。一个关键问题是,在开放式响应中分析的非结构化语言是一个实验室密集型过程,造成了使用它们的障碍,尤其是在需要快速分析并且资源受到限制时。计算方法可以提供帮助,但是它们通常无法提供连贯的,可解释的类别,或者他们无法在将调查中的文本与闭环响应中连接起来做得很好。该项目将开发新的计算方法,以快速有效地分析包括文本响应的调查数据,并将这些方法应用这些方法来支持从事与COVID-19响应有关的高影响力调查工作的组织。该项目的技术方法基于最近的技术,将深度学习和贝叶斯主题模型融合在一起。将引入几项关键的技术创新,专门针对提高调查中可用信息的质量,包括封闭式和开放式响应。这些方法中的一个共同元素是扩展在监督学习设置中常用的方法,例如基于任务的嵌入和知识蒸馏的微调来进行无监督的主题建模,其特定的重点是生产潜水员,人性化的主题类别,这些类别与诸如否定性的属性良好,例如诸如诸如粉料特征,封闭式的条件和实验性,实验性,实验性。项目活动包括协助分析组织的调查数据,进行独立的调查,符合其需要获得其他相关数据的需求,以及公众发布清洁,易于使用的计算工具包,支持对这些新方法的更广泛采用。该奖项反映了NSF的法定任务,并通过评估了基金会的智力效果,以诚实地对其进行评估。

项目成果

期刊论文数量(3)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Is Automated Topic Model Evaluation Broken?: The Incoherence of Coherence
  • DOI:
  • 发表时间:
    2021-07
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Alexander Miserlis Hoyle;Pranav Goel;Denis Peskov;Andrew Hian-Cheong;Jordan L. Boyd-Graber;P. Resnik
  • 通讯作者:
    Alexander Miserlis Hoyle;Pranav Goel;Denis Peskov;Andrew Hian-Cheong;Jordan L. Boyd-Graber;P. Resnik
Improving Neural Topic Models Using Knowledge Distillation
  • DOI:
    10.18653/v1/2020.emnlp-main.137
  • 发表时间:
    2020-10
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Alexander Miserlis Hoyle;Pranav Goel;P. Resnik
  • 通讯作者:
    Alexander Miserlis Hoyle;Pranav Goel;P. Resnik
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Philip Resnik其他文献

A multi-modal approach for identifying schizophrenia using cross-modal attention
使用跨模式注意力识别精神分裂症的多模式方法
  • DOI:
    10.48550/arxiv.2309.15136
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Gowtham Premananth;Yashish M. Siriwardena;Philip Resnik;Carol Y. Espy
  • 通讯作者:
    Carol Y. Espy
Computationally Scalable and Clinically Sound: Laying the Groundwork to Use Machine Learning Techniques for Social Media and Language Data in Predicting Psychiatric Symptoms
  • DOI:
    10.1016/j.biopsych.2022.02.146
  • 发表时间:
    2022-05-01
  • 期刊:
  • 影响因子:
  • 作者:
    Deanna Kelly;Glen Coppersmith;John Dickerson;Carol Espy-Wilson;Hanna Michel;Philip Resnik
  • 通讯作者:
    Philip Resnik
A Psycholinguistics-Inspired Method to Counter IP Theft using Fake Documents
一种受心理语言学启发的方法,利用虚假文档来打击知识产权盗窃
  • DOI:
  • 发表时间:
    2024
  • 期刊:
  • 影响因子:
    2.5
  • 作者:
    Natalia Denisenko;Youzhi Zhang;Chiara Pulice;Shohini Bhattasali;Sushil Jajodia;Philip Resnik;V. S. Subrahmanian
  • 通讯作者:
    V. S. Subrahmanian
Using Intrinsic and Extrinsic Metrics to Evaluate Accuracy and Facilitation in Computer-assisted Coding
使用内在和外在指标来评估计算机辅助编码的准确性和便利性
  • DOI:
  • 发表时间:
    2006
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Philip Resnik;Michael Niv;Michael Nossal;Gregory Schnitzer;Jean Stoner;Andrew Kapit;Richard Toren
  • 通讯作者:
    Richard Toren
Selection and information: a class-based approach to lexical relationships
  • DOI:
  • 发表时间:
    1993-01
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Philip Resnik
  • 通讯作者:
    Philip Resnik

Philip Resnik的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Philip Resnik', 18)}}的其他基金

RI: Small: Modeling Co-Decisions: A Computational Framework Using Language and Metadata
RI:小型:共同决策建模:使用语言和元数据的计算框架
  • 批准号:
    2008761
  • 财政年份:
    2020
  • 资助金额:
    $ 17.68万
  • 项目类别:
    Standard Grant
SoCS: Collaborative Research: Data Driven, Computational Models for Discovery and Analysis of Framing
SoCS:协作研究:用于框架发现和分析的数据驱动计算模型
  • 批准号:
    1211153
  • 财政年份:
    2012
  • 资助金额:
    $ 17.68万
  • 项目类别:
    Standard Grant
SGER: Exploiting Alternative Packagings of Source Meaning in Statistical Machine Translation
SGER:在统计机器翻译中利用源含义的替代包装
  • 批准号:
    0838801
  • 财政年份:
    2008
  • 资助金额:
    $ 17.68万
  • 项目类别:
    Continuing Grant
Collaborative Proposal-Using the Web as a Corpus for Empirical Linguistic Research
协作提案-使用网络作为实证语言学研究的语料库
  • 批准号:
    0113641
  • 财政年份:
    2001
  • 资助金额:
    $ 17.68万
  • 项目类别:
    Standard Grant
Workshop: Student Research in Computational Linguistics, at the ACL'2000 Conference
研讨会:计算语言学学生研究,ACL2000 会议
  • 批准号:
    0097529
  • 财政年份:
    2000
  • 资助金额:
    $ 17.68万
  • 项目类别:
    Standard Grant

相似国自然基金

基于先进算法和行为分析的江南传统村落微气候的评价方法、影响机理及优化策略研究
  • 批准号:
    52378011
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
新一代重要有机酸反式乌头酸的先进生物制造技术
  • 批准号:
    22338012
  • 批准年份:
    2023
  • 资助金额:
    230 万元
  • 项目类别:
    重点项目
关联锂离子电池正极动力学-热力学与构效-失效机制的先进同步辐射研究
  • 批准号:
    12375328
  • 批准年份:
    2023
  • 资助金额:
    53 万元
  • 项目类别:
    面上项目
先进运行模式中稳态远轴内部输运垒的调控机理研究
  • 批准号:
    12375233
  • 批准年份:
    2023
  • 资助金额:
    53 万元
  • 项目类别:
    面上项目
含Re、Ru先进镍基单晶高温合金中TCP相成核—生长机理的原位动态研究
  • 批准号:
    52301178
  • 批准年份:
    2023
  • 资助金额:
    30.00 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

TOPIC 423 (PHASE II): AN INTEGRATED MULTI-LEVEL DECISION SUPPORT PLATFORM TO ADDRESS PATIENT-CENTERED AND EVIDENCE-BASED SOCIAL DETERMINANTS OF HEALTH AMONG CANCER PATIENTS.
主题 423(第二阶段):综合多级决策支持平台,解决以患者为中心、循证的癌症患者健康社会决定因素。
  • 批准号:
    10936287
  • 财政年份:
    2023
  • 资助金额:
    $ 17.68万
  • 项目类别:
SBIR TOPIC 425 PHASE I: POSTURE ANALYSIS THROUGH MACHINE LEARNING (PATHML)
SBIR 主题 425 第一阶段:通过机器学习进行姿势分析 (PATHML)
  • 批准号:
    10931985
  • 财政年份:
    2023
  • 资助金额:
    $ 17.68万
  • 项目类别:
SBIR PHASE II - TOPIC 396 - IMAGING FOR CANCER IMMUNOTHERAPIES
SBIR 第二阶段 - 主题 396 - 癌症免疫疗法的成像
  • 批准号:
    10706239
  • 财政年份:
    2022
  • 资助金额:
    $ 17.68万
  • 项目类别:
SBIR TOPIC 445- ADVANCED MANUFACTURING TO SPEED AVAILABILITY OF EMERGING AUTOLOGOUS CELL-BASED THERAPIES
SBIR 主题 445 - 先进制造加速新兴自体细胞疗法的可用性
  • 批准号:
    10701477
  • 财政年份:
    2022
  • 资助金额:
    $ 17.68万
  • 项目类别:
SBIR PHASE I TOPIC #439 - ADVANCED SAMPLE PROCESSING PLATFORMS FOR DOWNSTREAM SINGLE-CELL MULTI-OMIC ANALYSIS
SBIR 第一阶段主题
  • 批准号:
    10724107
  • 财政年份:
    2022
  • 资助金额:
    $ 17.68万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了