CRII: RI: Learning a Timely Semantic Resource from Social Media Data
CRII:RI:从社交媒体数据中学习及时的语义资源
基本信息
- 批准号:2038457
- 负责人:
- 金额:$ 5.3万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2020
- 资助国家:美国
- 起止时间:2020-08-01 至 2021-05-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
One key challenge in text mining and natural language processing research is that a single meaning can be expressed in many different ways, i.e., paraphrases. There has been steady progress towards large paraphrase resources, and a significant increase in its applications: from information retrieval, information extraction, and natural language generation to IBM's Watson, Google's Knowledge Graph, and many more. This research aims to create better paraphrase acquisition techniques and larger scale semantic resources, which could be of great use in various natural language processing tasks and social media data analytics in social science, national security, and other related fields. One example of potential applications is text simplification, which automatically rephrases complex texts into simpler language for children or people with reading disabilities.The technical innovation of this study focuses on joint modeling of word- and phrase-level alignments between sentence pairs to address the challenges of extracting semantic knowledge from informal data sources (such as social media), which exist in very large quantities rather than just formal sources, such as newswire as per previous work. The model design extends multiple instance learning via two methods, a graphical model and neural network, and can flexibly permit the exploration of different assumptions and models the importance of words or phrases. The modeling advancements can be generalized to other natural language understanding tasks, which require analyzing sentences based on word-level composition or word meaning in a given context, and natural language generation tasks that benefit from learning what words and phrases to remove or rephrase.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
文本挖掘和自然语言处理研究的一个关键挑战是单一含义可以用多种不同的方式表达,即释义。大型释义资源取得了稳步进展,其应用也显着增加:从信息检索、信息提取、自然语言生成到 IBM 的 Watson、Google 的知识图谱等等。本研究旨在创建更好的释义获取技术和更大规模的语义资源,这在社会科学、国家安全和其他相关领域的各种自然语言处理任务和社交媒体数据分析中具有很大的用途。潜在应用的一个例子是文本简化,它可以自动将复杂的文本重新表述为儿童或有阅读障碍的人更简单的语言。这项研究的技术创新侧重于句子对之间的单词和短语级对齐的联合建模,以应对挑战从非正式数据源(例如社交媒体)中提取语义知识,这些数据存在大量而不仅仅是正式来源,例如根据之前的工作的新闻专线。该模型设计通过图形模型和神经网络两种方法扩展了多实例学习,并且可以灵活地允许探索不同的假设并对单词或短语的重要性进行建模。建模的进步可以推广到其他自然语言理解任务,这些任务需要根据给定上下文中的单词级组成或单词含义来分析句子,以及受益于学习要删除或改写哪些单词和短语的自然语言生成任务。该奖项反映了 NSF 的法定使命,并通过使用基金会的智力价值和更广泛的影响审查标准进行评估,被认为值得支持。
项目成果
期刊论文数量(5)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
A Word-Complexity Lexicon and A Neural Readability Ranking Model for Lexical Simplification
词复杂度词典和词汇简化的神经可读性排序模型
- DOI:10.18653/v1/d18-1410
- 发表时间:2018-01
- 期刊:
- 影响因子:0
- 作者:Maddela, Mounica;Xu, Wei
- 通讯作者:Xu, Wei
Neural semi-Markov CRF for Monolingual Word Alignment
用于单语词对齐的神经半马尔可夫条件随机场
- DOI:10.18653/v1/2021.acl-long.531
- 发表时间:2021-08
- 期刊:
- 影响因子:0
- 作者:Lan, Wuwei;Jiang, Chao;Xu, Wei
- 通讯作者:Xu, Wei
Multi-task Pairwise Neural Ranking for Hashtag Segmentation
用于标签分割的多任务成对神经排名
- DOI:10.18653/v1/p19-1242
- 发表时间:2019-07
- 期刊:
- 影响因子:0
- 作者:Maddela, Mounica;Xu, Wei;Preoţiuc
- 通讯作者:Preoţiuc
Neural Network Models for Paraphrase Identification, Semantic Textual Similarity, Natural Language Inference, and Question Answering
用于释义识别、语义文本相似性、自然语言推理和问答的神经网络模型
- DOI:
- 发表时间:2018-08
- 期刊:
- 影响因子:0
- 作者:Lan, Wuwei;Xu, Wei.
- 通讯作者:Xu, Wei.
Neural CRF Model for Sentence Alignment in Text Simplification
文本简化中句子对齐的神经 CRF 模型
- DOI:10.18653/v1/2020.acl-main.709
- 发表时间:2020-01
- 期刊:
- 影响因子:0
- 作者:Jiang, Chao;Maddela, Mounica;Lan, Wuwei;Zhong, Yang;Xu, Wei
- 通讯作者:Xu, Wei
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Wei Xu其他文献
Gut microbiome and liver diseases.
肠道微生物组和肝脏疾病。
- DOI:
10.1016/j.jceh.2014.08.010 - 发表时间:
2014-09-01 - 期刊:
- 影响因子:0
- 作者:
Nan Qin;Fengling Yang;Ang Li;Edi Prifti;Yanfei;Chen;Li Shao;Jing Guo;E. Chatelier;Jian Yao;Lingjiao Wu;Jiawei Zhou;Shujun Ni;Lin;Liu;Nicolas Pons;Jean;Sean P. Kennedy;Pierre Leonard;Chunhui Yuan;Wenchao Ding;ing Chen;Xinjun Hu;B. Zheng;Guirong Qian;Wei Xu;S. D. Ehrlich;Shusen Zheng - 通讯作者:
Shusen Zheng
Cloning and characterization of an actin gene of Chlamys farreri and the phylogenetic analysis of mollusk actins
栉孔扇贝肌动蛋白基因的克隆、表征及软体动物肌动蛋白的系统发育分析
- DOI:
10.1007/s00343-007-0304-5 - 发表时间:
2007-07-01 - 期刊:
- 影响因子:0
- 作者:
Hongming Ma;K. Mai;Zhiguo Liufu;Wei Xu - 通讯作者:
Wei Xu
[A study on the mutation of P53 and K-ras gene in colorectal adenomas and colorectal carcinomas].
结直肠腺瘤和结直肠癌中P53和K-ras基因突变的研究
- DOI:
- 发表时间:
2012-11-01 - 期刊:
- 影响因子:0
- 作者:
Wei Xu;Yong Cheng;Xiong - 通讯作者:
Xiong
Revisiting the steady states of NO/O2/C3H6 on monolithic Pt/BaO/Al2O3 using bifurcation analysis
使用分岔分析重新审视单片 Pt/BaO/Al2O3 上 NO/O2/C3H6 的稳态
- DOI:
10.1002/aic.14263 - 发表时间:
2014-02-01 - 期刊:
- 影响因子:3.7
- 作者:
Wei Xu;M. Lai;Weifang Yu;Jin Xu - 通讯作者:
Jin Xu
Spectroscopic characteristics of 1.54 μm emission in Er/Yb:LiNbO3 crystals tridoped with In3+ ions
三掺杂 In3 离子的 Er/Yb:LiNbO3 晶体中 1.54 μm 发射的光谱特性
- DOI:
10.1016/j.jallcom.2012.02.160 - 发表时间:
2012-06-25 - 期刊:
- 影响因子:6.2
- 作者:
Yannan Qian;Rui Wang;Chao Xu;Wei Xu;Xiaohong Wu;Chunhui Yang - 通讯作者:
Chunhui Yang
Wei Xu的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Wei Xu', 18)}}的其他基金
CAREER: An Integrated Framework for Controllable Text Generation
职业:可控文本生成的集成框架
- 批准号:
2144493 - 财政年份:2022
- 资助金额:
$ 5.3万 - 项目类别:
Continuing Grant
CAREER: Alterations in Marine Bivalve Shell Formation by Environmental Stress
职业:环境压力导致海洋双壳类贝壳形成的改变
- 批准号:
2046049 - 财政年份:2021
- 资助金额:
$ 5.3万 - 项目类别:
Continuing Grant
Collaborative Research: Automatic Text-Simplification and Reading-Assistance to Support Self-Directed Learning by Deaf and Hard-of-Hearing Computing Workers
协作研究:自动文本简化和阅读辅助,支持聋哑和听力障碍计算工作者的自主学习
- 批准号:
2055699 - 财政年份:2020
- 资助金额:
$ 5.3万 - 项目类别:
Standard Grant
Collaborative: INFEWS: U.S.-China: Synergistic Effects of Petroleum Production and Ocean Environmental Changes on Oyster Health
合作:INFEWS:中美:石油生产和海洋环境变化对牡蛎健康的协同效应
- 批准号:
1903719 - 财政年份:2019
- 资助金额:
$ 5.3万 - 项目类别:
Standard Grant
Collaborative Research: Automatic Text-Simplification and Reading-Assistance to Support Self-Directed Learning by Deaf and Hard-of-Hearing Computing Workers
协作研究:自动文本简化和阅读辅助,支持聋哑和听力障碍计算工作者的自主学习
- 批准号:
1822754 - 财政年份:2018
- 资助金额:
$ 5.3万 - 项目类别:
Standard Grant
CRII: RI: Learning a Timely Semantic Resource from Social Media Data
CRII:RI:从社交媒体数据中学习及时的语义资源
- 批准号:
1755898 - 财政年份:2018
- 资助金额:
$ 5.3万 - 项目类别:
Standard Grant
相似国自然基金
跨膜蛋白LRP5胞外域调控膜受体TβRI促钛表面BMSCs归巢、分化的研究
- 批准号:82301120
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
基于“免疫-神经”网络探讨眼针活化CI/RI大鼠MC靶向H3R调节“免疫监视”的抗炎机制
- 批准号:82374375
- 批准年份:2023
- 资助金额:51 万元
- 项目类别:面上项目
Dectin-2通过促进FcεRI聚集和肥大细胞活化加剧哮喘发作的机制研究
- 批准号:82300022
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
MRGPRX2激活“皮肤-神经轴”在非FcεRI介导慢性自发性荨麻疹中的作用及分子机制
- 批准号:
- 批准年份:2022
- 资助金额:30 万元
- 项目类别:青年科学基金项目
抗体介导的PRRSV感染通过FcγRI抑制I型干扰素产生的分子机制
- 批准号:
- 批准年份:2022
- 资助金额:30 万元
- 项目类别:青年科学基金项目
相似海外基金
CRII: RI: Immune-Inspired Learning Foundations of Neural Network General Robustness
CRII:RI:神经网络一般鲁棒性的免疫启发学习基础
- 批准号:
2246157 - 财政年份:2023
- 资助金额:
$ 5.3万 - 项目类别:
Standard Grant
CRII: RI: Building A Self-Learning Robot System with Neuromorphic Computing
CRII:RI:构建具有神经形态计算的自学习机器人系统
- 批准号:
2245712 - 财政年份:2023
- 资助金额:
$ 5.3万 - 项目类别:
Standard Grant
CRII: RI: Secure Multi-Agent Reinforcement Learning Algorithms
CRII:RI:安全多代理强化学习算法
- 批准号:
2105007 - 财政年份:2021
- 资助金额:
$ 5.3万 - 项目类别:
Standard Grant
CRII: RI: Learning novel multi-resolution representations of graphs: Applications to Brain Connectivity analysis for Alzheimer's Disease
CRII:RI:学习图形的新颖多分辨率表示:在阿尔茨海默氏病大脑连接分析中的应用
- 批准号:
1948510 - 财政年份:2020
- 资助金额:
$ 5.3万 - 项目类别:
Standard Grant
CRII: RI: Learning with Low-Quality Visual Data: Handling Both Passive and Active Degradations
CRII:RI:使用低质量视觉数据学习:处理被动和主动退化
- 批准号:
2053269 - 财政年份:2020
- 资助金额:
$ 5.3万 - 项目类别:
Standard Grant