SGER: Using Text Coherence and Verbal Valence in Long- Distance N-grams
SGER:在长距离 N 元语法中使用文本连贯性和语言效价
基本信息
- 批准号:9704046
- 负责人:
- 金额:$ 5万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:1997
- 资助国家:美国
- 起止时间:1997-01-15 至 1997-12-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
*** Building better speech recognizers requires augmenting n-gram grammars with sophisticated yet probabilistic linguistic knowledge. This project is building probabilistic models of two important pieces of syntactic/semantic knowledge: verb-argument constraints and semantic text coherence.(1) Verbs place strong constraints on the syntax and semantics of their arguments. This project is computing probabilities for the different argument structures that can co-occur with different verbs, and using these probabilities to augment standard trigram language models.(2) Texts and discourses tend to be semantically coherent;in particular the words that occur in a text tend to be semantically related to each other. This project is applying a model of word meaning called Latent Semantic Analysis (LSA) to ASR LMs. In LSA, a word-similarity metric is defined by computing a large matrix of word co-occurrence probabilities, which are then smoothed via Singular Value Decomposition, resulting in a generalized measure of semantic word-similarity. Trigram models can then increase the probability that similar words will occur near each other. Building these two stochastic models of linguistic knowledge, besides possible application in speech recognition LMs, word-sense disambiguation, or parsing, also helps bridge the gap between the structural models used in linguistics and the statistical models of speech engineering.***
***构建更好的语音识别者需要增强具有复杂但概率的语言知识的N-Gram语法。 该项目正在建立两个重要的句法/语义知识的概率模型:动词 - 题词的约束和语义文本连贯性。(1)动词对他们的论证的语法和语义构成了强大的约束。 该项目是可以与不同动词共同发生的不同参数结构的计算概率,并使用这些概率来增强标准的Trigram语言模型。(2)文本和话语倾向于在语义上相干;在文本中发生的单词往往与彼此相关。 该项目将称为潜在语义分析(LSA)的单词含义模型应用于ASR LMS。 在LSA中,通过计算一个单词共发生概率的大矩阵来定义单词相似度度量,然后通过单数值分解来平滑,从而导致语义单词相似之处的普遍测量。 然后,Trigram模型可以增加彼此近乎相似单词的概率。 构建了语言知识的这两种随机模型,除了在语音识别LMS,单词态度的歧义或解析中可能应用,还有助于弥合语言学中使用的结构模型与语音工程的统计模型之间的差距。*** ***
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Daniel Jurafsky其他文献
ReFT: Representation Finetuning for Language Models
ReFT:语言模型的表示微调
- DOI:
- 发表时间:
2024 - 期刊:
- 影响因子:0
- 作者:
Zhengxuan Wu;Aryaman Arora;Zheng Wang;Atticus Geiger;Daniel Jurafsky;Christopher D. Manning;Christopher Potts - 通讯作者:
Christopher Potts
Daniel Jurafsky的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Daniel Jurafsky', 18)}}的其他基金
RI: Small: New tools for studying structural and inductive bias in NLP models
RI:小:研究 NLP 模型中的结构和归纳偏差的新工具
- 批准号:
2128145 - 财政年份:2021
- 资助金额:
$ 5万 - 项目类别:
Continuing Grant
RI: Medium: Deep Understanding: Integrating Neural and Symbolic Models of Meaning
RI:中:深度理解:整合意义的神经模型和符号模型
- 批准号:
1514268 - 财政年份:2015
- 资助金额:
$ 5万 - 项目类别:
Continuing Grant
RI: Small: Learning Meaning and Grammar from Interaction, Context, and the World
RI:小:从互动、情境和世界中学习意义和语法
- 批准号:
1216875 - 财政年份:2012
- 资助金额:
$ 5万 - 项目类别:
Standard Grant
RI-Small: Unsupervised Learning of Meaning
RI-Small:无监督意义学习
- 批准号:
0811974 - 财政年份:2008
- 资助金额:
$ 5万 - 项目类别:
Standard Grant
Modeling Pronunciation Variation for Universal Access to Speech Understanding
为普遍获得语音理解而建模发音变化
- 批准号:
9978025 - 财政年份:1999
- 资助金额:
$ 5万 - 项目类别:
Continuing Grant
CAREER: Spoken Lexical Processing in Humans and Machines
职业:人类和机器的口语词汇处理
- 批准号:
9733067 - 财政年份:1998
- 资助金额:
$ 5万 - 项目类别:
Continuing Grant
相似国自然基金
使用单分子磁镊研究DNA纽结
- 批准号:12374216
- 批准年份:2023
- 资助金额:53 万元
- 项目类别:面上项目
开放空间内部特征对公共生活行为的复合影响效应与使用者感知机理研究
- 批准号:52308052
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
时空交互与社会化交互协同驱动的弱势道路使用者轨迹预测方法研究
- 批准号:52302501
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
使用三维辐射磁流体力学数值模拟研究太阳活动区日冕加热问题
- 批准号:12373054
- 批准年份:2023
- 资助金额:52 万元
- 项目类别:面上项目
同义密码子使用模式对BVDV NS5A介导IRES元件翻译调控的影响
- 批准号:32360874
- 批准年份:2023
- 资助金额:32 万元
- 项目类别:地区科学基金项目
相似海外基金
Understanding Processes of Neighborhood Change using Property Text Analytics
使用属性文本分析了解社区变化的过程
- 批准号:
2314726 - 财政年份:2023
- 资助金额:
$ 5万 - 项目类别:
Standard Grant
日本人大学院生の学術論文テキストへの著者介在マーカー使用選択メカニズムの解明
阐明日本研究生选择在学术论文文本中使用作者介导的标记的机制
- 批准号:
23K00673 - 财政年份:2023
- 资助金额:
$ 5万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
An integrated intervention using a pill ingestible sensor system to trigger actions on multifaceted social and behavioral determinants of health among PLWH
使用药丸摄入传感器系统进行综合干预,以针对艾滋病毒感染者健康的多方面社会和行为决定因素采取行动
- 批准号:
10820048 - 财政年份:2023
- 资助金额:
$ 5万 - 项目类别:
Meeting young people where they are: Using technology to promote resilience among child maltreatment victims
与年轻人见面:利用技术提高虐待儿童受害者的复原力
- 批准号:
10664529 - 财政年份:2023
- 资助金额:
$ 5万 - 项目类别:
Constructing a large-scale biomedical knowledge graph using all PubMed abstracts and PMC full-text articles and its applications
利用所有PubMed摘要和PMC全文文章构建大规模生物医学知识图谱及其应用
- 批准号:
10648553 - 财政年份:2023
- 资助金额:
$ 5万 - 项目类别: