Topic segmentation of speech data based on keyword detection
基于关键词检测的语音数据主题分割
基本信息
- 批准号:10680415
- 负责人:
- 金额:$ 2.11万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (C)
- 财政年份:1998
- 资助国家:日本
- 起止时间:1998 至 1999
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
A method of topic identification is proposed for TV news speech based on the keyword spotting technique. Three thousands of nouns are selected as keywords which contribute to topic identification, based on criterion of mutual information and a length of the word. The topic of news is identified by calculating possibilities of the topics in terms of an acoustic score of the spotted word and a topic probability of the word. Topic identification rate is 66.5 percent assuming that identification is correct if the correct topic is included in the first three places of the result of topic identification.A new method of keyword spotting using prosodic information as well as phonemic information is discussed in order to reduce false alarms keeping high detection rate. Prosodic dissimilarity between a keyword and input speech is measured by DP matching of F0 contours. A total score based on these two measures is used for detecting keywords. The F0 template are stored for each keyword after smoothing based on the F0 model. The introduction of F0 information reduced false alarms by 30% to 50% for the same detection rate for TV news speech.A method of estimating accuracy of word spotting is proposed and it is compared with the estimation based on the length of the word. False alarm counts are estimated by a new measure calculated by simulation of speech recognition for phoneme sequences that the language model generates. The simulation-based measure shows better performance for the estimation of false alarms.
提出了一种基于关键字发现技术的电视新闻演讲的主题识别方法。根据相互信息的标准和单词的长度,选择了三千个名词作为关键字,这些名词有助于主题识别。新闻主题是通过根据斑点单词的声学得分和单词的主题概率来计算主题的可能性来确定的。主题识别率为66.5%,假设识别是正确的,如果在主题识别结果的前三个位置中包含正确的主题,则讨论了使用韵律信息以及音调信息的新方法,以减少虚假警报,以减少保持高检测率的错误警报。关键字和输入语音之间的韵律差异是通过F0轮廓的DP匹配来衡量的。基于这两种措施的总分数用于检测关键字。基于F0模型平滑后,为每个关键字存储F0模板。对于电视新闻语音的相同检测率,F0信息的引入将错误警报降低了30%至50%。提出了一种估计单词斑点准确性的方法,并将其与基于单词长度的估计进行了比较。虚假警报计数是通过通过模拟语言模型生成的音素序列的语音识别计算得出的新测量来估算的。基于仿真的度量显示了估计错误警报的更好的性能。
项目成果
期刊论文数量(11)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
山下 洋一: "スポッティングにおける湧き出し予測のための音声認識シミュレーション"日本音響学会春季論文集. 163-164 (1999)
Yoichi Yamashita:“定位中涌流预测的语音识别模拟”日本声学学会春季会议记录 163-164 (1999)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Yoichi Yamashita: "Topic Recognition for News Speech Based on Keyword Spotting"Proc. of ICSLP '98. 3. 839-842 (1998)
Yoichi Yamashita:“基于关键词识别的新闻语音主题识别”Proc。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
山下 洋一: "スポッティングにおける湧き出し予測のための音声認識シミュレーション"日本音響学会春季講演論文集. 163-164 (1999)
Yoichi Yamashita:“定位中喷涌预测的语音识别模拟”日本声学学会春季讲座论文集 163-164(1999)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Yoichi Yamashita: "Prediction of Keyword Spotting Accuracy Based on Simulation"Proc. of Eurospeech '99. 3. 1235-1238 (1999)
Yoichi Yamashita:“基于仿真的关键词识别准确率预测”Proc。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Yoichi Yamashita: "Topic Recognition for News Speech Based on Keyword Spotting"Proc.of ICSLP '98. 3. 839-842 (1998)
Yoichi Yamashita:“基于关键词识别的新闻语音主题识别”Proc.of ICSLP 98。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
YAMASHITA Yoichi其他文献
YAMASHITA Yoichi的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('YAMASHITA Yoichi', 18)}}的其他基金
A Study on Speech Synthesis with Rich Personality Based on Automatic Scoring of Reproduction of Speaker Identity
基于说话人身份再现自动评分的富有个性语音合成研究
- 批准号:
24500223 - 财政年份:2012
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Lecture speech summarization based on the key sentence extraction using prosodic changes
基于韵律变化关键句提取的讲座语音摘要
- 批准号:
18500143 - 财政年份:2006
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
相似国自然基金
跨模态的多语种新闻热点人物标识方法研究
- 批准号:61902301
- 批准年份:2019
- 资助金额:28.0 万元
- 项目类别:青年科学基金项目
基于主题发现的图像语义理解与识别
- 批准号:61165009
- 批准年份:2011
- 资助金额:50.0 万元
- 项目类别:地区科学基金项目
相似海外基金
SBIR TOPIC 411 "IMAGEDEPHI: IMAGE DE-IDENTIFICATION FOR THE ACCELERATION OF CANCER RESEARCH"
SBIR 主题 411“IMAGEDEPHI:图像去识别以加速癌症研究”
- 批准号:
10726855 - 财政年份:2022
- 资助金额:
$ 2.11万 - 项目类别:
Topic Identification From Quantum Technology Research Articles
量子技术研究文章的主题识别
- 批准号:
573399-2022 - 财政年份:2022
- 资助金额:
$ 2.11万 - 项目类别:
University Undergraduate Student Research Awards
TOPIC 427 - De-Identification Software Tools and Pipelines for Cancer Imaging Research
主题 427 - 用于癌症成像研究的去识别化软件工具和管道
- 批准号:
10612710 - 财政年份:2021
- 资助金额:
$ 2.11万 - 项目类别:
TOPIC 427 - De-Identification Software Tools and Pipelines for Cancer Imaging Research
主题 427 - 用于癌症成像研究的去识别化软件工具和管道
- 批准号:
10496719 - 财政年份:2021
- 资助金额:
$ 2.11万 - 项目类别:
TOPIC #411 - PHASE I SBIR CONTRACT - AN IMAGEDX BASED PLATFORM FOR COMPREHENSIVE DE-IDENTIFICATION OF WSI DATA
话题
- 批准号:
10274084 - 财政年份:2020
- 资助金额:
$ 2.11万 - 项目类别: