Japanese text dictation system for official reports
官方报告的日语文本听写系统
基本信息
- 批准号:07558042
- 负责人:
- 金额:$ 3.39万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (B)
- 财政年份:1995
- 资助国家:日本
- 起止时间:1995 至 1997
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
The experts often make official reports such as for estimation of real estiate, for medico-legal autopsy and so on. It is a time-consuming job to make official reports. If speech input is automatically transformed to sentenses, the load of making document will be decreased. In current speech input system, it is still difficult to automatically recognize continuously spoken general sentences. But, when the condition is so limited that a user is special, 1) a user is limited to a specified speaker, 2) the expression of document is almost decided, and the structure of sentence is comparatively simple, 3) the vocabulary number in the official reports is 4000 from 3000, and the vocabulary number decrease more by deviding the document into each of parts. These conditions will lighten load to a device, and the device will be developed with ease.In this research, we have developed a sentense recognition system for autopsy reports. Firstly, we built an automaton by ECGI method to represent the structure of sentence. Then we defined the distance between the states of an automaton to strengthen correspondence to the words, the appearance of which was expected. Based on this definition, we developed a method in which an automaton was revised and generalized. For phoneme recognition, we used the model sound method developed by Niyada. We, all the members, put the above-mentioned methods together and made the sound input system of autopsy findings. The system ran to recognize sounds without time delay. Since the precision of sound recognition is not enough, the improvement of the system will be continued in future.
专家经常出具房产估价、法医学尸检等正式报告。制作正式报告是一项耗时的工作。如果将语音输入自动转换为句子,则可以减少制作文档的负担。在当前的语音输入系统中,自动识别连续说出的一般句子仍然很困难。但是,当条件有限,用户比较特殊时,1)用户仅限于特定的说话人,2)文档的表达方式基本确定,句子的结构比较简单,3)文档中的词汇量官方报告从3000个变成了4000个,通过将文档分成各个部分,词汇量减少得更多。这些条件将减轻设备的负载,并且设备的开发将变得容易。在本研究中,我们开发了尸检报告的句子识别系统。首先,我们通过ECGI方法构建了一个自动机来表示句子的结构。然后,我们定义了自动机状态之间的距离,以加强与预期出现的单词的对应关系。基于这个定义,我们开发了一种对自动机进行修改和推广的方法。对于音素识别,我们使用了 Niyada 开发的模型声音方法。我们全体成员将上述方法综合起来,制定了完善的尸检结果输入系统。系统运行来识别声音,没有时间延迟。由于声音识别的精度还不够,未来还将继续对系统进行改进。
项目成果
期刊论文数量(24)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
S.MAKINO,M.SUZUKI,A.HARADA: "Automatic Acquistion of Language Model using HMnet" Proc.Inter.Conf on Speech Processing. I. 47-54 (1997)
S.MAKINO、M.SUZUKI、A.HARADA:“使用 HMnet 自动获取语言模型”Proc.Inter.Conf 关于语音处理的内容。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
沖本,牧野,曽根: "確率尺度によるDPマッチングを用いた音素のセグメンテーション" 日本音響学会講演論文集. I. 165-166 (1995)
Okimoto、Makino、Sone:“使用概率测量进行 DP 匹配的音素分割”日本声学学会会议记录 I. 165-166 (1995)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
S.MAKINO, M.SUZUKI,: "Automatic Acquistion of LanguageModel using HMnet" Proc.Inter.Conf on Speech Processing. I. 47-54 (1997)
S.MAKINO、M.SUZUKI,:“使用 HMnet 自动获取语言模型”Proc.Inter.Conf 关于语音处理的内容。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
大坂,牧野: "発声速度に基づく音素持続時間予測を用いた音素認識" 信学技報. Vol. 96 No. 93. 1-6 (1996)
Osaka, Makino:“基于语速的音素持续时间预测的音素识别”IEICE 技术报告,第 96 卷第 93. 1-6 (1996)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
大坂,牧野,曽根: "予備認識結果に基づく持続時間予測の音素認識における効果" 日本音響学会講演論文集. I. 55-56 (1995)
Osaka, Makino, Sone:“基于初步识别结果的持续时间预测对音素识别的影响”日本声学学会会议记录 I. 55-56 (1995)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
MAKINO Shozo其他文献
MAKINO Shozo的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('MAKINO Shozo', 18)}}的其他基金
Continuous speech recognition with adaptabilty to the speaking rate of an input speech
连续语音识别,可适应输入语音的语速
- 批准号:
07458064 - 财政年份:1995
- 资助金额:
$ 3.39万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Study on utilization and effectiveness of linguistic information in the word recognition based on phoneme, syllable or character sequence with errors
基于音素、音节或错误字符序列的单词识别中语言信息的利用和有效性研究
- 批准号:
63460222 - 财政年份:1988
- 资助金额:
$ 3.39万 - 项目类别:
Grant-in-Aid for General Scientific Research (B)
Shape Estimation and Detection of Defects of a Structural Object from Acoustic Signal Using Digital Signal Processing and Intellectual Processing
使用数字信号处理和智能处理从声学信号中估计结构物体的形状并检测其缺陷
- 批准号:
63420037 - 财政年份:1988
- 资助金额:
$ 3.39万 - 项目类别:
Grant-in-Aid for General Scientific Research (A)
相似国自然基金
发音错误自动检测方法的研究及其在语言学习中的应用
- 批准号:60772165
- 批准年份:2007
- 资助金额:25.0 万元
- 项目类别:面上项目
相似海外基金
Research and Production of a Manual on English Phoneme Recognition for International Students
留学生英语音素识别手册的研究与制作
- 批准号:
23K12201 - 财政年份:2023
- 资助金额:
$ 3.39万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
Development of spoken word recognition and phoneme awareness in young children
幼儿口语单词识别和音素意识的发展
- 批准号:
341588-2008 - 财政年份:2012
- 资助金额:
$ 3.39万 - 项目类别:
Discovery Grants Program - Individual
Development of spoken word recognition and phoneme awareness in young children
幼儿口语单词识别和音素意识的发展
- 批准号:
341588-2008 - 财政年份:2011
- 资助金额:
$ 3.39万 - 项目类别:
Discovery Grants Program - Individual
Development of spoken word recognition and phoneme awareness in young children
幼儿口语单词识别和音素意识的发展
- 批准号:
341588-2008 - 财政年份:2010
- 资助金额:
$ 3.39万 - 项目类别:
Discovery Grants Program - Individual
Development of spoken word recognition and phoneme awareness in young children
幼儿口语单词识别和音素意识的发展
- 批准号:
341588-2008 - 财政年份:2009
- 资助金额:
$ 3.39万 - 项目类别:
Discovery Grants Program - Individual