Classification of Japanese Consonants in terms of Structured Modeling and Geometrical Interpretation of Dynamic Characteristics in Transient Parts

从结构化建模和瞬态部分动态特性的几何解释角度对日语辅音进行分类

基本信息

项目摘要

Transient part of speech signals has been of great interest these years in speech recognition. Furui proposed delta cepstrum coefficients to extract a dynamic characteristic of speech signals and achieved higher recognition rate than ever [1986]. It should be noted, however, that conventional approaches including the dynamic characteristics depend on a linear prediction that features formats of speech signals. We employed a structural model named the natural observation system for speech modeling and a geometrical interpretation to classify the types of transient parts.A natural observation filter (NOF) consists of a series of first order filters with the same cutoff frequency : a low pass filter of a first stage followed by high pass filters. The NOF can reconstruct an input signal with a linear combination of outputs at each stage of first order filters, employing appropriate coefficients. We called them natural observation coefficients (NOCs). We can analyze signals by the time courses of NOCs with multi-cutoff frequencies (NOC pattern), because each NOC is a function of the cutoff frequency. We applied the NOC pattern for Japanese consonants, fricatives and stops, to study the transient parts of speech signals. Consequently, we obtained distinguishable NOC patterns that probably reflect an instantaneous structure of Japanese consonants, fricatives and stops, and following vowels.On the other hand, we used a geometrical interpretation of the transient parts. A two-dimensional plane in the p-dimensional Hilbert space was determined so that the trajectory of coefficients vector becomes as straight as possible. We use three types of parameters, including linear prediction coefficients, LPC cepstrum coefficients, and NOCs which are structured parameters. As a result, NOCs show a rather straight line than the other two. Limiting to LPC cepstrum coefficients, the smoothly progressive trajectory to a following vowel contributed to the high recognition rate.
言语信号的短暂部分在语音识别中引起了极大的兴趣。 Furui提出的Delta cepstrum系数提取语音信号的动态特征,并比以往任何时候都更高的识别率[1986]。但是,应该指出的是,包括动态特征在内的常规方法取决于具有语音信号格式的线性预测。我们采用了一种称为语音建模的自然观察系统和几何解释的结构模型来对瞬态零件的类型进行分类。自然观察滤波器(NOF)由一系列具有相同截止频率的一阶过滤器组成:第一阶段的低通滤波器,然后是高通滤波器。 NOF可以使用适当的系数在一阶过滤器的每个阶段重建输出信号的输入信号。我们称它们为自然观察系数(NOC)。我们可以通过具有多切口频率(NOC模式)的NOC的时间过程来分析信号,因为每个NOC都是截止频率的函数。我们将NOC模式应用于日本的辅音,摩擦剂和停止,以研究语音信号的瞬态部分。因此,我们获得了可区分的NOC模式,这些模式可能反映了日本辅音,摩擦和停止的瞬时结构,并遵循元音。另一方面,我们使用了对瞬态部分的几何解释。确定了p维希尔伯特空间中的二维平面,以使系数矢量的轨迹变得尽可能直。我们使用三种类型的参数,包括线性预测系数,LPC CEPSTRUM系数和结构化参数的NOC。结果,NOC显示出比其他两个相当直线的。限制了LPC Cepstrum系数,平稳进行轨迹到以下元音有助于高识别率。

项目成果

期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
木竜 徹,野田 泰之,堀 潤一,齊藤 義明: "自然観測係数パタ-ンによる摩擦音・破裂音での遷移区間の解析" 電子情報通信学会技術速報. SP. (1992)
Toru Kiryu、Yasuyuki Noda、Junichi Hori、Yoshiaki Saito:“使用自然观察系数模式分析摩擦音和爆破音的过渡部分”IEICE 技术公告 SP。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
共 1 条
  • 1
前往

HORI Jun-ichi的其他基金

Study on application of neutron resonance densitometry to non-destractive assay for spent nuclear fuel
中子共振密度计在乏核燃料无损检测中的应用研究
  • 批准号:
    24760714
    24760714
  • 财政年份:
    2012
  • 资助金额:
    $ 1.22万
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
    Grant-in-Aid for Young Scientists (B)
A study of effects of mouth-guard under physical movement
物理运动下护齿套效果的研究
  • 批准号:
    05671658
    05671658
  • 财政年份:
    1993
  • 资助金额:
    $ 1.22万
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)
    Grant-in-Aid for General Scientific Research (C)

相似国自然基金

控制灌溉水稻水分响应规律与需水时空动态特征立体感知方法研究
  • 批准号:
    52309051
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
飞鸟动态电磁散射特性建模及运动特征提取研究
  • 批准号:
    62361006
  • 批准年份:
    2023
  • 资助金额:
    32 万元
  • 项目类别:
    地区科学基金项目
典型亚热带森林溶解性有机碳迁移动态特征及驱动机制研究
  • 批准号:
    42307309
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
带有时变决策空间特征的动态多目标优化与应用
  • 批准号:
    62376288
  • 批准年份:
    2023
  • 资助金额:
    49.00 万元
  • 项目类别:
    面上项目
基于纹波电流特征的永磁电机宽速域高动态转子位置估计方法研究
  • 批准号:
    52307051
  • 批准年份:
    2023
  • 资助金额:
    20.00 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Multi-omic phenotyping of human transcriptional regulators
人类转录调节因子的多组学表型分析
  • 批准号:
    10733155
    10733155
  • 财政年份:
    2023
  • 资助金额:
    $ 1.22万
    $ 1.22万
  • 项目类别:
Mathematical modeling for optimal control of BK virus infection in kidney transplant recipients
肾移植受者 BK 病毒感染最佳控制的数学模型
  • 批准号:
    10741703
    10741703
  • 财政年份:
    2023
  • 资助金额:
    $ 1.22万
    $ 1.22万
  • 项目类别:
Generation of Motor Cortical Dynamics Controlling Skilled Locomotion
产生控制熟练运动的运动皮层动力学
  • 批准号:
    10732888
    10732888
  • 财政年份:
    2023
  • 资助金额:
    $ 1.22万
    $ 1.22万
  • 项目类别:
Transdiagnostic Associations Across Developmental Disorders
发育障碍的跨诊断关联
  • 批准号:
    10501785
    10501785
  • 财政年份:
    2022
  • 资助金额:
    $ 1.22万
    $ 1.22万
  • 项目类别:
Modeling of Control Characteristics of Human Operator and Design of Assistance System under Sudden Change in Dynamic Characteristics of Controlled System
受控系统动态特性突变下操作员控制特性建模及辅助系统设计
  • 批准号:
    22K04033
    22K04033
  • 财政年份:
    2022
  • 资助金额:
    $ 1.22万
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
    Grant-in-Aid for Scientific Research (C)