Recognition of Cursive/Blind Kanji Handwriting Utilizing the Contuinous Speech Recognition Approach

利用连续语音识别方法识别草书/盲汉字手写体

基本信息

项目摘要

In this project, continuous speech recognition (CSR) approach was successfully applied to online handwriting recognition and produced enormous results. Replacing phonemes and grammar in CSR with 25 basic strokes and Kanji structure lexicon and utilizing highly advanced CSR techniques to make an efficient search in the solution space, the newly developed technology is able to recognize cursive and blind hand-written Kanji characters. By observing the velocity vector sequence of the pen movements, this technology estimates the intension of what Kanji character is being written instead of recognizing the drawn figure so that it may recognize heavily deformed characters even human can not read.After establishing the above fundamental structure of the technology, we investigated a number of research items such as velocity-based features (comparing several feature parameters), pen pressure as a feature, stroke context-dependent modeling (considering stroke deformation caused by previous and following strokes), stroke macro model (adjacent strokes are combined to form a macro-stroke), adaptation to writers (adapting HMMs to the writer's characteristics), recognition of blind writing (written without seeing), recognizing overlapped writing (multiple characters on the same area), acceleration of recognition speed (improved search algorithm), curved strokes for numerics and Hirakana, and collection of cursive, blind writing and ones from blind people.Utilizing the research results, our R&D proposal of "Handwritten Communication for the Blind" was approved by Ishikawa Prefecture with a support of 100 million yen. The two projects cooperated well with each other so that more than 1 million handwritten character data were collected including cursive, blind, and sight-impaired characters.
在该项目中,连续语音识别(CSR)方法成功应用于在线手写识别,并产生了巨大的成果。新开发的技术以25种基本笔画和汉字结构词典取代CSR中的音素和语法,并利用高度先进的CSR技术在解决方案空间中进行高效搜索,能够识别草书和盲手写汉字。该技术通过观察笔运动的速度矢量序列,来估计正在书写的汉字字符的强度,而不是识别所画的图形,从而可以识别甚至人类无法阅读的严重变形的字符。该技术,我们调查了许多研究项目,例如基于速度的特征(比较多个特征参数)、笔压作为特征、笔画上下文相关建模(考虑前后笔画引起的笔画变形)、笔画宏观模型(相邻的笔画组合起来形成宏观笔画)、适应书写者(使 HMM 适应书写者的特征)、识别盲写(看不到的书写)、识别重叠书写(同一区域上的多个字符)、加快识别速度(改进搜索算法)、数字和平假名的弯曲笔画,以及草书、盲文和盲人作品的收集。利用研究成果,我们的“盲人手写交流”研发计划获得了石川县的批准并提供1亿日元的支援。两个项目通力合作,收集了超过100万条手写文字数据,包括草书、盲文、盲人字等。

项目成果

期刊论文数量(48)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
嵯峨山 茂樹, 中井 満, 下平 博: "ストロークHMMに基づくオンライン手書き文字認識方式"電子情報通信学会技術研究報告. PRMU2000-35. 1-8 (2000)
Shigeki Sagayama,Mitsuru Nakai,Hiroshi Shimodaira:“基于笔画HMM的在线手写字符识别方法”IEICE技术研究报告1-8(2000)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Junko Tokuno, Nobuhito Inami, Shigeki Matsuda, Mitsuru Nakai, Hiroshi Shimodaira, Shigeki Sagayama: "Context-Dependent Substroke Model for HMM-based On-line Handwriting Recognition"Proceedings of 8th International Workshop on Frontiers in Handwriting Reco
Junko Tokuno、Nobuhito Inami、Shigeki Matsuda、Mitsuru Nakai、Hiroshi Shimodaira、Shigeki Sagayama:“基于 HMM 的在线手写识别的上下文相关子笔画模型”第八届手写识别前沿国际研讨会论文集
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
井波暢人,松田繁樹,中井満,下平博,嵯峨山茂樹: "環境依存型ストロークHMMによるオンライン手書き文字認識"平成12年電気関係学会北陸支部大会講演論文集,F-93. 394 (2000)
Nobuto Inami、Shigeki Matsuda、Mitsuru Nakai、Hiroshi Shimodaira、Shigeki Sagayama:“使用环境相关笔画 HMM 进行在线手写字符识别”日本电气工程师学会 2000 年北陆分会会议记录,F-93(2000 年) )
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Naoto Akira, Mitsuru Nakai, Hiroshi Shimodaira, and Shigeki Sagayama: "On-line Handwritten Character Recognition based on Stroke-HMM in non Visual-feedback Writing Condition"IEICE Technical Report. PRMU2000-206. 39-46 (2001)
Naoto Akira、Mitsuru Nakai、Hiroshi Shimodaira 和 Shigeki Sagayama:“非视觉反馈书写条件下基于笔画-HMM 的在线手写字符识别”IEICE 技术报告。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
中井満,嵯峨山茂樹,秋良直人,小場久雄,下平博: "ストロークHMMによるオンライン手書き文字認識の性能評価"信学技報,PRMU2000-36. 9-16 (2000)
Mitsuru Nakai、Shigeki Sagayama、Naoto Akira、Hisao Oba、Hiroshi Shimodaira:“使用笔画 HMM 进行在线手写字符识别的性能评估”IEICE 技术报告,PRMU2000-36 (2000)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

SAGAYAMA Shigeki其他文献

DNN-Based Full-Band Speech Synthesis Using GMM Approximation of Spectral Envelope
使用频谱包络 GMM 近似的基于 DNN 的全频带语音合成
  • DOI:
    10.1587/transinf.2020edp7075
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0.7
  • 作者:
    KOGUCHI Junya;TAKAMICHI Shinnosuke;MORISE Masanori;SARUWATARI Hiroshi;SAGAYAMA Shigeki
  • 通讯作者:
    SAGAYAMA Shigeki

SAGAYAMA Shigeki的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('SAGAYAMA Shigeki', 18)}}的其他基金

Versatile music processing by combining statistical signal processing and music theory
结合统计信号处理和音乐理论的多功能音乐处理
  • 批准号:
    23240021
  • 财政年份:
    2011
  • 资助金额:
    $ 6.78万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
Analysis, Recognition, Manipulation and Generation of Music Signal and Information based on Mathematical Models
基于数学模型的音乐信号和信息的分析、识别、操纵和生成
  • 批准号:
    20240017
  • 财政年份:
    2008
  • 资助金额:
    $ 6.78万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
Research on Signal and Information Processing for Automatic Music Analysis, Recognition and Generation
自动音乐分析、识别和生成的信号和信息处理研究
  • 批准号:
    17300054
  • 财政年份:
    2005
  • 资助金额:
    $ 6.78万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Music Information Processing Using Continuous Speech Recognition Methods
使用连续语音识别方法的音乐信息处理
  • 批准号:
    14380156
  • 财政年份:
    2002
  • 资助金额:
    $ 6.78万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了