手写中文文本识别的高扩展判别学习理论和方法
项目介绍
AI项目解读
基本信息
- 批准号:61203260
- 项目类别:青年科学基金项目
- 资助金额:24.0万
- 负责人:
- 依托单位:
- 学科分类:F0605.模式识别与数据挖掘
- 结题年份:2015
- 批准年份:2012
- 项目状态:已结题
- 起止时间:2013-01-01 至2015-12-31
- 项目参与者:马志强; 高峰; 陈娟; 方效林; 李乔; 吴泽君;
- 关键词:
项目摘要
Handwritten Chinese character recognition is an important branch of pattern recognition field and is of strategic significance to national document transcription. As one of the most natural interfaces, however, handwritten text recognition faces great challenges due to its limited performance. Both using massive training data and discriminatively training the recognition models do help, if we can outlook the heavy burden in computation...This project studies the theory, algorithm, and implementation aspects of distributed discriminative learning for sequential labeling tasks. The issues undertaken include: 1) Proposing a novel light-weight hidden Markov model-based recognition system; 2) Establishing theoretical framework for distributed discriminative learning, and deriving the algorithms' convergence, generalization and complexity; 3) Developing more concrete computational models for baseline recognition systems, and deploying them using distributed discriminative learning. ..The expected main contributions of the project lie in: 1) Comprehensive theoretical guarantees for distributed discriminative learning; 2) Innovative methods for large-category pattern recognition using discriminative learning techniques. The outputs of the project may resolve both the performance bottleneck and the efficacy bottleneck, and the efficient methods may greatly inspire other fields.
手写汉字识别是模式识别领域的重要分支,作为电子化中文文档的利器,对于整个国家具有战略意义。手写中文文本识别是最自然的汉字输入技术之一,但面临严峻的性能瓶颈。海量训练数据和判别学习都有助于性能的提升,却存在巨大的计算复杂度。本项目旨在从理论、算法和实现三个层面上设计基于分布式计算环境的高扩展判别学习方法。研究内容包括:1)建立当前最先进的基准识别系统,特别提出一种新颖的轻量级隐马尔可夫模型;2)研究分布式判别学习理论框架,支持对算法的收敛性、泛化界和复杂度的分析;3)研究生成式基准系统的分布式判别学习方法,在扩展当前计算模型的基础上,实现手写中文文本识别系统的分布式判别学习。本项目将建立具有鲜明特色的分布式判别学习的完整体系;提出针对大类别序列模式判别学习的一系列创新方法。最终解决手写中文文本识别的性能和效率双重瓶颈,并得到可推广到其它领域的重要成果。
结项摘要
手写汉字识别是模式识别领域的重要分支,作为电子化中文文档的利器,对于整个国家具有战略意义。手写中文文本识别是最自然的汉字输入技术之一,但面临性能和效率的双重瓶颈。海量训练数据和判别学习都有助于性能的提升,却存在巨大的计算复杂度。本项目紧紧围绕手写文本识别中的高扩展判别学习理论和方法,设计了一系列对海量训练数据和大类别序列标记任务具有高扩展性、快收敛性和强泛化性的普适学习方法。在解决手写文本识别中的性能和效率两方面的瓶颈问题上,主要开展了三个层面的研究工作。第一,提出基于MPE判别学习的手写汉字识别框架。它的目标函数是识别错误的光滑近似,可以通过EBW优化方法求解。加入样本合成技术扩充训练数据后,相较MLE,MPE可以减少28%的识别错误;得到的性能是HMM/GMM框架下最好的结果,可以为其他研究者提供比较基准。第二,基于CPU+GPU异构计算架构,提出适用于大规模、大类别分类任务的原型学习算法框架。通过分解和重组算法的计算任务,将密集的计算负载转移到GPU上,而CPU只需进行少量的流程控制;然后根据任务类型自适应地决定是采用分块策略还是并行归约策略来实现。方案在小批量处理的模式下,该算法最高可达194倍的加速比(GTX680)或638倍(GTX980)。第三,提出基于网络传播的快速原型预测算法和免解压的原型模型压缩算法,用于解决目前移动终端上的预测速度瓶颈和存储限制。前者建立的原型网络遵循"小世界效应",在一定条件下可以保证任意节点间以较小的测地路径可达,这为利用链接关系去搜寻"优质"的节点提供了依据。为限制搜索空间,加入贪心选择过程,只让少数几个优质节点进入扩展队列。通过理论层面的网络结构分析和实践层面的算法传播性分析,揭示了算法在执行效率和实用性上的优势。后者通过对原型向量在每个维度上进行聚类,得到含256条目的字典,并用字典的元素索引替换该维度上的原型向量值。替换后,存储空间得到4倍的消减。这一精简方案,对于更复杂的原型模型会越加有效。在识别时,无需重构原型向量,而是直接在字典上进行运算,然后分发给对应向量元素。本项目的研究成果发表专著1本,发表SCI期刊论文2篇、核心期刊论文2篇、国际会议论文2篇;同时项目组取得ICDAR’2013手写汉字识别竞赛的两项冠军;原型学习相关的成果也已经成功得到产品转化。
项目成果
期刊论文数量(4)
专著数量(5)
科研奖励数量(2)
会议论文数量(3)
专利数量(0)
A federated approach to develop enterprise interoperability
开发企业互操作性的联合方法
- DOI:10.1007/s10845-013-0868-1
- 发表时间:2014-01
- 期刊:Journal of Intelligent Manufacturing
- 影响因子:8.3
- 作者:Zhiying Tu;Zacharewicz, Gregory;David Chen
- 通讯作者:David Chen
面向连续叠写的高精简中文手写识别方法研究
- DOI:--
- 发表时间:2015
- 期刊:计算机科学
- 影响因子:--
- 作者:戴洪良;张健;马培军;邓胜春
- 通讯作者:邓胜春
Building a high-level architecture federated interoperable framework from legacy information systems
从遗留信息系统构建高层架构联合互操作框架
- DOI:10.1080/0951192x.2011.646306
- 发表时间:2014-04
- 期刊:International Journal of Computer Integrated Manufacturing
- 影响因子:4.1
- 作者:Zhiying Tu;Zacharewicz Gregory;David Chen
- 通讯作者:David Chen
面向异构并行架构的大规模原型学习算法
- DOI:--
- 发表时间:2016
- 期刊:哈尔滨工业大学学报
- 影响因子:--
- 作者:苏统华;李松泽;邓胜春;于洋;白薇
- 通讯作者:白薇
共 4 条
- 1
其他文献
基于无切分策略的真实手写中文文本识别
- DOI:--
- 发表时间:--
- 期刊:Pattern Recognition
- 影响因子:8
- 作者:苏统华;张田文
- 通讯作者:张田文
共 1 条
- 1
苏统华的其他基金
基于多模态持续学习的汉字书写智能教师模型研究
- 批准号:
- 批准年份:2022
- 资助金额:55 万元
- 项目类别:面上项目
基于多模态持续学习的汉字书写智能教师模型研究
- 批准号:62277011
- 批准年份:2022
- 资助金额:55.00 万元
- 项目类别:面上项目
基于深度学习的多语种自然手写文本识别理论和方法
- 批准号:61673140
- 批准年份:2016
- 资助金额:62.0 万元
- 项目类别:面上项目