图文混合笔输入文档分析与识别的理论与方法研究
项目介绍
AI项目解读
基本信息
- 批准号:61273269
- 项目类别:面上项目
- 资助金额:81.0万
- 负责人:
- 依托单位:
- 学科分类:F0605.模式识别与数据挖掘
- 结题年份:2016
- 批准年份:2012
- 项目状态:已结题
- 起止时间:2013-01-01 至2016-12-31
- 项目参与者:殷飞; 姜映映; 钟康; 杜一; 陈毅能; 周明可; 张恒; 李广;
- 关键词:
项目摘要
With the increasing use of pen-based devices, users can input various heterogeneous structures such as text, drawings and table forms freely on a large writing area, with the trajectories captured and saved as ink documents. Nevertheless, accompanied with the convenience of input, the free and heterogeneous structures of ink documents bring new challenges to automatic processing. For ink document analysis, the ink strokes should be first grouped into structural units such as text lines and drawings, which are then recognized respectively. This project systemically investigates the representation and fusion methods of context information in ink document analysis based on conditional random fields (CRFs). The main contents are as follows: (1) text and non-text separation method based on the spatial context; (2) method of text line grouping from ink documents with complex layout; (3) character string recognition method based on high-order semi-Markov conditional random fields; (4) fast inference methods for high-order conditional random fields. This project will be conducted on the basis of our previous research, and most of the technology difficulties have been comprehensively evaluated. The research results will promote the application of pen-based devices。
随着平板电脑和数码笔等笔输入设备的广泛应用,用户能够在更大的界面上输入文本、绘制图形和表格,同时笔迹能够被这些设备捕获并保存成联机文档。但伴随着输入的便利性,无约束的自由书写也给联机文档的自动处理带来了挑战。要对联机手写文档进行分析,首先需要将页面分割成文档结构对象,例如文本行和图形,然后再对不同的对象分别进行识别。本项目基于条件随机场(CRF)模型,系统地对复杂版面联机手写文档分析与识别中多种上下文信息的表示与融合方法展开研究,具体内容包括:(1)基于空间上下文的图文分离方法;(2)复杂版面联机手写文档的文本行提取方法;(3)基于高阶半马尔科夫条件随机场(semi-CRF)的手写字符串识别方法;(4)高阶条件随机场的快速推断算法。该项目在前期扎实的工作基础上开展,针对研究中的难点设计了明确可行的技术路线。本研究内容新颖并具有广泛的应用前景和学术价值,研究成果将促进手写设备的推广与应用。
结项摘要
无约束的自由书写给手写文档的自动处理带来了挑战,对于手写文档的分析,首先要将文档分割成文档结构对象,然后再对不同的文档结构对象分别进行识别。本项目主要基于条件随机场(CRF)模型,针对手写文档分析与识别中的多个方面进行了系统地研究,具体包括:(1)基于空间上下文的文档版面分析方法;(2)文本行提取方法;(3)手写文本行识别方法;(4)关键词定位方法;(5)多种上下文信息的融合方法;(6)文档分析中的人机交互方法。取得的重要成果包括:(1)提出基于高阶半马尔科夫条件随机场(semi-CRF)的手写文本行识别方法,在2011年国际文档分析与识别会议(ICDAR 2011)手写中文文本行识别竞赛集(联机手写文本行数据)上的结果超过竞赛的最好成绩;(2)提出基于semi-CRF的关键词定位方法;(3)高阶semi-CRF的快速推断算法(为了减小参数训练的复杂度,提出前向-后向网格削减算法;为了加快解码速度,考察了三种集束搜索算法);(4)提出基于最小风险准则的semi-CRF训练方法并与多种准则进行了比较,包括 conditional log-likelihood (CLL)、softmax-margin (SMM)、minimum classification error (MCE)、large-margin MCE (LM-MCE)和 max-margin (MM);(5)通过融合神经网络语言模型提升文本行识别性能。本项目研究成果推进了手写文档分析与识别领域的发展,并将促进手写设备的推广与应用。
项目成果
期刊论文数量(6)
专著数量(0)
科研奖励数量(0)
会议论文数量(7)
专利数量(0)
Handwritten Chinese/Japanese Text Recognition Using Semi-Markov Conditional Random Fields
使用半马尔可夫条件随机场的手写中文/日文文本识别
- DOI:--
- 发表时间:2013
- 期刊:IEEE Transactions on Pattern Analysis and Machine Intelligence
- 影响因子:23.6
- 作者:Wang; Da-Han;Tian; Feng;Liu; Cheng-Lin;Nakagawa; Masaki
- 通讯作者:Masaki
PhysiolComp Toolkit:一个生理计算交互工具箱的分析与设计
- DOI:--
- 发表时间:2015
- 期刊:计算机学报
- 影响因子:--
- 作者:胡伟平;田丰;戴国忠;王宏安
- 通讯作者:王宏安
Minimum-risk training for semi-Markov conditional random fields with application to handwritten Chinese/Japanese text recognition
半马尔可夫条件随机场的最小风险训练及其在手写中文/日文文本识别中的应用
- DOI:--
- 发表时间:2014
- 期刊:Pattern Recognition
- 影响因子:8
- 作者:Zhang; Yan-Ming;Tian; Feng;Wang; Hong-An;Liu; Cheng-Lin
- 通讯作者:Cheng-Lin
Keyword spotting in handwritten Chinese documents using semi-Markov conditional random fields
使用半马尔可夫条件随机场识别手写中文文档中的关键词
- DOI:--
- 发表时间:--
- 期刊:Engineering Applications of Artificial Intelligence
- 影响因子:8
- 作者:Heng Zhang;Xiang-Dong Zhou;Cheng-Lin Liu
- 通讯作者:Cheng-Lin Liu
基于图聚类的脱机手写文档图像文本行分割
- DOI:--
- 发表时间:2014
- 期刊:华中科技大学学报(自然科学版)
- 影响因子:--
- 作者:黄亮;殷飞;陈庆虎
- 通讯作者:陈庆虎
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
人脸活体检测综述
- DOI:10.16383/j.aas.c180829
- 发表时间:2021
- 期刊:自动化学报
- 影响因子:--
- 作者:蒋方玲;刘鹏程;周祥东
- 通讯作者:周祥东
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}