類似単語対の識別に重要な文字対の調査
对识别相似单词对很重要的字符对的调查
基本信息
- 批准号:08780326
- 负责人:
- 金额:$ 0.51万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Encouragement of Young Scientists (A)
- 财政年份:1996
- 资助国家:日本
- 起止时间:1996 至 无数据
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
文字認識技術は今後手書きされた文書の認識へと発展が期待されているが,この場合現在の技術では文字の認識誤りが高頻度で発生することは不可避であり,この誤りを何らかの方法により訂正することが必要である.特に言語の持つ冗長性を生かした単語辞書による誤り訂正は強力な誤り訂正手法であるが,それでも訂正できない誤りが存在する.例えば文字単位の認識で単語「文字」の「字」が「学」と誤り,辞書中に「文字」と「文学」の両方とも存在すると,この誤りは訂正することが不可能となる.このような単語対はミニマル・ペア(MP)と呼ばれ,それらを区別する文字対(先の例では「字」と「学」)の識別は,最終的な認識性能を左右するため重要である.本研究では,MPを識別するためにはどのような文字を重点的に認識すれば良いかを解明するため,手書き文字データベースETL9における文字間の近さを類似度によって測り,新明解国語辞典の重要語中のMPについての調査を行なった.その結果,MPおよびMPを識別する文字対は全体のごく僅かであるが,識別に関わる文字は文字全体の大きな部分を占め,ほとんどの文字の認識がMPの識別に必要であることが明らかになった.また,MPの識別における文字対の重要性の基準として,従来の確率に代えて類似度の期待値を考え,重要性の高い文字対の調査を行い,活用語に由来する「す-る」,「り-る」,数詞に由来する「月-日」,複合動詞に由来する「見-切」,「取-引」などの識別が重要であること,そして文字としては「頼」「勝」「通」「縮」「広」「締」「埋」「取」「立」「飛」「見」「浮」「切」「る」などの認識が重要であることが明らかになった.
人物识别技术有望将来发展为对手写文档的识别,但是在这种情况下,不可避免的是在当前技术中经常发生字母识别错误,因此有必要以某种方式纠正此错误。特别是,使用使用语言冗余的单词词典进行错误校正是一种强大的错误校正技术,但是仍然有错误无法纠正。例如,当单词“字符”的“字符”是字典中“学校”的错误,而词典中都存在“字符”和“文学”时,此错误是无法纠正的。这样的单词对称为最小对(MPS),并且区分它们的角色对(在上一个示例中,“角色”和“学校”)很重要,因为它会影响最终的识别性能。在这项研究中,为了澄清应该识别哪种字符以识别MP,我们将解释以下内容:通过相似性来衡量ETL9字符数据库中字符之间的亲密关系,并研究了Shinmeikai日本词典中重要单词中的MPS。结果,据透露,尽管很少有字符识别MPS和MPS,但识别MPS的字符涉及整个角色的很大一部分,并且对大多数字符的识别对于MP身份都是必需的。 Furthermore, as a criterion for the importance of character pairs in MP identification, Instead of the conventional probability, we investigated highly important character pairs, and found that it is important to identify such characters as "suru", "riru", "riru", which originates from conjugated words, "month-day", which originates from numerical words, "s-kiri", and "tracking" which originates from compound verbs, and “跟踪”起源于复杂的动词,以及对诸如“ rai”,“ katsu”,“ tsu”,“ tsu”,“ tsu”,“ sho”,“ sho”,“ hoku”,“ hoku”,“ chi”,“ chi”,“ buri”,“ take”,“ take”,“ take”,“ take”,“ tachi”,“ tachi”,“ to”,“ to”,“”,“ tachi”,“ tachi”,“ hi”,“ sue”的kuike的“” kie中,“”的“”,“”的“
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
大槻 恭士其他文献
新規全主要リン脂質クラス酵素蛍光定量法によるバイオマーカー探索
使用新型酶荧光测定法搜索所有主要磷脂类别的生物标志物
- DOI:
- 发表时间:
2019 - 期刊:
- 影响因子:0
- 作者:
小川充洋;孫延君;大槻 恭士;森田真也 - 通讯作者:
森田真也
人狼知能大会 ─国際大会と自然言語大会を終えて─
狼人智力竞赛——继国际竞赛和自然语言竞赛之后——
- DOI:
- 发表时间:
2020 - 期刊:
- 影响因子:0
- 作者:
鳥海 不二夫;狩野 芳伸;大槻 恭士;大澤 博隆;アランニャ クラウス;稲葉 通将;片上 大輔 - 通讯作者:
片上 大輔
しゃべる人狼知能~人工知能による自然言語人狼対戦
会说话的狼人智能 - 使用人工智能的自然语言狼人战斗
- DOI:
- 发表时间:
2017 - 期刊:
- 影响因子:0
- 作者:
狩野 芳伸;稲葉 道将;篠田 孝祐;大澤 博隆;片上 大輔;大槻 恭士 - 通讯作者:
大槻 恭士
Molecular tools in microbial diversity: Functional assessment tool for genomes and metagenomes, MAPLE system
微生物多样性的分子工具:基因组和宏基因组的功能评估工具,MAPLE系统
- DOI:
- 发表时间:
2019 - 期刊:
- 影响因子:0
- 作者:
鳥海 不二夫;狩野 芳伸;大槻 恭士;大澤 博隆;アランニャ クラウス;稲葉 通将;片上 大輔;Hideto Takami - 通讯作者:
Hideto Takami
温感ディスプレイを用いたヒトの身体所有感操作に関する研究
利用热显示操控人体所有权的研究
- DOI:
- 发表时间:
2017 - 期刊:
- 影响因子:0
- 作者:
狩野 芳伸;大槻 恭士;園田 亜斗夢;中田 洋平;箕輪 峻;鳥海 不二夫;原正之,高橋弘享,山口大介,石野裕二,高崎正也,水野毅 - 通讯作者:
原正之,高橋弘享,山口大介,石野裕二,高崎正也,水野毅
大槻 恭士的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('大槻 恭士', 18)}}的其他基金
Development of advanced infrastructure for incomplete information communication game AI research
不完全信息通信游戏AI研究的先进基础设施开发
- 批准号:
21K12190 - 财政年份:2021
- 资助金额:
$ 0.51万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
文間の類似性に基づく言語モデルの評価法
基于句子相似度的语言模型评价方法
- 批准号:
11780246 - 财政年份:1999
- 资助金额:
$ 0.51万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
相似海外基金
手書き文字認識を組み込んだ記述式自動採点システムの開発と改良
结合手写字符识别的描述性自动评分系统的开发和改进
- 批准号:
23K28201 - 财政年份:2024
- 资助金额:
$ 0.51万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
『説文解字』における書体の認識
《Sekmon Kaiji》中的字体识别
- 批准号:
24K03844 - 财政年份:2024
- 资助金额:
$ 0.51万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
中世後期の百科全書にみるラテン・キリスト教世界の異文化認識と外交政策
中世纪晚期百科全书中拉丁基督教世界的跨文化意识和外交政策
- 批准号:
24K04327 - 财政年份:2024
- 资助金额:
$ 0.51万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Development and improvement of a descriptive automatic scoring system incorporating handwritten character recognition
结合手写字符识别的描述性自动评分系统的开发和改进
- 批准号:
23H03511 - 财政年份:2023
- 资助金额:
$ 0.51万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
小学校外国語科における音韻認識指導の効果検証と指導プログラムの確立
小学外语课堂语音意识教学效果验证及教学方案制定
- 批准号:
23K00696 - 财政年份:2023
- 资助金额:
$ 0.51万 - 项目类别:
Grant-in-Aid for Scientific Research (C)