帰納的学習を用いたかな漢字変換手法に関する研究
基于归纳学习的假名汉字转换方法研究
基本信息
- 批准号:06858039
- 负责人:
- 金额:$ 0.58万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Encouragement of Young Scientists (A)
- 财政年份:1994
- 资助国家:日本
- 起止时间:1994 至 无数据
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
我々は,人間の言語及び知識獲得能力の解明とその実現を目的として研究を行なっている.このような研究はこれまでいくつか存在するが,工学的に有効なシステムを完成するまでに至っていないのが現状である.このような問題に対して,我々は,本研究でこの言語及び知識獲得能力を工学的に実現する一つの試みとして,入力べた書き文とその漢字かな混じり文より帰納的に語の読みと表記を獲得し,その獲得状況及び変換精度に基づく確実性の高い語より順に変換するという帰納的学習によるべた書き文のかな漢字変換手法を提案し,その有効性を確認するための実験を行った.本手法は,変換処理,学習処理,フィードバック学習処理の三つの部分より構成される.変換処理では,べた書き文が入力されるとそれまでの学習により獲得された語によって語の当てはめが行なわれる.学習処理では,入力べた書き文と校正済みの変換結果より共通部分を手掛りに語候補を得る.次に,この語候補同士の共通部分と差異部分を抽出することにより語を獲得する.最後にフィードバック学習処理では,変換結果と校正された変換結果を比較することにより正しく変換した語と誤って変換した語を決定し,正しく変換した語の尤度を上げ,誤って変換した語の尤度を下げる.本手法は辞書が空の状態からでも学習機能により語を獲得することができるので,辞書を個人毎に自動的に作成することが可能,個人用辞書とすることにより辞書容量を少なくできる,未登録語の自動登録が可能,初期辞書作成の労力を回避できるという利点がある.本年度は,本手法に基づく実験システムを作成し,異なる4分野の論文40編を用いて本手法の学習機能による適応性能を確認するための実験を行なった.実験の結果,4分野すべてにおいて90%以上の精度が得られ,べた書き文のかな漢字変換における本手法の有効性が確認された.
我们正在进行研究的目的是阐明和实现人类的语言和知识获取能力。此类研究已有多项,但我们尚未完成一个工程有效的系统。针对这个问题,我们在这项研究中。尝试通过使用归纳方法来设计这种语言和知识获取能力,该方法比较输入的书面文本及其汉字/混合句子,获取单词的阅读和拼写、获取状态和转换准确性。我们提出了一种基于归纳学习的实体文本假名汉字转换方法,其中单词根据词序按确定的顺序进行转换,并进行了实验以验证其有效性。反馈学习过程三。它由两部分组成。在转换过程中,当输入固体句子时,使用以前学习获得的单词进行单词匹配。在学习过程中,使用输入的固体文本和校对转换结果进行更常见的工作。地区接下来,通过提取这些候选单词之间的共同部分和不同部分来获取单词。最后,在反馈学习过程中,通过比较转换结果和校正后的转换结果,得出正确转换的单词和错误转换的单词即使字典是空的,该方法也使用学习功能来获取单词,因此可以为每个人自动创建字典。它的优点是通过使其成为个人词典来减少词典容量,自动注册未注册的单词,并避免创建初始词典的劳动。今年,我们基于该方法创建了一个实验系统,在4个不同领域进行理论研究。我们用40个句子进行了实验,以确认该方法的学习功能的自适应性能。实验结果,在所有四个领域都获得了90%以上的准确率,并且该方法在假名汉字转换方面是有效的从实体文本中证实了该方法的有效性。
项目成果
期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Kenji ARAKI,Yoshio Momeuchi,Koji TOCHINAI: "Evaluation for adaptability of Kana-Kanji translation of non-segmented Japanese Kana sentenies using inductive learning" Proceedings of the Pacibic Association for Computational Linguintis Second Conference(PACL
Kenji ARAKI、Yoshio Momeuchi、Koji TOCHINAI:“使用归纳学习对非分段日语假名句子的假名-汉字翻译的适应性进行评估”太平洋计算语言协会第二届会议论文集(PACL)
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
荒木 健治其他文献
講義代行ロボットにおける双方向LSTMを用いたジェスチャ自動生成システムの性能評価
代课机器人中使用双向 LSTM 的自动手势生成系统的性能评估
- DOI:
- 发表时间:
2018 - 期刊:
- 影响因子:0
- 作者:
日和 航大;荒木 健治;長谷川 大;芳尾 哲 - 通讯作者:
芳尾 哲
心を交わす人工知能: 言語・感情・倫理・ユーモア・常識
交流心灵的人工智能:语言、情感、道德、幽默、常识
- DOI:
- 发表时间:
2016 - 期刊:
- 影响因子:0
- 作者:
荒木 健治; ジェプカ・ラファウ; プタシンスキ・ミハウ; ディバワ・パヴェウ - 通讯作者:
ディバワ・パヴェウ
心を交わす人工知能: 言語・感情・倫理・ユーモア・常識
交流心灵的人工智能:语言、情感、道德、幽默、常识
- DOI:
- 发表时间:
2016 - 期刊:
- 影响因子:0
- 作者:
荒木 健治; ジェプカ・ラファウ; プタシンスキ・ミハウ; ディバワ・パヴェウ - 通讯作者:
ディバワ・パヴェウ
荒木 健治的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('荒木 健治', 18)}}的其他基金
Development of standard database for evaluating the fun of humor considering contextual information
开发标准数据库,用于考虑上下文信息评估幽默的乐趣
- 批准号:
21K12007 - 财政年份:2021
- 资助金额:
$ 0.58万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
ユーモアを理解し生成するシステムの実現
实现一个理解并产生幽默的系统
- 批准号:
06F06775 - 财政年份:2006
- 资助金额:
$ 0.58万 - 项目类别:
Grant-in-Aid for JSPS Fellows
遺伝的アルゴリズムを用いた帰納的学習による機械翻訳手法における交叉位置決手法
使用遗传算法的归纳学习的机器翻译方法中的交叉定位方法
- 批准号:
09878070 - 财政年份:1997
- 资助金额:
$ 0.58万 - 项目类别:
Grant-in-Aid for Exploratory Research
学習に基づいた形態素解析手法に関する研究
基于学习的形态分析方法研究
- 批准号:
02855098 - 财政年份:1990
- 资助金额:
$ 0.58万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
相似海外基金
大規模なコーパスを用いた機械学習による名詞句の項構造解析
使用大规模语料库使用机器学习对名词短语进行术语结构分析
- 批准号:
08J09545 - 财政年份:2008
- 资助金额:
$ 0.58万 - 项目类别:
Grant-in-Aid for JSPS Fellows
漢字かな変換機能を備えた学習支援・コミュニティシステムの開発と評価に関する研究
具有汉字假名转换功能的学习支持/社区系统的开发与评估研究
- 批准号:
14780125 - 财政年份:2002
- 资助金额:
$ 0.58万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
キーワード抽出方式によるべた書き文のかな漢字変換に関する研究
基于关键词提取方法的实体文本假名汉字转换研究
- 批准号:
60580015 - 财政年份:1985
- 资助金额:
$ 0.58万 - 项目类别:
Grant-in-Aid for General Scientific Research (C)