喵ID:EAvCH6免责声明

融合跨语言特征的柬埔寨语命名实体识别方法

基本信息

DOI:
--
发表时间:
2018
期刊:
云南大学学报(自然科学版)
影响因子:
--
通讯作者:
周丽华
中科院分区:
其他
文献类型:
--
作者: 徐广义;严 馨;余正涛;周丽华研究方向: -- MeSH主题词: --
关键词: --
来源链接:pubmed详情页地址

文献摘要

In order to solve the problems of the scarcity of Khmer lexical annotation corpora and the lack of obvious identification features of Khmer named entities, a Khmer named entity recognition method introducing English - Khmer cross - language features is proposed. Firstly, with the help of the mature model of English named entities and the word alignment relationship of English - Khmer bilingual parallel corpora, the entity categories of the source language are mapped to the target language; then, according to the Khmer word vectors, a nearest neighbor graph is constructed, and the label propagation algorithm is adopted to obtain the entity category distribution of Khmer words and complete the cross - language knowledge transfer; finally, the named entity category distribution of Khmer words is integrated into the conditional random field model as a constraint feature. The experimental results show that the conditional random field model integrated with cross - language features can effectively improve the effect of Khmer named entity recognition.
为了解决柬埔寨语词法标注语料稀缺、柬埔寨语命名实体缺乏明显标识特征的问题,提出一种引入英柬跨语言特征的柬埔寨语命名实体识别方法。首先,借助英语命名实体的成熟模型及英柬双语平行语料的词对齐关系,将源语言的实体类别映射到目标语言;然后根据柬埔寨语词向量构造最近邻图,采用标签传播算法,获得柬埔寨语单词的实体类别分布,完成跨语言知识转移;最后,将柬埔寨语单词的命名实体类别分布作为约束特征融入到条件随机场模型中。实验结果表明,融入跨语言特征的条件随机场模型能有效地提升柬埔寨语命名实体识别的效果。
参考文献(0)
被引文献(0)

数据更新时间:{{ references.updateTime }}

关联基金

柬埔寨语命名实体识别及汉柬双语可比语料库构建方法研究
批准号:
61462055
批准年份:
2014
资助金额:
44.0
项目类别:
地区科学基金项目
周丽华
通讯地址:
--
所属机构:
--
电子邮件地址:
--
免责声明免责声明
1、猫眼课题宝专注于为科研工作者提供省时、高效的文献资源检索和预览服务;
2、网站中的文献信息均来自公开、合规、透明的互联网文献查询网站,可以通过页面中的“来源链接”跳转数据网站。
3、在猫眼课题宝点击“求助全文”按钮,发布文献应助需求时求助者需要支付50喵币作为应助成功后的答谢给应助者,发送到用助者账户中。若文献求助失败支付的50喵币将退还至求助者账户中。所支付的喵币仅作为答谢,而不是作为文献的“购买”费用,平台也不从中收取任何费用,
4、特别提醒用户通过求助获得的文献原文仅用户个人学习使用,不得用于商业用途,否则一切风险由用户本人承担;
5、本平台尊重知识产权,如果权利所有者认为平台内容侵犯了其合法权益,可以通过本平台提供的版权投诉渠道提出投诉。一经核实,我们将立即采取措施删除/下架/断链等措施。
我已知晓