东盟多语种事件知识图谱构建与推理方法研究
项目介绍
AI项目解读
基本信息
- 批准号:61866008
- 项目类别:地区科学基金项目
- 资助金额:37.0万
- 负责人:
- 依托单位:
- 学科分类:F0607.知识表示与处理
- 结题年份:2022
- 批准年份:2018
- 项目状态:已结题
- 起止时间:2019-01-01 至2022-12-31
- 项目参与者:李笠; 郑彦斌; 张朦禹; 云宏旭; 郭智; 田磊; 夏志超;
- 关键词:
项目摘要
This proposal faces the urgent need of the country's "The Belt and Road" strategy for its deep cognition of ASEAN. It comprehensively uses technologies such as artificial intelligence, big data and language engineering to carry out massively parallel corpora acquisition and annotation of low-resource languages, event ontology model, deep learning Event recognition and relation detection, cross-lingual semantic links based on bilingual collaborative training, distributed knowledge representation and reasoning, and will reach the following innovations:.(1) The project will propose the automatic construction and reasoning method for building ASEAN multi-lingual large-scale event knowledge graph and will provide knowledge support for real-time get and analysis of dynamic information of ASEAN countries..(2) Aiming at the lack of ASEAN semantic knowledge in the existing large-scale knowledge base in the world, a bilingual collaborative training method is proposed to realize the alignment of multi-lingual event elements and effectively support knowledge extraction, fusion and analysis of minority language event..(3) The project will propose a model of event recognition and relation detection based deep learning. By constructing a learning model with multiple hidden layers and massive training data, learning more latent features will eventually improve the accuracy of event recognition and relation detection..(4) The project will utilize distributed representation learning method to infer the event knowledge graph to predict the types, attributes and relations of missing events.
面向国家“一带一路”战略对东盟深度认知的迫切需要,综合运用人工智能、大数据和语言工程等技术,开展低资源语言大规模平行语料库获取与标注、事件本体模型、基于深度学习的事件识别和关系检测、基于双语协同训练的跨语言语义链接、分布式知识表示及推理等问题研究,达成如下创新:.(1)研究提出东盟多语种大规模事件知识图谱自动构建和推理应用方法,为实现对东盟各国家动态信息的实时掌控和分析提供知识支撑。.(2)针对现有世界上大型知识库东盟语义知识缺乏现状,提出基于双语协同训练方法实现多语言事件要素的对齐,有效支撑小语种事件知识抽取、融合和分析。.(3)提出利用深度学习方法构建事件识别和关系检测的模型。通过构建具有很多隐层的学习模型和海量的训练数据,学习更加抽象的特征,最终提升事件识别和关系检测的准确性。.(4)运用分布式表示学习方法对事件知识图谱进行推理,实现对缺失事件的类型、属性、关系等进行预测。
结项摘要
随着“一带一路”战略稳步推进,中国将不断加深与东盟各国在各方面的交往。通过本课题研究,探索提出低资源条件下事件知识图谱构建与应用的方法,可为我国开展东盟舆情分析、情报搜集以及对外合作策略制定等提供技术与方法支持,对于提升对东盟各国政治、经济、文化、军事等国际热点事件的实时监测和预判能力,具有重要的理论意义和应用前景。.课题综合运用人工智能、大数据和语言工程等技术,开展了低资源语言大规模平行语料库获取与标注、事件本体模型、事件识别和关系检测、跨语言语义链接、分布式知识表示及推理等问题研究,突破东盟国家低资源事件要素抽取与大规模知识图谱构建、跨语言迁移学习、多跳知识推理技术等关键技术,开发相关原型验证系统并进行转化应用,在东盟多语种大规模事件知识图谱自动构建、基于双语/多语协同学习的知识对齐、高性能多跳知识推理与应用等方面取得重要创新,研究成果丰富,达到预期目标。主要包括:.(1)围绕“人、地、事、物、组织”五要素,提出面向东盟的目标监测本体模型,为东盟国家多元语义数据融合提供有效质量保证;.(2)提出基于跨度选择的低资源事件要素抽取、基于文本生成的低资源事件要素抽取等方法,提升了事件要素抽取精度;.(3)提出基于知识蒸馏的跨语言句向量训练模型,实现基于多特征的句子、段落和篇章等多粒度对齐方法,通过该方法获得近3000万条平行句对。.(4)通过对世界知识库进行裁剪和非结构化文本知识抽取相结合的方式,构建东盟大规模知识图谱。目前构建的知识图谱实体数超过2000万条,关系数超过3亿条;.(5)提出高性能多跳推理计算框架,实现高效推理算法并综合运用系统层性能优化方法,有效提升大规模知识图谱路径搜索效率,并通过知识推理补全缺失信息,以丰富、扩展知识图谱,为实现目标画像、关系挖掘、事件推理等任务提供技术支撑。
项目成果
期刊论文数量(9)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(4)
Thai Word Segmentation Based on Sequence-to-Sequence Model
基于序列到序列模型的泰语分词
- DOI:10.1088/1742-6596/1757/1/012065
- 发表时间:2021-01
- 期刊:Journal of Physics: Conference Series
- 影响因子:--
- 作者:Huiwen Wu;Yongzhong Huang;Cancheng Li;Haoyu Zhuang;Xinyu Xu
- 通讯作者:Xinyu Xu
A BERT based Chinese Named Entity Recognition method on ASEAN News
东盟新闻上基于BERT的中文命名实体识别方法
- DOI:10.1088/1742-6596/1848/1/012101
- 发表时间:2021-01-01
- 期刊:Journal of Physics: Conference Series
- 影响因子:--
- 作者:Haoyu Zhuang;Fu Wang;Yongzhong Huang
- 通讯作者:Yongzhong Huang
HDFEF: A hierarchical and dynamic feature extraction framework for intrusion detection systems
HDFEF:用于入侵检测系统的分层动态特征提取框架
- DOI:10.1016/j.cose.2022.102842
- 发表时间:2022-07
- 期刊:Computers & Security
- 影响因子:5.6
- 作者:Yanan Li;Tao Qin;Yongzhong Huang;Jinghong Lan;ZanHao Liang;Tongtong Geng
- 通讯作者:Tongtong Geng
A Statistical Language Model for Pre-trained Sequence Labeling: A Case Study on Vietnamese
用于预训练序列标记的统计语言模型:越南语案例研究
- DOI:10.1145/3483524
- 发表时间:2021
- 期刊:ACM Transactions on Asian and Low-Resource Language Information Processing
- 影响因子:2
- 作者:Xianwen Liao;Yongzhong Huang;PENG YANG;LEI CHEN
- 通讯作者:LEI CHEN
Efficient Estimate of Low-Frequency Words’ Embeddings Based on the Dictionary
基于词典的低频词嵌入的高效估计
- DOI:10.3390/app112211018
- 发表时间:2021
- 期刊:Applied Sciences-Basel
- 影响因子:2.7
- 作者:Xianwen Liao;Yongzhong Huang;Changfu Wei;Chenhao Zhang;Yongqing Deng;Ke Yi
- 通讯作者:Ke Yi
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
由具奇异系数的强椭圆微分算子生
- DOI:--
- 发表时间:--
- 期刊:系统科学与数学,2005年25卷1期,29-38
- 影响因子:--
- 作者:黄永忠;李淼
- 通讯作者:李淼
基于流固共轭传热的两相流动数值模拟及燃料子通道CHF预测研究
- DOI:--
- 发表时间:2020
- 期刊:原子能科学技术
- 影响因子:--
- 作者:冯琳娜;李权;黄永忠;刘振海;齐飞鹏;M. Avramova
- 通讯作者:M. Avramova
面向冰冻圈服务功能核算的西藏公路经济增长贡献及空间效应
- DOI:--
- 发表时间:2019
- 期刊:冰川冻土
- 影响因子:--
- 作者:黄永忠;钟方雷;杨肖;徐晓明;吴青柏
- 通讯作者:吴青柏
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}