面向语言处理的藏语概念框架语义知识库构建研究
项目介绍
AI项目解读
基本信息
- 批准号:61866034
- 项目类别:地区科学基金项目
- 资助金额:38.0万
- 负责人:
- 依托单位:
- 学科分类:F0607.知识表示与处理
- 结题年份:2022
- 批准年份:2018
- 项目状态:已结题
- 起止时间:2019-01-01 至2022-12-31
- 项目参与者:多杰卓玛; 赵颖; 索南才让; 仁青卓么; 项见措; 仁青加; 满拉; 扎西;
- 关键词:
项目摘要
With the improvement and development of various artificial intelligence algorithms, as well as neural networks, deep learning has become a hot spot, those powerful neural architectures performing in big data processing has made Breakthroughs progress. However, there is still a search in progress for whether if could neglect a large number of specific projects for specific tasks or whether to incorporate more language structures into deep learning. As for a small language, under the circumstance of that data size is too small and the big data is empty, the support and assistance of the Knowledge base will be become a key resource, and the importance will never be replaced. This topic has referenced theories like Frame Semantics, Valence Grammar, Case Grammar, and also referenced Berkeley Frame Net, Word Net by Princeton University's ,and the Mind Net by Microsoft, Beside those ,we also referenced the 905 Semantic Knowledge Engineering, the How Net, the CCD by Peking University (Chinese Concept Dictionary) , Shanxi University English Frame Net and more research methods. The research is based on the Tibetan grammatical theories, to explore the laws and rules of Tibetan the framework of semantic analysis, to adjusting and enriches the methods of Tibetan framework semantic analysis, and to establish the Tibetan frame semantic repository. We set the Tibetan actual text as the study object, for the reason to own a better affection of description and analysis on Tibetan Semantic Framework System, we established Tibetan Words Cell Base, Tibetan Semantic Framework Base, and more Tibetan syntactic knowledge bases for each domain.
随着人工智能各种算法的兴起,神经网络、深度学习等成为热点,在大数据处理中用简单而强大的神经架构执行复杂任务,取得了突破性进展。但在是否可以忽略大量针对特定任务的特征工程,或是否将更多的语言结构融入深度学习方面仍在探索。就小语种而言,在没有大数据的情况下知识库的支撑和协助成为一个关键资源,其重要性不可替代。本课题借鉴框架语义学、依存语法、格语法等理论,参考FrameNet、WordNet、MindNet和我国的905语义知识工程、HowNet、北大CCD及山西大学汉语框架语义知识库等的研究方法,立足藏语语法理论,探索藏语框架语义分析的规律,调整充实藏语框架语义系统分析方法,建立藏语概念框架语义资源库。以藏语真实文本为研究对象,建立各个域的藏语词元库、语义框架库、句法知识库,从而对藏语概念框架语义系统进行描写与分析。该资源库的建成将为藏语句法分析、语义理解、文本理解、智能检索等发挥关键作用。
结项摘要
本课题借鉴框架语义学、依存语法、格语法等理论以及迁移学习前沿方法,立足藏语语法虚词理论,探索藏语依存语法、框架语义分析的规律,调整充实藏语框架语义系统分析方法和藏语依存知识表示方法,融合藏语语法知识,利用深度学习方法在数据预处理、无监督、半监督、双语迁移学习等方法构建依存树库、框架知识库等,取得了一定的成效。.在理论层面,项目在句法语义标记体系建构方面,不仅考虑了不同语种的依存和框架语义模式,同时创新性利用了藏语固有的语法特点,将虚词融入句法、语义两个层面并对其赋予架构作用和一致性鲁棒作用,成效显著。.在方法层面,项目在初期依存数据集建构方面,不仅利用人工进行探索性标注,同时利用虚词知识库和虚词功能作用自动建构前期粗标注数据集,并进行人工审校后利用神经网络方法进行语言建模,从数据收集、预处理、半监督数据到有监督数据建构,研究呈体系化,具有一定的创新性。.在资源方面,项目最终建成多个知识库和5万句依存树库、框架语义知识库,该树库是目前国内最大的藏语依存树库。
项目成果
期刊论文数量(11)
专著数量(2)
科研奖励数量(3)
会议论文数量(0)
专利数量(0)
古藏文“赤”与“日”的语音演变规律及其相关问题研究
- DOI:--
- 发表时间:2019
- 期刊:西藏大学学报
- 影响因子:--
- 作者:南拉才让;完么措
- 通讯作者:完么措
语言特征视域下梵汉藏《因明入正理论》对勘研究
- DOI:--
- 发表时间:2020
- 期刊:中国藏学
- 影响因子:--
- 作者:冷本扎西;多拉
- 通讯作者:多拉
从六百余篇藏文学术论文看藏学研究40年——以词汇计量为视角
- DOI:--
- 发表时间:2018
- 期刊:中国藏学
- 影响因子:--
- 作者:扎西当知;多拉;冷本扎西
- 通讯作者:冷本扎西
藏语安多话元音的音位分布及声学表现
- DOI:--
- 发表时间:2021
- 期刊:西藏大学学报
- 影响因子:--
- 作者:完么措;南拉才让
- 通讯作者:南拉才让
语言特征计量视角下的翻译风格对照研究
- DOI:--
- 发表时间:2020
- 期刊:高原科学研究
- 影响因子:--
- 作者:冷本扎西
- 通讯作者:冷本扎西
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
配价语法视角下的藏语句子结构描写研究
- DOI:--
- 发表时间:2016
- 期刊:中央民族大学学报(哲学社会科学版)
- 影响因子:--
- 作者:扎西加;多拉
- 通讯作者:多拉
面向信息处理的藏文字词统计分析设计
- DOI:--
- 发表时间:2015
- 期刊:电子技术与软件工程
- 影响因子:--
- 作者:扎西加;多拉
- 通讯作者:多拉
基于UFG的藏语句法形式化描述
- DOI:--
- 发表时间:2014
- 期刊:中文信息学报
- 影响因子:--
- 作者:扎西加;多拉
- 通讯作者:多拉
史诗《霍岭》语料库句子及诗行计量解析
- DOI:--
- 发表时间:2015
- 期刊:中央民族大学学报(哲学社会科学版)
- 影响因子:--
- 作者:多拉;扎西加
- 通讯作者:扎西加
词汇计量与史诗诸要素的解析_以语料库方法解构格萨尔史诗之_霍岭
- DOI:--
- 发表时间:2014
- 期刊:西藏大学学报(社会科学版)
- 影响因子:--
- 作者:多拉;扎西加
- 通讯作者:扎西加
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
多拉的其他基金
基于大规模语料库的藏语预训练语言模型研究
- 批准号:
- 批准年份:2022
- 资助金额:33 万元
- 项目类别:地区科学基金项目
基于Ontology的藏文语料库检索关键技术研究
- 批准号:61262053
- 批准年份:2012
- 资助金额:45.0 万元
- 项目类别:地区科学基金项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}