面向小语种的高性能文本情感分析关键技术研究
项目介绍
AI项目解读
基本信息
- 批准号:61762091
- 项目类别:地区科学基金项目
- 资助金额:43.0万
- 负责人:
- 依托单位:
- 学科分类:F0204.计算机系统结构与硬件技术
- 结题年份:2021
- 批准年份:2017
- 项目状态:已结题
- 起止时间:2018-01-01 至2021-12-31
- 项目参与者:王津; 李继东; 钱彦军; 彭博; 胡雅伦; 张有;
- 关键词:
项目摘要
Existing research for sentiment analysis has achieved significant progress for Chinese and Latin Languages, such as English and Spanish. However, current relevant works still lack the exploration for minority languages. There are several challenges for applying such techniques for minority languages, such as differences of semantic and culture, lack of accurate affective representation, poor coverage of affective lexicons and corpora resource, and low performance of existing deep learning platform. By using a cross-lingual fashion, the project research on key technologies of high performance sentiment analysis for minority languages. From both aspects of algorithm and platform, this project seek to transfer existing methods and resources for Chinese and English to those for other minority languages. Main contents include:. (1) Based on a locally weighted linear regression, this project will propose a cross-lingual method to predict VA ratings of affective words in minority languages. This methods can be used to create affective lexicons to tackle the poor coverage problems by manual marking.. (2) On text-level, a local region-based deep neural network model will be proposed to predict VA values for given texts, which can solve the low accuracy problems in existing analysis methods.. (3) Combined with an asynchronous stochastic gradient descent algorithm, this project will propose a high performance distributed learning mechanism for massive text, to address the low performance problems in multi-core CPU or GPU platform.. Overall, this project hopes to provide a consultative framework of sentiment analysis for minority languages, and build dimensional affective lexicons for Thai and Burmese to implement prototype system for those two languages.
目前文本情感分析主要针对中英文和拉丁语系的语言,缺乏面向小语种的相关研究。小语种的文本情感分析研究面临语义和文化差异、缺乏精确的情感信息表示和语料资源、现有分析平台性能差等问题。项目基于跨语言方法,利用已有的中英文资源和技术,研究小语种的高性能文本情感分析关键技术,从算法和处理平台方面展开研究,具体内容包括:(1)基于局部加权线性回归模型的跨语言方式,实现中英文词汇到小语种词汇的情感值预测,并构建小语种情感词典,解决以往通过人工标记带来覆盖性差的问题;(2)在文本层次,利用基于局部区域的深度神经网络模型,实现小语种文本的情感值预测,解决现有方法预测准确率低的问题;(3)结合分布式异步梯度下降算法,实现海量文本的高性能分布式处理机制,解决现有多核CPU和GPU平台扩展性差的问题。项目希望形成可借鉴的小语种文本情感分析方法,构建面向泰语和缅甸语的连续维度型情感词典,实现文本情感分析的原型系统。
结项摘要
项目基于Valence-Arousal情感空间,利用词嵌入和迁移学习等方法,同时从算法和平台两方面入手,研究高性能维度型文本情感分析技术。项目研究包括面向小语种词汇的跨语言情感值预测、面向小语种文本的连续维度型情感分析和基于异步梯度更新的分布式深度学习架构三个方面的内容。在完成既定目标的基础上,项目将研究内容扩展到了多语种、多粒度情感分析技术,主要包括:(1)利用现有的多语种情感词典资源,在预训练词向量模型、上下文相关的语言模型中嵌入情感信息,获得同时具有语义与情感相关的词向量模型,并基于此研究了词汇级、短语级、句子级、文本级和属性级等多粒度层次的情感分析技术。(2)基于跨语言迁移学习方法,利用已有的中英文资源和技术,探索在预训练语言模型中嵌入个性化信息,研究多语种个性化文本情感分析关键技术。(3)结合分布式异步梯度下降和异构计算资源分配算法,实现了一种海量文本的高性能分布式处理机制,为现有分布式异构深度学习平台扩展提供了一种思路。项目实现了可借鉴的多语种、跨语种文本情感分析方法,构建了多语种连续维度型情感词典,实现了多粒度层次文本情感分析的原型系统。
项目成果
期刊论文数量(18)
专著数量(1)
科研奖励数量(0)
会议论文数量(22)
专利数量(0)
Swarm optimization algorithms applied to multi-resource fair allocation in heterogeneous cloud computing systems
群体优化算法应用于异构云计算系统多资源公平分配
- DOI:--
- 发表时间:2017
- 期刊:Computing
- 影响因子:3.7
- 作者:Xi Liu;Xiaolu Zhang;Weidong Li;Xuejie Zhang
- 通讯作者:Xuejie Zhang
Strategy-Proof Mechanism for Provisioning and Allocation Virtual Machines in Heterogeneous Clouds
异构云中虚拟机的配置和分配的策略验证机制
- DOI:--
- 发表时间:2018
- 期刊:IEEE Transactions on Parallel and Distributed Systems
- 影响因子:5.3
- 作者:Xi Liu;Weidong Li;Xuejie Zhang
- 通讯作者:Xuejie Zhang
Adversarial learning of sentiment word representations for sentiment analysis
用于情感分析的情感词表示的对抗性学习
- DOI:10.1016/j.ins.2020.06.044
- 发表时间:2020
- 期刊:Information Sciences
- 影响因子:8.1
- 作者:Peng Bo;Wang Jin;Zhang Xuejie
- 通讯作者:Zhang Xuejie
一种基于共享公平和时变资源需求的公平分配策略
- DOI:--
- 发表时间:2019
- 期刊:计算机研究与发展
- 影响因子:--
- 作者:李杰;张静;李伟东;张学杰
- 通讯作者:张学杰
Hierarchical BERT with an Adaptive Fine-Tuning Strategy for Document Classification
具有自适应微调策略的分层 BERT 文档分类
- DOI:--
- 发表时间:2021
- 期刊:Knowledge-Based Systems
- 影响因子:8.8
- 作者:Jun Kong;Jin Wang;Xuejie Zhang
- 通讯作者:Xuejie Zhang
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
大规模社交网络中高效的关键用户选取方法
- DOI:10.11772/j.issn.1001-9081.2017.11.3101
- 发表时间:2017
- 期刊:计算机应用
- 影响因子:--
- 作者:郑永广;岳昆;尹子都;张学杰
- 通讯作者:张学杰
沟稃草属及其近缘属植物颖片微形态特征研究
- DOI:--
- 发表时间:2016
- 期刊:西北植物学报
- 影响因子:--
- 作者:王燕红;张学杰;樊守金
- 通讯作者:樊守金
基于基准测试的高性能计算云研究
- DOI:--
- 发表时间:2013
- 期刊:计算机科学
- 影响因子:--
- 作者:李春艳;张学杰
- 通讯作者:张学杰
基于遗传算法的多维模糊分类器构造的研究
- DOI:--
- 发表时间:--
- 期刊:软件学报
- 影响因子:--
- 作者:李继东;张学杰
- 通讯作者:张学杰
山东归化植物新纪录属—弯穗草属(禾本科)
- DOI:--
- 发表时间:2012
- 期刊:安徽农业科学
- 影响因子:--
- 作者:张学杰;姜乐源;李法曾;樊守金
- 通讯作者:樊守金
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
张学杰的其他基金
基于知识蒸馏的联合多模态基础模型关键技术研究
- 批准号:62266051
- 批准年份:2022
- 资助金额:34 万元
- 项目类别:地区科学基金项目
面向云计算环境的应用迁移策略及资源优化配置关键技术研究
- 批准号:61170222
- 批准年份:2011
- 资助金额:56.0 万元
- 项目类别:面上项目
高性能可重构硬件加密芯片设计技术研究
- 批准号:60573104
- 批准年份:2005
- 资助金额:24.0 万元
- 项目类别:面上项目
动态可重构系统高级合成的集成化设计技术研究
- 批准号:60266003
- 批准年份:2002
- 资助金额:7.0 万元
- 项目类别:地区科学基金项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}