Nanoblog processing
纳米博客处理
基本信息
- 批准号:RGPIN-2021-02599
- 负责人:
- 金额:$ 2.55万
- 依托单位:
- 依托单位国家:加拿大
- 项目类别:Discovery Grants Program - Individual
- 财政年份:2022
- 资助国家:加拿大
- 起止时间:2022-01-01 至 2023-12-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Natural Language Processing (NLP) has traditionally been done with long documents, and tasks with such documents achieve very high performances and many are even considered "solved". The popularity of SMS messaging and the creation of social networks led to the popularization of short text messages or "microblogs", and many previously-solved NLP tasks became open challenges again. New difficulties stemmed from the short length of the messages, the limited contextual information available, the use of unconventional language, and the socially-linked and dynamic nature of the conversations. Nevertheless, after a decade of research work, many of these challenges have been overcome and microblog-processing systems routinely achieve performances comparable to those in traditional NLP. And thanks to these advances, microblogs have become a valuable resource in other research areas as well. The next frontier in NLP will come from increasingly-popular in-game chat messages found in online games and gaming communities. These messages amplify the problems of microblogs: they are even shorter, consisting of sometimes only a single word or acronym and completely devoid of in-message context, they use language tailored to the specific game they are linked to and that is gibberish outside of that game, and only make sense as live conversations during a game. Due to their extremely short nature, we call these conversations "nanoblogs". The long-term objective of this research proposal is to pioneer the area of nanoblog NLP and ensure Canada's leadership in this emerging research area. To achieve this, we have defined three short-term research objectives to accomplish over the next five years. Objective 1: We will design, construct, and label a real-world nanoblog corpus. Objective 2: We will create nanoblog context modelling, normalization, and language detection algorithms. Objective 3: We will create nanoblog cyber-bullying filter algorithms.
自然语言处理(NLP)传统上是通过长文档来完成的,使用此类文档的任务可以获得非常高的性能,许多任务甚至被认为“已解决”。短信的普及和社交网络的创建导致了短信或“微博”的普及,许多以前解决的 NLP 任务再次成为公开的挑战。新的困难源于消息的长度短、可用的上下文信息有限、非常规语言的使用以及对话的社会联系和动态性质。然而,经过十年的研究工作,许多挑战已经被克服,微博处理系统通常可以达到与传统 NLP 相当的性能。由于这些进步,微博也已成为其他研究领域的宝贵资源。 NLP 的下一个前沿将来自在线游戏和游戏社区中日益流行的游戏内聊天消息。这些消息放大了微博的问题:它们甚至更短,有时仅由单个单词或缩写词组成,并且完全没有消息内上下文,它们使用针对所链接的特定游戏量身定制的语言,除此之外就是胡言乱语。游戏,并且只有在游戏期间的实时对话才有意义。由于其极其简短的性质,我们将这些对话称为“纳米博客”。 该研究计划的长期目标是开拓纳米博客 NLP 领域,并确保加拿大在这一新兴研究领域的领导地位。为了实现这一目标,我们确定了未来五年要完成的三个短期研究目标。目标 1:我们将设计、构建和标记一个真实世界的纳米博客语料库。目标 2:我们将创建纳米博客上下文建模、标准化和语言检测算法。目标 3:我们将创建纳米博客网络欺凌过滤算法。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Khoury, Richard其他文献
MeaningBERT: assessing meaning preservation between sentences
MeaningBERT:评估句子之间的意义保存
- DOI:
10.3389/frai.2023.1223924 - 发表时间:
2023 - 期刊:
- 影响因子:4
- 作者:
Beauchemin, David;Saggion, Horacio;Khoury, Richard - 通讯作者:
Khoury, Richard
Understanding the Influence of Web-Based Information, Misinformation, Disinformation, and Reinformation on COVID-19 Vaccine Acceptance: Protocol for a Multicomponent Study.
- DOI:
10.2196/41012 - 发表时间:
2022-10-17 - 期刊:
- 影响因子:1.7
- 作者:
Dube, Eve;MacDonald, Shannon E.;Manca, Terra;Bettinger, Julie A.;Driedger, S. Michelle;Graham, Janice;Greyson, Devon;MacDonald, Noni E.;Meyer, Samantha;Roch, Genevieve;Vivion, Maryline;Aylsworth, Laura;Witteman, Holly O.;Gelinas-Gascon, Felix;Sathler Guimaraes, Lucas Marques;Hakim, Hina;Gagnon, Dominique;Bechard, Benoit;Gramaccia, Julie A.;Khoury, Richard;Tremblay, Sebastien - 通讯作者:
Tremblay, Sebastien
Khoury, Richard的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Khoury, Richard', 18)}}的其他基金
Virage numérique de la presse québécoise
魁北克新闻数字
- 批准号:
561115-2021 - 财政年份:2021
- 资助金额:
$ 2.55万 - 项目类别:
Alliance Grants
Forage de données d'assurance : techniques, éthique, et sécurité
保证的来源:技术、技巧和安全
- 批准号:
537198-2018 - 财政年份:2021
- 资助金额:
$ 2.55万 - 项目类别:
Collaborative Research and Development Grants
Forage de données d'assurance : techniques, éthique, et sécurité
保证的来源:技术、技巧和安全
- 批准号:
537198-2018 - 财政年份:2021
- 资助金额:
$ 2.55万 - 项目类别:
Collaborative Research and Development Grants
Nanoblog processing
纳米博客处理
- 批准号:
RGPIN-2021-02599 - 财政年份:2021
- 资助金额:
$ 2.55万 - 项目类别:
Discovery Grants Program - Individual
Virage numérique de la presse québécoise
魁北克新闻数字
- 批准号:
561115-2021 - 财政年份:2021
- 资助金额:
$ 2.55万 - 项目类别:
Alliance Grants
Nanoblog processing
纳米博客处理
- 批准号:
RGPIN-2021-02599 - 财政年份:2021
- 资助金额:
$ 2.55万 - 项目类别:
Discovery Grants Program - Individual
Forage de données d'assurance : techniques, éthique, et sécurité
保证的来源:技术、技巧和安全
- 批准号:
537198-2018 - 财政年份:2020
- 资助金额:
$ 2.55万 - 项目类别:
Collaborative Research and Development Grants
Forage de données d'assurance : techniques, éthique, et sécurité
保证的来源:技术、技巧和安全
- 批准号:
537198-2018 - 财政年份:2020
- 资助金额:
$ 2.55万 - 项目类别:
Collaborative Research and Development Grants
Forage de données d'assurance : techniques, éthique, et sécurité
保证的来源:技术、技巧和安全
- 批准号:
537198-2018 - 财政年份:2019
- 资助金额:
$ 2.55万 - 项目类别:
Collaborative Research and Development Grants
Forage de données d'assurance : techniques, éthique, et sécurité
保证的来源:技术、技巧和安全
- 批准号:
537198-2018 - 财政年份:2019
- 资助金额:
$ 2.55万 - 项目类别:
Collaborative Research and Development Grants
相似国自然基金
龙井茶加工过程中AGEs的产生规律及调控基础研究
- 批准号:32302609
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
亲水胶体对姜黄素阻断肉制品热加工过程中杂环胺和晚期糖基化终产物形成的影响机制与调控途径研究
- 批准号:32302258
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
融合多场多尺度仿真的晶体材料微铣削深度神经网络建模及加工性能预测
- 批准号:52305481
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
多晶脆性材料激光辅助滚压改性与低损伤加工方法研究
- 批准号:52305451
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
基于脉冲激光加工的钙钛矿光伏电池稳定性及重现性研究
- 批准号:62304181
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
相似海外基金
Scene Processing With Machine Learnable and Semantically Parametrized Representations RENEWAL
使用机器学习和语义参数化表示进行场景处理 RENEWAL
- 批准号:
MR/Y033884/1 - 财政年份:2025
- 资助金额:
$ 2.55万 - 项目类别:
Fellowship
Three-Dimensional Multilayer Nanomagnetic Arrays for Neuromorphic Low-Energy Magnonic Processing
用于神经形态低能磁处理的三维多层纳米磁性阵列
- 批准号:
EP/Y003276/1 - 财政年份:2024
- 资助金额:
$ 2.55万 - 项目类别:
Research Grant
Navigating Chemical Space with Natural Language Processing and Deep Learning
利用自然语言处理和深度学习驾驭化学空间
- 批准号:
EP/Y004167/1 - 财政年份:2024
- 资助金额:
$ 2.55万 - 项目类别:
Research Grant
Novel and efficient microwave plasma furnace for processing and syngas production
用于加工和合成气生产的新型高效微波等离子炉
- 批准号:
ST/Y509966/1 - 财政年份:2024
- 资助金额:
$ 2.55万 - 项目类别:
Research Grant
Dysregulation of RNA processing as a driver of motor neuron dysfunction in Amyotrophic Lateral Sclerosis
RNA 加工失调是肌萎缩侧索硬化症运动神经元功能障碍的驱动因素
- 批准号:
MR/Y014286/1 - 财政年份:2024
- 资助金额:
$ 2.55万 - 项目类别:
Research Grant