A Lebesgue Integral based Approximation for Language Modelling

基于勒贝格积分的语言建模近似

基本信息

  • 批准号:
    EP/X019063/1
  • 负责人:
  • 金额:
    $ 25.77万
  • 依托单位:
  • 依托单位国家:
    英国
  • 项目类别:
    Research Grant
  • 财政年份:
    2023
  • 资助国家:
    英国
  • 起止时间:
    2023 至 无数据
  • 项目状态:
    未结题

项目摘要

Deep learning (DL) based Natural Language Processing (NLP) technologies have attracted significant interest in recent years. The current SOTA language models, a.k.a. transformer-based language models, typically assume that the representation of a given word can be captured by the interpolation of its related context in a convex hull. However, it has recently been shown that in high-dimensional spaces, the interpolation almost surely never occurs regardless of the underlying intrinsic dimension of the data manifold. The representations generated by such transformer-based language models will converge into a dense cone-like hyperspace which is often discontinuous with many nonadjacent clusters. To overcome the limitation of current methods in most DL-based NLP models, this project aims to deploy Lebesgue integral, which can be defined as an ensemble of integrals among partitions (i.e., discontinuous feature clusters), to approximate the posterior distributions of clusters given input word features in finite measurable sets by automatically identifying the boundary of such discontinuous set, which in turn could help to generate better interpretations and quantify the uncertainty. By our proposed Lebesgue integral based approximation, the input text will be characterised by two properties: an indicator vector encoding its membership in clusters (i.e., measurable sets), and another continuous feature representation for better capturing its semantic meaning for downstream tasks. This not only allows for a more faithful approximation of commonly observed countably discontinuities in distributions of input text in NLP, but also enables learning text representations that are better understood by humans.
近年来,基于深度学习(DL)的自然语言处理(NLP)技术引起了极大的兴趣。当前的SOTA语言模型,又称基于变压器的语言模型,通常假定给定单词的表示可以通过在凸船上的相关上下文插值来捕获。但是,最近已经显示,在高维空间中,无论数据歧管的潜在固有维度如何,插值几乎绝对不会发生。这种基于变压器的语言模型产生的表示形式将收敛成一个浓密的锥形超空间,而这通常与许多非贴心簇不连续。为了克服大多数基于DL的NLP模型中当前方法的局限性,该项目旨在部署Lebesgue积分,可以将其定义为分区之间的积分集合(即不连续的特征簇),以近似于在有限的测量中,可以自动地识别出closeation nourdeation nourdeation nourdeation nourcyemation nourdeation nourdeation nourdeation nourdeation nourdeation,以近似为差异,以识别clusters的后部分布。并量化不确定性。通过我们提出的基于Lebesgue积分的近似值,输入文本将以两种属性为特征:一个指标向量编码其在簇中的成员资格(即可测量的集合),以及另一种连续的特征表示,以更好地捕获其在下游任务的语义含义。这不仅允许在NLP中输入文本的分布中更加忠实地逼近通常观察到的不连续性,而且还可以使学习文本表示形式更好地理解了人类。

项目成果

期刊论文数量(10)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Document-Level Multi-Event Extraction with Event Proxy Nodes and Hausdorff Distance Minimization
  • DOI:
    10.48550/arxiv.2305.18926
  • 发表时间:
    2023-05
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Xinyu Wang;Lin Gui;Yulan He
  • 通讯作者:
    Xinyu Wang;Lin Gui;Yulan He
Distilling ChatGPT for Explainable Automated Student Answer Assessment
提炼 ChatGPT 以进行可解释的自动化学生答案评估
  • DOI:
    10.18653/v1/2023.findings-emnlp.399
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Li J
  • 通讯作者:
    Li J
Event Temporal Relation Extraction with Bayesian Translational Model
  • DOI:
    10.48550/arxiv.2302.04985
  • 发表时间:
    2023-02
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Xingwei Tan;Gabriele Pergola;Yulan He
  • 通讯作者:
    Xingwei Tan;Gabriele Pergola;Yulan He
CUE: An Uncertainty Interpretation Framework for Text Classifiers Built on Pre-Trained Language Models
  • DOI:
    10.48550/arxiv.2306.03598
  • 发表时间:
    2023-06
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Jiazheng Li;ZHAOYUE SUN;Bin Liang;Lin Gui;Yulan He
  • 通讯作者:
    Jiazheng Li;ZHAOYUE SUN;Bin Liang;Lin Gui;Yulan He
OverPrompt: Enhancing ChatGPT Capabilities through an Efficient In-Context Learning Approach
  • DOI:
    10.48550/arxiv.2305.14973
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Jiazheng Li;Runcong Zhao;Yulan He;Lin Gui
  • 通讯作者:
    Jiazheng Li;Runcong Zhao;Yulan He;Lin Gui
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Lin Gui其他文献

Providing Vehicular Infotainment Service Using VHF/UHF TV Bands via Spatial Spectrum Reuse
通过空间频谱复用,使用 VHF/UHF 电视频段提供车辆信息娱乐服务
  • DOI:
    10.1109/tbc.2015.2400819
  • 发表时间:
    2015-03
  • 期刊:
  • 影响因子:
    4.5
  • 作者:
    Haibo Zhou;Lin Gui;Ning Liu;Yiyan Wu
  • 通讯作者:
    Yiyan Wu
Incorporating multi-kernel function and Internet verification for Chinese person name disambiguation
结合多内核功能和互联网验证的中文人名消歧
  • DOI:
    10.1007/s11704-016-4503-0
  • 发表时间:
    2016-12
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Ruifeng Xu;Lin Gui;Qin Lu;Shuai Wang;Jian Xu
  • 通讯作者:
    Jian Xu
Cross Lingual Opinion Holder Extraction based on Multiple Kernel SVMs and Transfer Learning
基于多核SVM和迁移学习的跨语言意见持有者提取
Nonparametric and parametric methods of spectral analysis
谱分析的非参数和参数方法
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Hangfang Zhao;Lin Gui
  • 通讯作者:
    Lin Gui
Prediction of DNA-binding residues from sequence information using convolutional neural network
使用卷积神经网络根据序列信息预测 DNA 结合残基

Lin Gui的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

相似国自然基金

用CLEAN和直接解调方法分析INTEGRAL数据
  • 批准号:
    10603004
  • 批准年份:
    2006
  • 资助金额:
    35.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

I-Corps: A Novel integral-proportional and proportional-integral controller for inverter-based microgrids
I-Corps:一种用于基于逆变器的微电网的新型积分比例和比例积分控制器
  • 批准号:
    2402495
  • 财政年份:
    2024
  • 资助金额:
    $ 25.77万
  • 项目类别:
    Standard Grant
Seeking an integral theory of blame and forgiveness: an inquiry to construct a relation-based theory of forgiveness
寻求责备与宽恕的整体理论:构建基于关系的宽恕理论的探究
  • 批准号:
    23K00027
  • 财政年份:
    2023
  • 资助金额:
    $ 25.77万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
KLOTHO and Resilience to Synaptic Dysfunction in Preclinical AD
KLOTHO 和临床前 AD 中突触功能障碍的恢复力
  • 批准号:
    10587987
  • 财政年份:
    2023
  • 资助金额:
    $ 25.77万
  • 项目类别:
A parainfluenza virus 5 (PIV5)-based bivalent vaccine for respiratory syncytial virus (RSV) and human metapneumovirus (HMPV)
基于副流感病毒 5 (PIV5) 的呼吸道合胞病毒 (RSV) 和人类偏肺病毒 (HMPV) 的二价疫苗
  • 批准号:
    10644266
  • 财政年份:
    2023
  • 资助金额:
    $ 25.77万
  • 项目类别:
Predictive multi-scale model of focal adhesion-based durotaxis
基于粘着斑的 durotaxis 的预测多尺度模型
  • 批准号:
    10798520
  • 财政年份:
    2023
  • 资助金额:
    $ 25.77万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了