Opening the black box: helping AI to persuade without bias

打开黑匣子:帮助人工智能无偏见地说服

基本信息

  • 批准号:
    2752436
  • 负责人:
  • 金额:
    --
  • 依托单位:
  • 依托单位国家:
    英国
  • 项目类别:
    Studentship
  • 财政年份:
    2022
  • 资助国家:
    英国
  • 起止时间:
    2022 至 无数据
  • 项目状态:
    未结题

项目摘要

The overall aim of the project is to establish how AI can use natural language to persuade humans in transparent and bias-free ways. AI systems are becoming an integral part of our daily lives, from simple recommendations on YouTube or Netflix, to life-changing decisions such as shortlisting job applicants or recommending loans. However, these systems lack transparency and objective indicators of fairness, producing poorly understood 'advice' that could be fuelling biased decisions on a growing scale right across society. Biased advice that treats individuals differently based on their gender is a particular concern (e.g. in employment contexts). Detecting and removing this bias is extremely difficult. It arises from stereotyped human labelling and categorisation residing within huge, cobbled-together data sets typically used to train AI. Because this bias is 'hidden', its transmission to humans interacting with AI is correspondingly difficult to establish, and even more difficult to eliminate. In this Phd, we propose and test a novel solution which combines experimental psychology with computing science to offer a way of detecting when biased advice from AI passes into human judgements. The student will engineer their own AI into which known patterns of gender-bias, deriving from our work on cognitive stereotypes, can be 'injected'. Using advanced natural language models, the AI will have brief 'conversations' with human participants in a series of studies that will provide a rich source of data on acts of rejection or conformity to biased and unbiased advice. Using cutting-edge machine learning techniques, the student will analyse this new bespoke data set to identify language features that signal persuasion. Within these features the student will seek to isolate ones specifically linked to acceptance of biased content. Crucially, these features may be used to detect the transmission of hidden biases in real-life applications.
该项目的总体目的是建立AI如何使用自然语言以透明和无偏见的方式说服人类。 AI系统正在成为我们日常生活中不可或缺的一部分,从YouTube或Netflix上的简单建议到改变生活的决定,例如入围工作申请人或推荐贷款。但是,这些系统缺乏公平性的透明度和客观指标,从而产生了鲜为人知的“建议”,这可能会促进整个社会日益增长的规模的有偏见的决定。有偏见的建议,根据性别对个人的对待有所不同,这是一个特别关注的问题(例如,在就业背景下)。检测和消除这种偏见非常困难。它源于刻板印象的人类标记和分类,这些标签和分类位于通常用于训练AI的巨大的,拼凑的数据集中。因为这种偏见是“隐藏的”,所以它向人类与AI互动的传播相应地建立非常困难,甚至更难消除。在该博士学位上,我们提出并测试一种新颖的解决方案,该解决方案将实验心理学与计算科学相结合,以提供一种检测AI的偏见建议的方法。该学生将自己的AI设计自己的AI,从我们在认知刻板印象上的工作中得出的已知性别偏见模式可以被“注入”。使用先进的自然语言模型,AI将与人类参与者进行一系列研究的简短“对话”,这些研究将提供有关拒绝行为或符合偏见和无偏见建议的丰富数据来源。使用尖端的机器学习技术,学生将分析这个新的定制数据集,以识别信号说服力的语言特征。在这些功能中,学生将寻求隔离专门链接的偏见内容。至关重要的是,这些功能可用于检测现实生活应用中隐藏偏见的传播。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

其他文献

Products Review
  • DOI:
    10.1177/216507996201000701
  • 发表时间:
    1962-07
  • 期刊:
  • 影响因子:
    2.6
  • 作者:
  • 通讯作者:
Farmers' adoption of digital technology and agricultural entrepreneurial willingness: Evidence from China
  • DOI:
    10.1016/j.techsoc.2023.102253
  • 发表时间:
    2023-04
  • 期刊:
  • 影响因子:
    9.2
  • 作者:
  • 通讯作者:
Digitization
References
Putrescine Dihydrochloride
  • DOI:
    10.15227/orgsyn.036.0069
  • 发表时间:
    1956-01-01
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:

的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('', 18)}}的其他基金

An implantable biosensor microsystem for real-time measurement of circulating biomarkers
用于实时测量循环生物标志物的植入式生物传感器微系统
  • 批准号:
    2901954
  • 财政年份:
    2028
  • 资助金额:
    --
  • 项目类别:
    Studentship
Exploiting the polysaccharide breakdown capacity of the human gut microbiome to develop environmentally sustainable dishwashing solutions
利用人类肠道微生物群的多糖分解能力来开发环境可持续的洗碗解决方案
  • 批准号:
    2896097
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
A Robot that Swims Through Granular Materials
可以在颗粒材料中游动的机器人
  • 批准号:
    2780268
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Likelihood and impact of severe space weather events on the resilience of nuclear power and safeguards monitoring.
严重空间天气事件对核电和保障监督的恢复力的可能性和影响。
  • 批准号:
    2908918
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Proton, alpha and gamma irradiation assisted stress corrosion cracking: understanding the fuel-stainless steel interface
质子、α 和 γ 辐照辅助应力腐蚀开裂:了解燃料-不锈钢界面
  • 批准号:
    2908693
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Field Assisted Sintering of Nuclear Fuel Simulants
核燃料模拟物的现场辅助烧结
  • 批准号:
    2908917
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Assessment of new fatigue capable titanium alloys for aerospace applications
评估用于航空航天应用的新型抗疲劳钛合金
  • 批准号:
    2879438
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
CDT year 1 so TBC in Oct 2024
CDT 第 1 年,预计 2024 年 10 月
  • 批准号:
    2879865
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Developing a 3D printed skin model using a Dextran - Collagen hydrogel to analyse the cellular and epigenetic effects of interleukin-17 inhibitors in
使用右旋糖酐-胶原蛋白水凝胶开发 3D 打印皮肤模型,以分析白细胞介素 17 抑制剂的细胞和表观遗传效应
  • 批准号:
    2890513
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship
Understanding the interplay between the gut microbiome, behavior and urbanisation in wild birds
了解野生鸟类肠道微生物组、行为和城市化之间的相互作用
  • 批准号:
    2876993
  • 财政年份:
    2027
  • 资助金额:
    --
  • 项目类别:
    Studentship

相似国自然基金

进化视角下黑色旅游游客的心理机制研究
  • 批准号:
    72302157
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
应用CRISPR/Cas13a基因编辑系统针对BRAFV600E阳性黑色素瘤脑转移瘤精准诊疗技术的研究
  • 批准号:
    82303971
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
IDH3a通过YBX1调控JUN/FOS基因促进黑色素瘤生长的非线粒体依赖机制研究
  • 批准号:
    82372682
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
自光声黑色素纳米药物通过抑制铁死亡和调节“肠-肾轴”实现急性肾损伤的可视化治疗
  • 批准号:
    82302279
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
NREP介导耐药休眠期细胞成脂促进黑色素瘤耐药发生的机制研究
  • 批准号:
    82360607
  • 批准年份:
    2023
  • 资助金额:
    32 万元
  • 项目类别:
    地区科学基金项目

相似海外基金

Collaborative Research: Opening the black box of oxygen deficient zone biogeochemistry through integrative tracers
合作研究:通过综合示踪剂打开缺氧区生物地球化学黑匣子
  • 批准号:
    2342987
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    Continuing Grant
Collaborative Research: Opening the black box of oxygen deficient zone biogeochemistry through integrative tracers
合作研究:通过综合示踪剂打开缺氧区生物地球化学黑匣子
  • 批准号:
    2342986
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    Continuing Grant
Collaborative Research: Opening the black box of oxygen deficient zone biogeochemistry through integrative tracers
合作研究:通过综合示踪剂打开缺氧区生物地球化学黑匣子
  • 批准号:
    2342988
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    Continuing Grant
Opening the black box on the contribution of interprofessional health providers in primary care: Measuring performance indicators that reflect and optimize practice
打开跨专业卫生服务提供者在初级保健中的贡献的黑匣子:衡量反映和优化实践的绩效指标
  • 批准号:
    493377
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
    Operating Grants
Opening The Black Box: Enhancing Machine Learning Interpretability To Optimize Clinical Response To Sudden Deterioration In COVID-19 Patients
打开黑匣子:增强机器学习的可解释性,以优化对 COVID-19 患者突然恶化的临床反应
  • 批准号:
    10259197
  • 财政年份:
    2021
  • 资助金额:
    --
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了