SHF: Small: Directoryless Shared Memory Using Execution Migration

SHF:小型:使用执行迁移的无目录共享内存

基本信息

  • 批准号:
    1116372
  • 负责人:
  • 金额:
    $ 40万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2011
  • 资助国家:
    美国
  • 起止时间:
    2011-09-01 至 2015-08-31
  • 项目状态:
    已结题

项目摘要

The increase in processor clock frequencies from 1980-2003 has slowed down significantly in recent years. To improve computer performance computer architects are exploring parallel architectures including many-core architectures. In a many-core or multi-core architecture, processor cores with relatively low complexity are connected to memory and to each other via high-bandwidth on-chip interconnect. The most popular programming model for multi-cores is that of shared memory. In this memory model, programmers write different threads that can run on different processors all of which can share a single memory space. This means that the on-chip cache memory on the multi-core chip should behave like a large shared cache. Unfortunately, current schemes for cache coherence either suffer from lack of scalability or require large directories at each core significantly increasing chip area and power. A directoryless cache coherence scheme is being investigated in this project that relies on the mechanism of execution migration. In execution migration, a thread?s context or state moves to the processor in whose cache the data resides. An important advantage of an execution migration architecture is that only a one-way trip is required to access data, since the thread moves to access data. In conventional data migration architectures, a round-trip is required to access data ? a request is sent to the location where the data resides and then the data is sent to the requesting thread. Further, only one copy of data need be present on chip if execution migration is used, since threads can move. This means that cache coherence is trivially ensured. Moreover, the chip can store more distinct data, since data is not replicated and this reduces off-chip access rates. Finally, an execution migration architecture can exploit the plentiful on-chip bandwidth available to speed up thread migration, thereby reducing data access latency.There are challenges associated with this architecture corresponding to contention for shared data across multiple threads, and the energy required to move thread contexts. The first challenge is being met through judicious replication of data at the program source level or compiler level. In particular, limited read copies of data are created across multiple threads. Since these copies only exist in between two writes to the data, coherence is ensured as before without need for complex coherence logic. However, contention for shared data is significantly reduced. The second challenge of energy consumption is being met through migration of partial thread contexts ? if a stack machine is used as the processor core, energy consumption can be reduced by migrating a subset of the thread context corresponding to the top part of the stack instead of the entire stack.In this project, an Execution Migration Machine with over 100 cores is being designed, and being evaluated using cycle-accurate simulation, and critical elements of the machine are being built on a Field Programmable Gate Array (FPGA). This project has the potential to meet the scalability and programmability challenges that face shared memory multi-core architectures. The Execution Migration Machine design will shed insight into how best thread migration can be used to enhance multi-core performance, possibly in combination with data migration. If successful, the project will impact the design of future multi-core processors through intelligent use of program and data migration.
近年来,从1980 - 2003年开始的处理器时钟频率的增加显着放缓。为了改善计算机性能,计算机架构师正在探索包括多核体系结构在内的并行体系结构。 在多核或多核体系结构中,复杂性相对较低的处理器核通过芯片互连连接到内存,并通过高频带宽度相互连接。多核最受欢迎的编程模型是共享内存的编程模型。 在此内存模型中,程序员编写可以在不同的处理器上运行的不同线程,所有这些线程都可以共享一个单一的存储空间。 这意味着多核芯片上的片上缓存内存应该像大型共享缓存一样行为。不幸的是,当前用于缓存连贯性的方案要么缺乏可扩展性,要么在每个核心上需要大型目录,会显着增加芯片面积和功率。该项目中正在研究一个无目录的缓存相干方案,该计划依赖于执行迁移的机制。在执行迁移中,线程的上下文或状态移至数据缓存数据所在的处理器。 执行迁移体系结构的一个重要优点是,由于线程移动到访问数据,因此只需要单向旅行才能访问数据。 在传统的数据迁移体系结构中,访问数据需要往返?将请求发送到数据居住的位置,然后将数据发送到请求线程。此外,如果使用执行迁移,则在芯片上只需要一个数据副本,因为线程可以移动。 这意味着缓存连贯性是微不足道的。 此外,芯片可以存储更多不同的数据,因为数据未复制,这会降低芯片访问率。 最后,执行迁移体系结构可以利用可用于加速线程迁移的大量芯片带宽,从而减少数据访问延迟。与此体系结构相关的挑战与跨多个线程的共享数据相对应,以及移动所需的能量线程上下文。 第一个挑战是通过在程序源级别或编译器级别上明智地复制数据来应对。 特别是,有限的数据副本是在多个线程之间创建的。由于这些副本仅存在于两个写入数据之间,因此可以像以前一样确保连贯性,而无需复杂的相干逻辑。但是,共享数据的争论大大降低。 通过部分线程上下文的迁移,正在应对能源消耗的第二个挑战?如果将堆栈计算机用作处理器核心,则可以通过迁移与堆栈的顶部相对应的线程的子集而不是整个堆栈。正在设计并使用循环精确的模拟进行评估,并且正在在可编程门阵列(FPGA)上构建机器的关键元素。该项目有可能满足面临共享内存多核体系结构的可扩展性和可编程性挑战。 执行迁移机器设计将洞悉如何使用最佳线程迁移来增强多核性能,并可能与数据迁移结合使用。如果成功,该项目将通过智能使用程序和数据迁移来影响未来多核处理器的设计。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Srini Devadas其他文献

Self-aware computing in the Angstrom processor
Angstrom 处理器中的自我感知计算
  • DOI:
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Henry Hoffmann;Jim Holt;George Kurian;Eric Lau;Martina Maggio;Jason E. Miller;Sabrina M. Neuman;Mahmut E. Sinangil;Yildiz Sinangil;A. Agarwal;A. Chandrakasan;Srini Devadas
  • 通讯作者:
    Srini Devadas
Hardware Mechanisms for Memory Authentication
内存验证的硬件机制
  • DOI:
  • 发表时间:
    2003
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Edward Suh;Dwaine E. Clarke;B. Gassend;Marten Van Dijk;Srini Devadas;G. Suh;Srini Devadas
  • 通讯作者:
    Srini Devadas

Srini Devadas的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Srini Devadas', 18)}}的其他基金

SaTC: CORE: Medium: Provably Secure, Usable, and Performant Enclaves in Multicore Processors
SaTC:CORE:中:多核处理器中可证明安全、可用且高性能的 Enclave
  • 批准号:
    2115587
  • 财政年份:
    2021
  • 资助金额:
    $ 40万
  • 项目类别:
    Continuing Grant
SaTC: CORE: Medium: Collaborative: Hardening Off-the-Shelf Software Against Side Channel Attacks
SaTC:核心:媒介:协作:强化现成软件以抵御侧通道攻击
  • 批准号:
    1955270
  • 财政年份:
    2020
  • 资助金额:
    $ 40万
  • 项目类别:
    Continuing Grant
SaTC: CORE: Small: Design of Efficient, Horizontally-Scaling, and Strongly Anonymous Communication Networks
SaTC:核心:小型:高效、水平扩展和强匿名通信网络的设计
  • 批准号:
    1813087
  • 财政年份:
    2018
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant
SPX: Collaborative Research: Distributed Database Management with Logical Leases and Hardware Transactional Memory
SPX:协作研究:具有逻辑租赁和硬件事务内存的分布式数据库管理
  • 批准号:
    1822920
  • 财政年份:
    2018
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant
STARSS: Small: Trapdoor Computational Fuzzy Extractors
STARSS:小型:活板门计算模糊提取器
  • 批准号:
    1523572
  • 财政年份:
    2015
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant
TWC: TTP Option: Frontier: Collaborative: MACS: A Modular Approach to Cloud Security
TWC:TTP 选项:前沿:协作:MACS:云安全的模块化方法
  • 批准号:
    1413920
  • 财政年份:
    2014
  • 资助金额:
    $ 40万
  • 项目类别:
    Continuing Grant
XPS: FULL: DSD: Collaborative Research: Moving the Abyss: Database Management on Future 1000-core Processors
XPS:完整:DSD:协作研究:移动深渊:未来 1000 核处理器上的数据库管理
  • 批准号:
    1438967
  • 财政年份:
    2014
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant
TWC: Small: Ascend: Architecture for Secure Computation on Encrypted Data
TWC:小型:Ascend:加密数据安全计算架构
  • 批准号:
    1317763
  • 财政年份:
    2013
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant
EAGER: Collaborative: Holistic Security for Cloud Computing: Oblivious Computation
EAGER:协作:云计算的整体安全性:不经意的计算
  • 批准号:
    1347279
  • 财政年份:
    2013
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant
SHF: Medium: Collaborative Research: Throughput-Driven Multi-Core Architecture and a Compilation System
SHF:中:协作研究:吞吐量驱动的多核架构和编译系统
  • 批准号:
    0904598
  • 财政年份:
    2009
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant

相似国自然基金

单细胞分辨率下的石杉碱甲介导小胶质细胞极化表型抗缺血性脑卒中的机制研究
  • 批准号:
    82304883
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
小分子无半胱氨酸蛋白调控生防真菌杀虫活性的作用与机理
  • 批准号:
    32372613
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
诊疗一体化PS-Hc@MB协同训练介导脑小血管病康复的作用及机制研究
  • 批准号:
    82372561
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
非小细胞肺癌MECOM/HBB通路介导血红素代谢异常并抑制肿瘤起始细胞铁死亡的机制研究
  • 批准号:
    82373082
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
FATP2/HILPDA/SLC7A11轴介导肿瘤相关中性粒细胞脂代谢重编程影响非小细胞肺癌放疗免疫的作用和机制研究
  • 批准号:
    82373304
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目

相似海外基金

Powering Small Craft with a Novel Ammonia Engine
用新型氨发动机为小型船只提供动力
  • 批准号:
    10099896
  • 财政年份:
    2024
  • 资助金额:
    $ 40万
  • 项目类别:
    Collaborative R&D
"Small performances": investigating the typographic punches of John Baskerville (1707-75) through heritage science and practice-based research
“小型表演”:通过遗产科学和基于实践的研究调查约翰·巴斯克维尔(1707-75)的印刷拳头
  • 批准号:
    AH/X011747/1
  • 财政年份:
    2024
  • 资助金额:
    $ 40万
  • 项目类别:
    Research Grant
人工知能に基づく非線形高次元小標本データ解析とその社会的応用
基于人工智能的非线性高维小样本数据分析及其社会应用
  • 批准号:
    24K14847
  • 财政年份:
    2024
  • 资助金额:
    $ 40万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Fragment to small molecule hit discovery targeting Mycobacterium tuberculosis FtsZ
针对结核分枝杆菌 FtsZ 的小分子片段发现
  • 批准号:
    MR/Z503757/1
  • 财政年份:
    2024
  • 资助金额:
    $ 40万
  • 项目类别:
    Research Grant
Bacteriophage control of host cell DNA transactions by small ORF proteins
噬菌体通过小 ORF 蛋白控制宿主细胞 DNA 交易
  • 批准号:
    BB/Y004426/1
  • 财政年份:
    2024
  • 资助金额:
    $ 40万
  • 项目类别:
    Research Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了