数据中心低频动态拓扑结构设计与优化
项目介绍
AI项目解读
基本信息
- 批准号:61902246
- 项目类别:青年科学基金项目
- 资助金额:27.0万
- 负责人:
- 依托单位:
- 学科分类:F0207.计算机网络
- 结题年份:2022
- 批准年份:2019
- 项目状态:已结题
- 起止时间:2020-01-01 至2022-12-31
- 项目参与者:--
- 关键词:
项目摘要
Continued growth in cloud computing places a premium on cost-efficient data center topology design. As a result, reconfigurable data center topology, based on optical circuit switching technologies, has been proposed. Since data center traffic is highly bursty (subject to change within tens of milliseconds), existing proposals have been devoted to minimizing the reconfiguration latency, in order to catch up with the fast-changing data center traffic. However, frequent reconfiguration brings about significant risk to data center operations, hindering its deployment in commercial data centers. In order to reduce the risk of frequent reconfiguration, this project proposes low-frequency reconfigurable topology for the first time. Based on a few months' observation of data center traffic history, we find that data center traffic exhibits some clustering effect. These clusters are slow-varying. If we can design a robust topology based on these traffic clusters, it would be possible that a single topology can handle traffic dynamics in a relative long period of time. This idea also lays the foundation for low frequency topology engineering. This project provides a concrete theoretical analysis and system design for low frequency reconfiguration topology design.
随着云计算的发展,如何以更低的代价构建更高效的数据中心变得至关重要。为此,基于光交换机的动态数据中心拓扑结构应运而生。由于数据中心的流量变化极快(毫秒量级),现有的研究往往致力于如何在微妙量级完成拓扑切换,以使拓扑结构的变化跟上流量的变化。然而,频繁地切换拓扑结构会严重影响数据中心网络的可靠性,使得动态拓扑结构很难应用于实际数据中心系统。为了解决高频切换带来的风险,该项目首次提出低频动态拓扑结构。我们通过观察数据中心数月间的流量变化,发现数据中心的流量具备某些长期分布特性,且该长期分布特性变化缓慢。如果可以根据该长期分布特性对数据中心拓扑结构进行鲁棒性优化,我们得到的拓扑结构就能够在相对较长的时间内很好地处理快速变化的数据中心流量。这就为低频拓扑结构的设计奠定了基础。该项目就低频动态拓扑结构的理论基础与系统设计进行了深入的分析。
结项摘要
背景:随着应用对带宽的需求越来越高,传统胖树架构数据中心的网络功耗已逐步达到难以承受的程度。光交换机由于具有功耗低、带宽高的特点,若能替换数据中心内的部分电交换机,将能有效提升数据中心的带宽功耗比。然而,与电交换机相比,光交换机灵活度较差,难以根据数据中心流量的突发实时切换连接方式。..研究内容:本项目探索一种全新的基于慢切换的光电混合网络控制方案,旨在降低光电混合数据中心的控制难度,降低落地门槛。谷歌2022年8月份新公布的光电混合数据中心采用的也是慢切换。相比之下,前人工作普遍认为应对流量突发必须快速光切换。..主要成果:.1 光交换机与电交换机如何互连:.在数据中心搭建初期,我们需要设计光交换机与电交换机的互连方式,并提供性能保障。这里的挑战是数据中心尚未开始运行,因此流量模式未知。我们首次提出利用“竞争比”来衡量光电交换机之间不同互连方式的理论最坏性能保障,并分析了文献中常见的互连方式的理论性能。成果发表于SIGMETRICS 2022。..2 光交换机如何控制:.我们发现数据中心汇聚层之间的流量具有“弱稳定性”,即历史流量矩阵构成的凸包能够覆盖99%以上的未来流量矩阵;通过针对历史流量凸包对光电混合数据中心拓扑进行鲁棒性优化,使其能够在不频繁切换拓扑的前提下仍能有效应对流量突发。该方法能够大幅降低光交换机切换的频率,使光电混合数据中心更易落地。成果于2022年被IEEE/ACM TON接收。..3 电交换机路由如何控制:.1)2中方案在路由层面采用传统WCMP,而WCMP在应对突发的同时会导致路径长度的增加。因此,我们提出了基于阈值分流的改进路由方案:未超过阈值的流量走最短路径;超过阈值的突发流量调度到其他路径。这种方法可以在不增加路径长度的前提下更好地应对突发,因此相比基于WCMP的方法具有更好的性能。该工作发表于ICNP 2021。.2)在光交换机配置确定后,光电混合数据中心的逻辑拓扑本质上是一个扁平直连拓扑。在这类拓扑中,ECMP/WCMP/KSP是几种常见的路由策略。然而,我们发现这些路由策略存在循环缓冲区依赖的概率接近于1。因此,如果我们在网络中开启PFC,网络就可能触发严重的死锁。我们提出了“虚拟上下路由”方案彻底消除了死锁。成果发表于NSDI 2023...科学意义:.论证了光电混合数据中心慢切换控制方案的可行性。部分成果应用于谷歌数据中心。
项目成果
期刊论文数量(2)
专著数量(0)
科研奖励数量(1)
会议论文数量(3)
专利数量(3)
Understanding the Performance Guarantee of Physical Topology Design for Optical Circuit Switched Data Centers
了解光路交换数据中心物理拓扑设计的性能保证
- DOI:10.1145/3491054
- 发表时间:2021-12
- 期刊:Proceedings of the ACM on Measurement and Analysis of Computing Systems (Also in SIGMETRICS 2022)
- 影响因子:--
- 作者:Shizhen Zhao;Peirui Cao;Xinbing Wang
- 通讯作者:Xinbing Wang
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
白念珠菌几丁质合成酶三维结构的同源建模及其与FR-900403的分子对接研究
- DOI:--
- 发表时间:2017
- 期刊:中国真菌学杂志
- 影响因子:--
- 作者:孙彬;刘敏;赵世振;王世本;黄宏丽
- 通讯作者:黄宏丽
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
赵世振的其他基金
面向AI分布式训练的光电混合数据中心网络
- 批准号:
- 批准年份:2022
- 资助金额:55 万元
- 项目类别:面上项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}