活捉抢算力的谷歌员工！博弈论或可破数据中心“囚徒困境”

发布时间：2020-04-10 16:28:58 所属栏目：产品来源：站长网

导读：副标题#e# 把数据中心和博弈游戏两个词放在一起，你会想到什么？经济学家们研究的囚徒困境？还是《魔兽世界》的用户数据？我们今天要讲的，正是数据中心和博弈游戏的结合，但和在线游戏一点关系没有。今天的话题，是切实发生在数据中心的博弈从共享的大量

我们设计了一个博弈游戏。在每一轮比赛中，用户可能处于三种状态中的一种:活跃状态、冲刺后的冷却状态、紧急断电后的恢复状态。在每一轮游戏中，用户唯一能决定的就是当他们的处理器处于活动状态时是否进行冲刺。用户希望优化他们的冲刺以获得好处，比如提高吞吐量或减少执行时间。但也要注意，这些好处会随着冲刺的发生时间而变化。例如，冲刺在需求量大的时候更有益。

考虑一个简单的例子。在第5轮，你知道如果此时冲刺将获得10个单位的收益，然而处理器必须冷却几个回合才能再次冲刺。假设现在你冲刺了，那么在第6轮，你会发现冲刺可以获得20个单位的收益。另一种情况是，你将冲刺权保存到了下一轮但所有其他用户都决定在第5轮时冲刺，这导致电力紧急情况，使你无法在后续几轮中冲刺。更糟的是，到那时你的收益就不会那么高了。

短跑游戏中的“平均场博弈分析”

玩家们使用一个数据中心来共享信息。如果其中一个玩家选择在第5轮冲刺，他们将获得一定的收益，但他们必须要等处理器冷却一段时间才能再次加速。如果他们等到第6轮或者之后再冲刺，他们会获得更多收益。

如果太多的玩家同时冲刺，电流大幅度增加会导致断电。在计算机集群的不间断电源电池充电之前，任何人都不能再冲刺，即使是没有冲刺的玩家4也不行。

所有用户都必须权衡他们获得的效用的多少和其他用户的冲刺策略，之后再做出相应的决定。虽然少数用户竞争的例子可能很有趣，但随着竞争对手的数量增长到数据中心的规模，做出这些决定就变得非常棘手。

幸运的是，我们找到了这种叫做“平均场博弈分析”的方法，可以在在大型系统中优化每个用户的策略。这种方法将所有用户策略考虑为一个整体，避免了考虑每个竞争对手策略的复杂性。这种统计方法的关键在于假设任何单个用户行为都不会显著地改变系统的平均行为。正是由于这一假设，我们可以用单个平均效应来近似所有其他用户对任何给定用户的影响。

这有点类似于数百万上班族试图优化他们的日常出行。我们以文摘菌这样一个上班族为例。虽然不能用她以一概全。但是，文摘菌的行为模式可以推断出上班族这一总体在特定一天中希望到达的时间，以及他们的出行计划会如何加剧道路拥堵等。
平均场分析允许我们找到冲刺游戏的“平均场平衡”。用户会优化他们对群体的响应。这也意味着，在平衡状态下，偏离他们对整体的最佳响应将没有任何好处。

在交通情况中，文摘菌会根据对通勤人群平均行为的理解来优化通勤。如果优化后的计划没有产生预期的交通模式，她就会修正自己的预期并重新考虑自己的计划。随着每一个通勤者在几天内的一次优化，交通收敛到一些重复的模式，通勤者的独立行动产生一个平衡。

通过平均场平衡，我们制定了冲刺游戏的最优策略：当性能收益超过某个阈值时，用户应该冲刺。

该阈值根据用户的不同而不同。我们可以使用数据中心的工作负载及其物理特性来计算这个阈值。

当每个人都在平均场平衡下以他们的最优阈值运行时，系统将会受益良多。首先，数据中心的电源管理可以是分布式的，因为用户可以实现他们自己的策略，而不需要向中心管理员请求加速许可。这种独立性使得功率控制更加灵敏、节能。用户可以在微秒或更少的时间内调节处理器的功耗。而如果他们必须等待几十毫秒来获得许可，才能通过数据中心，那么这种效果将难以实现。其次，用户可以根据自己的工作负载需求来及时优化加速策略，使得均衡条件下可以完成更多计算工作。最后，当增益超过阈值时，用户的策略就变成了简单的冲刺。这是非常容易执行的。

贪得无厌必自毙：在冲刺游戏中，与“贪心”策略相比，使用平均场均衡策略可以用更少的力完成更多的功。

博弈论必将发挥巨大作用

“冲刺管理项目”只是我们在过去五年中开发的一系列数据中心管理系统中的一个。在每一款游戏中，我们都使用了硬件架构和系统的关键细节来设计游戏。而这样利用这一管理机制使得，当参与者行为表现得过于自私利己时，系统依旧可以稳定运行。我们有理由相信，这样的保证只会鼓励共享系统的参与，并为节能和可扩展的数据中心奠定坚实的基础。

尽管我们已经设法在服务器多处理器、服务器机柜和服务器集群级别解决了资源分配问题，但是将它们用于大型数据中心仍需要很多工作。一方面，你必须能够生成数据中心的性能概要。因此，数据中心必须部署必要的基础设施来监视硬件活动、评估性能结果和推断对资源的偏好。

这类系统的大多数博弈论解决方案都要求分析阶段离线进行。相反，构建可以从一些先验知识开始，然后在执行过程中随着特征变得更清晰，而更新其参数的在线机制可能干扰更小。在线机制甚至可能通过强化学习或另一种形式的人工智能来改进游戏。

还有一个现实问题就是：在数据中心，用户可以随时进出系统，任务可以在计算过程中随意穿插，服务器可能会失败并重新启动。所有这些事件都需要重新分配资源，但是这些重新分配可能会破坏整个系统的计算，并要求对数据进行分流，从而耗尽资源。

在保持每个人公平竞争的同时，应付所有这些变化肯定需要更多的工作，但我们坚信博弈论必将发挥巨大作用。

城市网络

（编辑：源码网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

3/3

首页

NVIDIA确定显卡更贵了	NVIDIA发表新一代H100
旗舰射门员王者归来！	小米连供喷墨打印一体