时间:2024-04-04 12:51
来源:证券之星 阅读量:13057
如果您希望可以时常见面,欢迎标星收藏哦~
美国政府修改了对中国半导体的出口限制,以涵盖更多高性能硬件。具体来说,任何提供超过 70 个“Weighted Tera FLOPS”性能的半导体芯片现在都被禁止在未经许可的情况下出口到中国。此次限制包括Nvidia中国独家的RTX 4090D “Dragon”显卡。
RTX 4090D 是专门为遵守几个月前美国对中国的出口禁令而制造的。RTX 4090 超出了 4,800 总处理能力 限制 10%,因此 Nvidia 创建了 4090D,使其低于该限制(其达到 4,707 TPP)。令人惊讶的是,新的 70 TFLOPS 限制仅比 RTX 4090D 的 73.5 TFLOPS 性能数字低 5%。
虽然这种修改看似不可避免,但我们不得不质疑它是否有意义。RTX 4090D推出后,美国政府警告英伟达,其策略不会被忽视,目前已采取行动禁止英伟达中国独家GPU。但是,GPU“速度限制”降低 5% 是否重要?如果是这样,当 Nvidia 制造低于该限制的新 GPU 时会发生什么?
RTX 4090D 是 RTX 4090 的精简版,具有 14,592 个 CUDA 核心和 425W TBP。与即将推出的RTX 4090相比 ,RTX 4090D 的 CUDA 核心数量减少了 12.8%,TDP 降低了 5.9%。两者之间的所有其他核心规格保持不变。唯一的例外是基础时钟,它已从 2.23 GHz 略微提升至 2.28 GHz。
根据测试该卡的其他网站显示,RTX 4090D 在 AI 工作负载中比 RTX 4090 大约慢 10%,在游戏中仅慢 5%。讽刺的是,Nvidia从未完全“锁定”RTX 4090D,使中国游戏玩家和专业人士能够将RTX 4090D超频到RTX 4090性能水平。
RTX 4090D 是专门为了遵守美国对中国的出口限制而设计的。这些法律的制定是为了防止中国和非北约国家出于安全原因获得过多的计算能力,特别是人工智能处理能力。这些制裁措施在过去几年中一再发生变化,首先针对的是Nvidia A100和Nvidia H100等数据中心芯片,但后来 RTX 4090 由于“速度太快”10%而成为限制的受害者。
当前用于计算最大允许性能的指标称为 TPP 或总处理能力。这是通过给定位深度的最大计算量,使用 TFLOPS乘以位数来计算的。对于 RTX 4090,在 Tensor 核心上运行 FP8 工作时,TPP 为 660.8 * 8 = 5,286(稀疏性不计算在内)。
新法规显然改变了定义的限制,将“加权 TeraFLOPS”包括在内,但忽略了明确定义其含义。然而,根据语言,我们假设这是指 FP32 TFLOPS。供参考的 RTX 4090 提供 82.6 TFLOPS 的计算能力,而 RTX 4090D 将其降至 73.5 TFLOPS,而 Nvidia 消费类 GPU 的下一步是 RTX 4080 Super,“仅”52.2 TFLOPS。另请注意,这些不断降低的限制开始侵蚀 AMD 的 RX 7900 XTX,后者提供 61.4 TFLOPS 的计算能力。
虽然政府没有具体指出 RTX 4090D 是新限制的原因,但可以肯定的是,该卡将在不久的将来停产。Nvidia 可能会保留 4090D,并为西方受众重新命名……或者它可能只是推出一款再次符合制裁恶作剧的新 GPU。我们将其称为 RTX 4090 DD“双龙”,并为其提供 108 个流式多处理器和 13,824 个 CUDA 核心,或许还有 400W TGP,最重要的是,69.7 TFLOPS 的计算能力。然后,它将再次合规,将数以万计的设备转移到中国,并可能导致允许的出口业绩再次削减。
据报道,新的限制将于 2024 年 4 月 4 日生效。Nvidia 尚未宣布对下限做出任何回应,但它当然会遵守这些限制。但从根本上来说,如果 80 TFLOPS 太快了,而现在 70 TFLOPS 也太快了,那么美国在某个时候需要设定一个硬性限制并坚持下去——否则最终会“禁止”早已停产的 GPU 。这些限制是否完全有效也令人怀疑,因为仍有大量中国客户渴望 GPU。
点这里加关注,锁定更多原创内容
今天是《半导体行业观察》为您分享的第3725期内容,欢迎关注。
『半导体第一垂直媒体』
实时 专业 原创 深度
公众号ID:icbank
喜欢我们的内容就点“在看”分享给小伙伴哦
声明:免责声明:此文内容为本网站转载企业宣传资讯,仅代表作者个人观点,与本网无关。仅供读者参考,并请自行核实相关内容。