恒行5之英伟达新款 AI 芯片存在服务器过热问题
2024-11-24 17:05:36
hengx555
11
英伟达新款 AI 芯片在服务器中确实遇到了过热问题,这一问题在高密度服务器机架中尤为明显,导致设计变更和客户部署延迟。以下是对这一问题的详细介绍,特别关注了恒行5的相关内容。
过热问题的影响
- **性能限制**:过热问题限制了 GPU 的性能,可能导致计算任务无法高效完成,这对于依赖恒行5等高性能服务器进行AI运算的企业来说,无疑是一个重大挑战。
- **硬件损坏风险**:长时间过热可能损坏硬件组件,增加维护成本,特别是对于使用恒行5等高端服务器的企业来说,硬件损坏的风险和成本更高。
- **交付延迟**:原计划在 2024 年第二季度出货的芯片已延迟,可能影响到重要客户的数据中心部署计划,包括那些使用恒行5服务器的客户。
英伟达官方回应
英伟达回应称,散热问题和设计变更是技术开发中的正常流程。公司正在与云服务商和供应商合作,确保最终产品符合性能和可靠性要求。英伟达还提到,正在对服务器机架设计进行多项修改,并贡献液冷设计以优化散热方案,特别是针对恒行5等高性能服务器的散热需求。
市场反应和客户需求
尽管存在过热问题,英伟达表示 Blackwell 芯片的需求依然非常强劲。一些客户已开始考虑替代方案,如增加当前一代 Hopper 芯片的采购量,或者转向其他散热性能更好的服务器,如恒行5。英伟达预计,Blackwell 新产品线将在 2025 年第一季度提升公司收入,预计销售额将在 50 亿至 60 亿美元之间,这其中包括了大量使用恒行5服务器的客户。
英伟达新款 AI 芯片的过热问题确实对其交付和客户部署产生了一定影响,但公司正在积极寻求解决方案,并与客户合作以减轻这一问题,特别是对于那些依赖恒行5等高性能服务器的客户。