博客

关于 GPU 基础设施、AI 和数据中心的深度洞察。

新加坡270亿美元AI基础设施热潮：数据中心部署的机遇

马来西亚于2025年10月在柔佛古来建成首个搭载NVIDIA技术的主权AI数据中心。这座600MW的杨忠礼电力设施配备NVIDIA GB200 NVL72 GPU用于AI训练，并由500MW太阳能供电...

OpenAI因可预防的存储故障损失1亿美元。通过GPU直连备份、不可变存储和200GB/s恢复能力保护PB级训练数据。

提示注入在OWASP 2025年LLM应用十大安全风险中持续占据第一位——自2023年首次发布以来从未改变。微软报告称间接提示注入是最广泛使用的AI攻击技术……

OpenAI损失1亿美元数据，特斯拉FSD因数据损坏延迟6个月。通过GPU直连备份实现200GB/s吞吐量和不可变勒索软件防护，保护AI数据安全。

B200 在 700W 功耗下提供 2.5 倍于 H100 的性能，而 GB200 Superchip 在 1,200W 功耗下实现 30 倍推理速度。深入对比 AI 部署的功耗、散热与投资回报。

直接芯片冷却将PUE从1.58降至1.15，支持1,200W GPU运行。CoolIT在25°C水温下实现H100显卡62°C运行温度。运营成本降低35%。

拉美数据中心市场从2024年的72亿美元增长至2030年的143亿美元（年复合增长率12%）。巴西启动3500亿美元十年战略。字节跳动承诺投资380亿美元建设巴西数据中心。OpenAI宣布在巴塔哥尼亚投资250亿美元建设Stargate阿根廷项目...

构建可扩展的开发环境，为AI团队提供高效的GPU资源访问。

推测解码正从研究阶段走向生产标准。NVIDIA在H200 GPU上展示了3.6倍的吞吐量提升。vLLM和TensorRT-LLM均已包含原生支持。草稿模型并行提议5-8个token进行验证——充分利用单token生成时未被充分使用的GPU容量。输出质量不变，延迟降低2-3倍。