博客

关于 GPU 基础设施、AI 和数据中心的深度洞察。

Showing: AI/ML运维 × Clear filter

数据中心AIOps：使用大语言模型管理AI基础设施

Yann LeCun为AMI Labs筹集5亿欧元，DeepMind的Genie 3实时模拟3D世界。2026年，构建理解物理规律的AI的竞赛可能将超越大语言模型。

通过优化配置框架，将 GPU 资源分配从猜测转变为工程学科。

谷歌 Gemini 3 Flash 在 GPQA Diamond 测试中达到 90.4%，SWE-bench 测试中达到 78%，每百万 token 仅需 0.50 美元。这款最快的前沿模型对 AI 基础设施意味着什么。

开源与闭源AI模型之间的性能差距已缩小至0.3%。这对企业AI基础设施意味着什么。

NVIDIA 发布 Alpamayo-R1，首个用于自动驾驶的开源推理视觉-语言-动作模型。Cosmos 平台扩展了 LidarGen 和 ProtoMotions3。Figure AI、1X 等公司正在采用。

测试时计算成为AI扩展的新前沿。ThreadWeaver实现1.5倍加速。P1在物理奥林匹克竞赛中获得金牌。DeepSeek-R1以70%更低成本匹敌o1。基础设施影响深远。

英伟达开源物理 AI 模型为自动驾驶系统带来全新基础设施需求。

DeepSeek-V3.2在数学推理方面与GPT-5相当，成本却降低了10倍。开源，MIT许可证，通过架构创新实现了前沿AI的经济效益。