博客
关于 GPU 基础设施、AI 和数据中心的深度洞察。
AI 推理的负载均衡:在 1000+ GPU 上分发请求
面向AI的分解式计算:可组合基础设施架构
特征存储与MLOps数据库:生产级机器学习基础设施
2026年世界模型竞赛:LeCun、DeepMind和World Labs如何重新定义通向AGI的道路
Yann LeCun为AMI Labs筹集5亿欧元,DeepMind的Genie 3实时模拟3D世界。2026年,构建理解物理规律的AI的竞赛可能将超越大语言模型。
AI 工作负载优化配置:将 GPU 资源与模型需求精准匹配
通过优化配置框架,将 GPU 资源分配从猜测转变为工程学科。
Gemini 3 Flash:谷歌速度冠军以六分之一成本媲美 GPT-5.2
谷歌 Gemini 3 Flash 在 GPQA Diamond 测试中达到 90.4%,SWE-bench 测试中达到 78%,每百万 token 仅需 0.50 美元。这款最快的前沿模型对 AI 基础设施意味着什么。
开源AI模型缩小差距:DeepSeek、Qwen3和Llama 4现已比肩GPT-5
开源与闭源AI模型之间的性能差距已缩小至0.3%。这对企业AI基础设施意味着什么。
NVIDIA 物理AI亮相 NeurIPS:Alpamayo-R1 与 Cosmos 生态系统
NVIDIA 发布 Alpamayo-R1,首个用于自动驾驶的开源推理视觉-语言-动作模型。Cosmos 平台扩展了 LidarGen 和 ProtoMotions3。Figure AI、1X 等公司正在采用。
推理时扩展:AI推理能力的新训练前沿
测试时计算成为AI扩展的新前沿。ThreadWeaver实现1.5倍加速。P1在物理奥林匹克竞赛中获得金牌。DeepSeek-R1以70%更低成本匹敌o1。基础设施影响深远。
英伟达 NeurIPS 2025:Alpamayo-R1 与物理 AI 重塑自动驾驶系统
英伟达开源物理 AI 模型为自动驾驶系统带来全新基础设施需求。
DeepSeek-V3.2:开源AI如何以10倍更低成本匹敌GPT-5和Gemini 3性能
DeepSeek-V3.2在数学推理方面与GPT-5相当,成本却降低了10倍。开源,MIT许可证,通过架构创新实现了前沿AI的经济效益。