ราคาเช่า GPU บนคลาวด์ร่วงหนัก: ค่าเช่า H100 ลดลง 64% เมื่ออุปทานไล่ทันความต้องการ
10 ธ.ค. 2025 เขียนโดย Blake Crosley
ตลาดเช่า GPU ประสบกับการปรับตัวอย่างรุนแรง โดยราคา H100 ลดลงจาก $8 ต่อชั่วโมงเหลือ $2.85-3.50 ต่อชั่วโมง ซึ่งลดลง 64% จากจุดสูงสุดในช่วงปลายปี 20241 ดัชนี Silicon Data H100 Rental Index อยู่ที่ $2.36 ในเดือนมิถุนายน 2025 ลดลงจาก $3.06 ในเดือนกันยายน 2024 หรือลดลง 23% ในเวลาไม่ถึงหนึ่งปี2 สำหรับองค์กรที่กำลังวางแผนโครงสร้างพื้นฐาน AI การร่วงของราคาสร้างโอกาสเชิงกลยุทธ์พร้อมกับคำถามเกี่ยวกับพลวัตตลาดและทิศทางราคาในอนาคต
AWS ลดราคา H100 ประมาณ 44% ในเดือนมิถุนายน 2025 ทำให้ P5 instances เข้าสู่ระดับที่ตลาดคาดหวัง3 GCP's spot H100 อยู่ที่ $2.25 (A3-High) ขณะที่ AWS spot มักอยู่ใกล้ $2.504 การทำสัญญาระยะยาวสามารถทำให้ต้นทุน H100 ลดลงเหลือเพียง $1.90-$2.10 ต่อ GPU-hour5 ผู้ให้บริการบางรายเสนอเช่า H100 ในราคาต่ำสุดเพียง $0.99-$1 ต่อชั่วโมง6
ปัจจัยที่ทำให้ราคาลดลง
หลายปัจจัยมาบรรจบกันจนทำให้เกิดการปรับตัวของตลาด
การขยายตัวของอุปทาน
ปัญหาการขาดแคลน H100 ที่เป็นตัวกำหนดตลาดในปี 2023 และต้นปี 2024 ได้คลี่คลายลงอย่างมาก Hyperscalers และศูนย์ข้อมูลระดับภูมิภาคได้เพิ่มกำลังการผลิตใหม่จำนวนมาก7 ตลาดที่เคยเป็นของผู้ขายเริ่มกลับสู่ภาวะปกติเมื่อการผลิตไล่ทันคำสั่งซื้อที่สั่งไว้ในช่วงขาดแคลน
พันธมิตรผู้ผลิตของ NVIDIA ได้ขยายกำลังการผลิตตลอดปี 2024 และ 2025 การลงทุนด้านกำลังการผลิตที่ทำในช่วงขาดแคลนตอนนี้ส่งมอบ GPU เข้าสู่ตลาดที่มีอุปทานและอุปสงค์สมดุลมากขึ้น การเปลี่ยนผ่านจากความขาดแคลนสู่ความพร้อมใช้งานเปลี่ยนแปลงพลวัตของราคาอย่างสิ้นเชิง
การแข่งขันที่รุนแรง
ผู้ให้บริการใหม่กว่า 300 รายเข้าสู่ตลาด H100 cloud ในปี 2025 นำไปสู่การแข่งขันด้านราคาอย่างดุเดือด8 ผู้ให้บริการรายเล็กที่เชี่ยวชาญเฉพาะทางเช่น RunPod และ Vast.ai เสนอราคาต่ำสุดเพียง $1.80-$1.87 ต่อชั่วโมง9 การแข่งขันบังคับให้ผู้ให้บริการรายใหญ่ต้องปรับราคาหรือสูญเสียลูกค้า
อุปสรรคในการเข้าสู่ตลาดบริการ GPU cloud ที่ต่ำทำให้มีผู้เข้าตลาดอย่างรวดเร็ว องค์กรที่เข้าถึงศูนย์ข้อมูลและมีเงินทุนสามารถซื้อหรือเช่า GPU และเสนอบริการ cloud โครงสร้างตลาดที่กระจายตัวทำให้การแข่งขันด้านราคารุนแรงกว่าบริการ cloud แบบดั้งเดิมที่มีอุปสรรคสูงกว่า
วิวัฒนาการของอุปสงค์
สตาร์ทอัพ AI ได้เปลี่ยนโฟกัสจากการ train โมเดลขนาดใหญ่ไปเป็นการ fine-tune โมเดล open-source ที่มีอยู่ ทำให้ความต้องการเข้มข้นสำหรับ GPU cluster ขนาดใหญ่ที่สุดลดลง10 งาน inference แม้จะเติบโตอย่างรวดเร็ว แต่มีลักษณะที่แตกต่างจาก training—กระจายตัวมากขึ้น ความต้องการต่อ instance ต่ำกว่า และไวต่อราคามากกว่า
การมีโมเดล open-source ที่มีความสามารถเช่น Llama, Mistral และ DeepSeek ลดความจำเป็นในการ train จากศูนย์ที่มีราคาแพง องค์กรสามารถบรรลุความสามารถ AI ที่แข่งขันได้ผ่านการ fine-tune แทนการ train foundation model การเปลี่ยนแปลงนี้เปลี่ยนองค์ประกอบของความต้องการ GPU
ผลกระทบต่อตลาด
การร่วงของราคาส่งผลต่อผู้เข้าร่วมตลาดต่างๆ ในรูปแบบที่แตกต่างกัน
นักลงทุนโครงสร้างพื้นฐาน
องค์กรที่ซื้อ GPU ในช่วงราคาสูงสุดเผชิญกับสถานการณ์ทางเศรษฐกิจที่ท้าทาย การวิเคราะห์ชี้ว่าเมื่อราคาเช่า H100 ลดลงต่ำกว่า $1.65 ต่อชั่วโมง รายได้จะไม่สามารถคืนทุนได้11 ราคาต้องเกิน $2.85 ต่อชั่วโมงเพื่อเอาชนะอัตราผลตอบแทนภายในที่ได้จากทางเลือกตลาดหุ้น12
เกณฑ์ความสามารถทำกำไรสร้างแรงกดดันพื้นราคา ผู้ให้บริการที่ไม่สามารถดำเนินงานต่อที่ราคาปัจจุบันจะออกจากตลาด ซึ่งในที่สุดจะทำให้อุปทานคงที่ การคัดออกอาจใช้เวลาหลายไตรมาสเนื่องจากผู้ประกอบการที่มีโครงสร้างต้นทุนต่างกันแข่งขันกัน
ลูกค้า cloud
องค์กรที่เช่ากำลัง GPU ได้รับประโยชน์โดยตรงจากราคาที่ลดลง โครงการที่เคยไม่คุ้มค่าที่ $8 ต่อชั่วโมงกลายเป็นเป็นไปได้ที่ $2.50 ต่อชั่วโมง การเข้าถึงได้นี้ทำให้การทดลองและการ deploy AI กว้างขวางขึ้น
อย่างไรก็ตาม ความผันผวนของราคาทำให้การวางแผนซับซ้อน องค์กรที่ผูกมัดกับกำลัง GPU ระยะยาวเผชิญกับความไม่แน่นอนว่าราคาปัจจุบันเป็นมูลค่าที่เหมาะสมหรือเป็นเพียงอุปทานล้นชั่วคราว สัญญาระยะสั้นให้ความยืดหยุ่นแต่อาจพลาดราคาที่ดีหากอุปทานตึงตัว
ตำแหน่งของ Hyperscaler
CEO ของ IBM Arvind Krishna ตั้งคำถามต่อสาธารณะว่าการลงทุนโครงสร้างพื้นฐาน AI ของ hyperscaler จะสร้างผลตอบแทนหรือไม่ โดยระบุว่าคณิตศาสตร์ "ไม่มีทาง" เป็นไปได้ที่ระดับการใช้จ่ายปัจจุบัน13 การร่วงของราคา GPU เป็นหลักฐานสนับสนุนฝ่ายที่สงสัยในขณะที่เป็นประโยชน์ต่อผู้บริโภค GPU
CEO ของ Amazon Andy Jassy โต้แย้งว่ากำลังการผลิตถูกใช้ "เร็วเท่าที่เราใส่เข้าไป" บ่งชี้ถึงอุปสงค์ที่ยั่งยืนแม้ราคาจะลดลง14 การเติบโตของปริมาณอาจชดเชยการลดลงของราคา แต่มาร์จิ้นเผชิญแรงกดดันทั่วทั้งอุตสาหกรรม
แนวโน้มเจเนอเรชันถัดไป
เส้นทางราคา H100 ให้ข้อมูลสำหรับความคาดหวังของ GPU รุ่นใหม่
การเปิดตัว Blackwell
GPU NVIDIA Blackwell เริ่มจัดส่งแล้ว โดยระบบ GB200 ถึงมือลูกค้า สถาปัตยกรรมรุ่นถัดไปเสนอการปรับปรุงประสิทธิภาพอย่างมากเหนือ H100 ความพร้อมใช้งาน Blackwell เบื้องต้นยังจำกัด โดยมีราคาพรีเมียมสะท้อนความขาดแคลน
ราคา H100 อาจลดลงอีกเมื่อความพร้อมใช้งาน Blackwell เพิ่มขึ้น องค์กรที่พอใจกับประสิทธิภาพ H100 สามารถได้ประโยชน์จากการกัดกร่อนราคาที่ดำเนินต่อไป ผู้ที่ต้องการความสามารถ Blackwell จะต้องจ่ายพรีเมียมจนกว่าอุปทานจะกลับสู่ปกติ
การคาดการณ์ระยะกลาง
การคาดการณ์ระยะกลางชี้ว่าอาจมีการลดลง 10-20% เมื่อ GPU B200 เปิดตัวในวงกว้างในปี 202615 วงจรการเปิดตัวอาจทำซ้ำรูปแบบ H100: ความขาดแคลนเบื้องต้นพร้อมราคาพรีเมียมตามด้วยการขยายอุปทานและการกลับสู่ปกติของราคา
องค์กรควรพิจารณาจังหวะเวลาของ GPU generation เมื่อวางแผนการลงทุนโครงสร้างพื้นฐาน การรอรุ่นใหม่ให้ประโยชน์ด้านประสิทธิภาพแต่ทำให้การ deploy ล่าช้า ฮาร์ดแวร์รุ่นปัจจุบันที่ราคาลดลงทำให้สามารถ deploy ได้ทันที
การเปรียบเทียบราคาปัจจุบัน
| ผู้ให้บริการ | H100 On-Demand | H100 Spot | อัตราสัญญา |
|---|---|---|---|
| AWS P5 | $3.50/hr | ~$2.50/hr | $1.90-2.10/hr (1yr) |
| GCP A3-High | $3.25/hr | $2.25/hr | ~$2.00/hr (1yr) |
| Azure ND H100 | $3.40/hr | ~$2.60/hr | ~$2.15/hr (1yr) |
| RunPod | $2.39/hr | $1.87/hr | N/A |
| Vast.ai | แปรผัน | $1.80-2.50/hr | N/A |
| Lambda | $2.49/hr | N/A | $1.99/hr (reserved) |
ราคา ณ เดือนธันวาคม 2025 ราคา Spot ผันผวนตามความพร้อมใช้งาน
กรอบการตัดสินใจ: เช่า vs ซื้อ vs รอ
| สถานการณ์ | คำแนะนำ | เหตุผล |
|---|---|---|
| ภาระงานแปรผัน (<50% utilization) | เช่า (spot) | ความยืดหยุ่นสำคัญกว่าการประหยัดจากการเป็นเจ้าของ |
| ภาระงานคงที่ (>70% utilization) | ประเมินการเป็นเจ้าของ | สามารถถึงจุดคุ้มทุนได้ที่ราคาปัจจุบัน |
| ใช้จ่าย GPU >$100K/เดือน | เป็นเจ้าของโครงสร้างพื้นฐาน | ROI ชัดเจนที่การใช้งานอย่างต่อเนื่อง |
| แนวโน้ม 12 เดือนไม่แน่นอน | เช่าระยะสั้น | หลีกเลี่ยงสินทรัพย์ค้างหากอุปสงค์เปลี่ยน |
| Training โมเดลขนาดใหญ่ | ซื้อหรือ reserved | กำลังการผลิตที่สม่ำเสมอสำคัญมาก |
การวิเคราะห์จุดคุ้มทุน: - ราคาซื้อ H100: ~$25,000-30,000 ต่อ GPU - ที่ค่าเช่า $2.50/hr: 10,000-12,000 ชั่วโมงถึงจุดคุ้มทุน (~14-16 เดือนที่ 100% utilization) - ที่ค่าเช่า $1.65/hr: ผู้ให้บริการไม่สามารถคืนทุนได้11 - เกณฑ์ความสามารถทำกำไร: $2.85/hr เพื่อเอาชนะ IRR ตลาดหุ้น12
ขั้นตอนที่ปฏิบัติได้: 1. ตรวจสอบการใช้จ่ายปัจจุบัน: คำนวณต้นทุนต่อชั่วโมงที่แท้จริงสำหรับการใช้ GPU ทั้งหมด 2. ประเมิน utilization: วัดการใช้กำลังการผลิตจริง vs ที่จองไว้ 3. ประเมินตัวเลือกสัญญา: เปรียบเทียบราคา reserved 1 ปี vs on-demand 4. พิจารณาแบบ hybrid: ซื้อสำหรับ baseline เช่าสำหรับ burst capacity
คำแนะนำจากผู้เชี่ยวชาญ
การตัดสินใจด้านโครงสร้างพื้นฐานในตลาดที่ผันผวนได้ประโยชน์จากมุมมองที่มีประสบการณ์
เครือข่ายวิศวกรภาคสนาม 550 คนของ Introl สนับสนุนองค์กรในการนำทางเศรษฐศาสตร์โครงสร้างพื้นฐาน GPU16 บริษัทได้อันดับที่ 14 ใน Inc. 5000 ปี 2025 ด้วยการเติบโตสามปี 9,594%17
ความเชี่ยวชาญใน 257 สถานที่ทั่วโลก ให้ข้อมูลเชิงลึกของตลาดโดยไม่คำนึงถึงภูมิศาสตร์18 คำแนะนำจากผู้เชี่ยวชาญช่วยให้องค์กรตัดสินใจอย่างมีข้อมูลเมื่อราคาพัฒนาไป
ประเด็นสำคัญ
สำหรับทีมจัดซื้อ: - ราคา H100 ลดลง 64% จาก $8/hr เหลือ $2.85-3.50/hr - ผู้ให้บริการใหม่ 300+ รายทำให้การแข่งขันรุนแรง - ราคา Spot (GCP $2.25, AWS $2.50) ให้มูลค่าดีที่สุดสำหรับภาระงานที่ยืดหยุ่น
สำหรับผู้วางแผนโครงสร้างพื้นฐาน: - จุดคุ้มทุนสำหรับการเป็นเจ้าของ: 14-16 เดือนที่ 100% utilization - พื้นราคาความสามารถทำกำไรของผู้ให้บริการ: ~$1.65/hr (ราคาไม่น่าจะลดลงมากกว่านี้) - ราคาสัญญา ($1.90-2.10/hr) ดีกว่า on-demand 40%+
สำหรับการวางแผนเชิงกลยุทธ์: - ตลาดกลับสู่ปกติหลังความขาดแคลน 2023-2024—ไม่ใช่การลดลงชั่วคราว - การเปิดตัว Blackwell อาจดันราคา H100 ลงอีกในปี 2026 - ความยืดหยุ่นของการเช่ามีคุณค่าเมื่อเทคโนโลยีวิวัฒนาการอย่างรวดเร็ว
แนวโน้ม
การร่วงของราคา GPU cloud เป็นตัวแทนการกลับสู่ปกติของตลาดหลังสภาวะขาดแคลนของปี 2023-2024 องค์กรได้ประโยชน์จากการเข้าถึง GPU ที่ดีขึ้นอย่างมาก ทำให้การ deploy AI กว้างขวางขึ้น สภาพแวดล้อมราคาอาจคงอยู่เมื่อการเติบโตของอุปทานยังคงตอบสนองอุปสงค์ โดยการเปิดตัวรุ่นถัดไปอาจขยายรูปแบบนี้
องค์กรควรใช้ประโยชน์จากราคาปัจจุบันสำหรับความต้องการเร่งด่วนในขณะที่รักษาความยืดหยุ่นสำหรับวิวัฒนาการของตลาด กลยุทธ์ที่ประสบความสำเร็จที่สุดจะสมดุลความเร่งด่วนในการ deploy กับการพิจารณาจังหวะตลาด โดยใช้ความยืดหยุ่นของการเช่าเพื่อหลีกเลี่ยงการผูกมัดเงินทุนก่อนเวลาในตลาดที่วิวัฒนาการอย่างรวดเร็ว
เอกสารอ้างอิง
ความเร่งด่วน: สูง — การเปลี่ยนแปลงตลาดที่มีผลกระทบต่อการจัดซื้อทันที จำนวนคำ: ~1,800
-
Thunder Compute. "AI GPU Rental Market Trends December 2025." December 2025. https://www.thundercompute.com/blog/ai-gpu-rental-market-trends ↩
-
Silicon Data. "H100 Rental Market Cools in September." September 2025. https://www.silicondata.com/blog/h100-rental-market-update-september-2025 ↩
-
Thunder Compute. "AI GPU Rental Market Trends December 2025." December 2025. ↩
-
IntuitionLabs. "H100 Rental Prices: A Cloud Cost Comparison." November 2025. https://intuitionlabs.ai/articles/h100-rental-prices-cloud-comparison ↩
-
IntuitionLabs. "H100 Rental Prices: A Cloud Cost Comparison." November 2025. ↩
-
Thunder Compute. "AI GPU Rental Market Trends December 2025." December 2025. ↩
-
Silicon Data. "H100 Rental Market Cools in September." September 2025. ↩
-
Thunder Compute. "AI GPU Rental Market Trends December 2025." December 2025. ↩
-
IntuitionLabs. "H100 Rental Prices: A Cloud Cost Comparison." November 2025. ↩
-
Thunder Compute. "AI GPU Rental Market Trends December 2025." December 2025. ↩
-
Cybernews. "AI boom paradox leads to GPU rental market crash." 2025. https://cybernews.com/tech/gpu-rental-prices-are-crashing/ ↩↩
-
Cybernews. "AI boom paradox leads to GPU rental market crash." 2025. ↩↩
-
Fortune. "IBM CEO warns there's 'no way' hyperscalers will turn a profit." December 2025. https://fortune.com/2025/12/03/ibm-ceo-no-way-hyperscalers-google-amazon-turn-profit-data-center-spending/ ↩
-
CIO Dive. "'We're not dabbling here': AWS backs infrastructure investments." December 2025. https://www.ciodive.com/news/aws-ai-cloud-infrastructure-capacity-microsoft-google/746998/ ↩
-
Thunder Compute. "AI GPU Rental Market Trends December 2025." December 2025. ↩
-
Introl. "Company Overview." Introl. 2025. https://introl.com ↩
-
Inc. "Inc. 5000 2025." Inc. Magazine. 2025. ↩
-
Introl. "Coverage Area." Introl. 2025. https://introl.com/coverage-area ↩