CoWoS та передові методи корпусування: як архітектура чипів визначає проєктування центрів обробки даних
Оновлено 11 грудня 2025 року
Оновлення грудня 2025: TSMC демонструє пряме рідинне охолодження кремнію на CoWoS, досягаючи теплового опору 0,055°C/Вт при TDP 2,6+ кВт на інтерпозерах площею 3300 мм². NVIDIA забезпечила понад 70% потужностей TSMC CoWoS-L на 2025 рік. Обсяги поставок GPU Blackwell зростають на 20%+ щоквартально, прямуючи до річних обсягів понад 2 мільйони одиниць. Передове корпусування стає основним обмеженням у постачанні ШІ-прискорювачів.
TSMC продемонструвала пряме рідинне охолодження кремнію, інтегроване в платформу CoWoS, на конференції IEEE ECTC 2025, досягнувши теплового опору від переходу до навколишнього середовища 0,055 °C/Вт при потоці теплоносія 40 мл/с — майже на 15% краще, ніж рідинне охолодження з кришкою та термоінтерфейсними матеріалами.[^1] Демонстрація підтвердила стабільну роботу при TDP понад 2,6 кВт на масивному інтерпозері площею 3300 мм², що підтримує кілька логічних кристалів та стеків HBM. Технологія передового корпусування еволюціонувала від питання напівпровідникового виробництва до основного фактора, що визначає архітектуру живлення та охолодження центрів обробки даних.
NVIDIA забезпечила понад 70% потужностей передового корпусування TSMC CoWoS-L на 2025 рік, при цьому обсяги поставок GPU архітектури Blackwell зростають більш ніж на 20% щоквартально, прямуючи до річних обсягів понад 2 мільйони одиниць.[^2] Розподіл потужностей відображає, як передове корпусування стало критичним обмеженням у постачанні ШІ-прискорювачів. Оператори центрів обробки даних, які планують інфраструктурні інвестиції, повинні розуміти, як технологія корпусування впливає на системи, які вони розгортають, — від вимог до подачі живлення через потреби в охолодженні до фізичних форм-факторів.
Розуміння передового корпусування
Передове корпусування інтегрує кілька кремнієвих кристалів в уніфіковані корпуси, що функціонують як єдині чипи, забезпечуючи можливості, недосяжні для монолітних конструкцій.
Пояснення технології CoWoS
CoWoS (Chip-on-Wafer-on-Substrate — чип на пластині на підкладці) об'єднує кілька кристалів на кремнієвому інтерпозері, який потім з'єднується з підкладкою корпусу.[^3] Кремнієвий інтерпозер має високощільні металеві з'єднання та наскрізні кремнієві перемички (TSV), забезпечуючи надвисоку пропускну здатність та низьку затримку передачі даних між кристалами. Результат — покращена енергоефективність, теплові характеристики та компактний форм-фактор, критичні для ШІ, високопродуктивних обчислень та хмарних навантажень.
На відміну від традиційних однокристальних корпусів, CoWoS забезпечує гетерогенну інтеграцію, об'єднуючи SoC, GPU та стеки пам'яті HBM в одному корпусі.[^3] Інтеграція усуває втрати пропускної здатності та затримки при обміні даними через межі корпусів. Пропускна здатність пам'яті, що обмежує продуктивність ШІ, значно зростає, коли стеки HBM розташовані за міліметри від обчислювальних кристалів, а не через друковану плату.
Варіанти CoWoS
NVIDIA впровадила передове корпусування CoWoS-L, інтегруючи шар перерозподілу (RDL) з частковим кремнієвим інтерпозером (LSI).[^2] CoWoS-L збільшує розмір та площу чипа за рахунок підвищення щільності транзисторів, дозволяючи укладати більше високошвидкісної пам'яті. Порівняно з технологіями CoWoS-S та CoWoS-R, CoWoS-L пропонує кращу продуктивність, вищий вихід придатних та кращу економічну ефективність.
CoWoS-S (кремнієвий інтерпозер) використовує повний кремнієвий інтерпозер, що охоплює всі кристали. Цей підхід забезпечує найменший крок з'єднань, але обмежує розмір корпусу можливостями виробництва кремнієвих інтерпозерів. Поточні корпуси CoWoS-S досягають приблизно 2,5 розмірів ретикля.
CoWoS-R (інтерпозер на основі RDL) замінює кремнієвий інтерпозер органічним шаром перерозподілу, зменшуючи вартість за рахунок щільності з'єднань. Технологія підходить для застосувань, що вимагають великих корпусів, де повні кремнієві інтерпозери стають надмірно дорогими.
Конкуруючі технології
Intel EMIB (Embedded Multi-die Interconnect Bridge — вбудований багатокристальний міст з'єднань) з'єднує чиплети за допомогою мініатюрних кремнієвих мостів, вбудованих безпосередньо в підкладку корпусу, усуваючи потребу у великому кремнієвому інтерпозері.[^4] Цей підхід зменшує як вартість, так і термічну складність порівняно з рішеннями на повних інтерпозерах. EMIB підходить для конструкцій, де кристали обмінюються даними парами, а не вимагають повної mesh-зв'язності.
Технологія Intel Foveros вертикально укладає кристали за допомогою наскрізних кремнієвих перемичок або прямого мідного з'єднання.[^4] 3D-укладання забезпечує високу щільність з'єднань та гетерогенну інтеграцію різних технологічних вузлів ціною жорсткіших термічних вимог та вимог до виходу придатних. Управління тепловим режимом стає особливо складним, коли кристали, що генерують тепло, укладаються вертикально.
TSMC CoWoS-L залишається основним варіантом для високопродуктивних ШІ GPU та прискорювачів з великим обсягом HBM, незважаючи на конкурентні альтернативи.[^4] Виробнича зрілість технології та доведена продуктивність на рівнях потужності ШІ-прискорювачів роблять її вибором за замовчуванням для передових розробок.
Термічні наслідки
Передове корпусування концентрує тепловиділення способами, що кидають виклик традиційним підходам до охолодження.
Проблеми щільності потужності
Корпус CoWoS площею 3300 мм², що розсіює понад 2,6 кВт, представляє щільності потужності, які вимагають складного охолодження, що виходить за межі можливостей повітряного охолодження.[^1] Потужність концентрується в обчислювальних кристалах, що займають лише частину загальної площі корпусу, створюючи термічні гарячі точки, які середня щільність потужності корпусу применшує.
Стеки HBM, що оточують обчислювальні кристали, генерують додаткове тепло, водночас вимагаючи контролю температури для підтримки надійності пам'яті. Специфікації HBM обмежують робочі температури суворіше, ніж витримують логічні кристали. Конструкції охолодження повинні враховувати як пікові температури логічних кристалів, так і розподілені термічні вимоги HBM.
Перехід від GPU потужністю 300 Вт до поточного покоління 700+ Вт та очікуваних корпусів наступного покоління 1000+ Вт зумовлює фундаментальні зміни в термічній архітектурі центрів обробки даних. Підходи повітряного охолодження, що справлялися з попередніми поколіннями, не можуть масштабуватися до поточних рівнів потужності без неприйнятних акустичних або енергетичних втрат.
Інтеграція прямого рідинного охолодження
Пряме рідинне охолодження кремнію TSMC вбудовує мікрофлюїдні канали безпосередньо в структуру кремнію, обходячи термоінтерфейсні матеріали для досягнення майже нульового теплового опору.[^1] Інтегрований в кремній мікроохолоджувач з'єднується з тильною стороною чипа методом дифузійного зварювання, створюючи тісний термічний контакт, недосяжний для підходів на основі TIM.
Технологія забезпечує стабільну роботу на рівнях потужності, які б перевантажили корпуси з кришкою та зовнішніми холодними пластинами. Центрам обробки даних, що розгортають ШІ-прискорювачі наступного покоління, може знадобитися такий рівень термічної інтеграції замість модернізації існуючого охолодження під вищі теплові навантаження.
Інтеграція на рівні корпусу переносить відповідальність за охолодження на виробників напівпровідників та постачальників систем, а не на операторів центрів обробки даних. Організації, що специфікують ШІ-інфраструктуру, повинні розуміти, які термічні рішення використовують обрані ними системи та які вимоги до об'єктів ці рішення висувають.
Вимоги до охолодження об'єктів
Рідинне охолодження на рівні чипа все одно вимагає відведення тепла на рівні об'єкта. Теплове навантаження переміщується від чипа до контуру теплоносія та інфраструктури охолодження центру обробки даних. Проєкти об'єктів повинні враховувати розподіл теплоносія, теплообмінники та кінцеве відведення тепла незалежно від того, наскільки ефективно чипи передають тепло теплоносію.
Стійки високої щільності, що стали можливими завдяки передовому корпусуванню, можуть концентрувати понад 100 кВт в одному місці стійки. Така концентрація створює локалізовані потреби в охолодженні, з якими важко справляються рядні або кімнатні підходи. Теплообмінники на задніх дверях, внутрішньорядні охолоджувальні блоки або інфраструктура прямого рідинного охолодження чипів стають необхідними.
Вимоги до водопостачання та водопідготовки зростають із розгортанням рідинного охолодження. Якість теплоносія впливає як на термічну продуктивність, так і на довговічність обладнання. Центри обробки даних повинні або забезпечити водопідготовку, або специфікувати системи із замкненим контуром, що мінімізують залежність від якості води.
Питання подачі живлення
Передові корпуси вимагають систем подачі живлення, що відповідають підвищеним вимогам до струму та жорсткішим вимогам до стабілізації напруги.
Розміщення стабілізаторів напруги
Подача високого струму до передових корпусів виграє від розміщення стабілізаторів напруги поблизу корпусу. Коротка відстань зменшує резистивні втрати та покращує швидкість реакції на перехідні процеси при швидкій зміні споживання. Конструкції плат дедалі частіше розміщують VRM безпосередньо поруч з корпусами GPU.
Рівні струму, що досягають сотень ампер при напрузі менше 1 В, створюють складні вимоги до розподілу живлення. Кількість шарів PCB та товщина міді збільшуються для передачі струму без надмірних втрат або підвищення температури. Складність і вартість проєктування плат зростають разом із потужністю корпусу.
Проєктування мережі розподілу живлення (PDN) впливає як на ефективність у сталому режимі, так і на стабільність перехідних процесів. ШІ-навантаження демонструють швидкі переходи потужності при запуску та завершенні пакетних обчислень. PDN повинна забезпечувати стрибки струму без провалів напруги, що спричиняють помилки.
Інфраструктура живлення об'єкта
Інфраструктура живлення центру обробки даних повинна враховувати як загальне збільшення потужності, так і збільшення щільності потужності. Стійка, що вимагає 100 кВт, потребує електричної інфраструктури, яку мало який об'єкт забезпечує за замовчуванням. Пропускна здатність шинопроводів, номінали PDU та кількість відгалужених ланцюгів потребують перевірки відповідно до фактичних планів розгортання.
Енергоефективність на рівні об'єкта суттєво впливає на сукупну вартість володіння. Передові корпуси, що досягають кращої продуктивності на ват, зменшують навантаження на охолодження разом з витратами на обчислення. Однак ця перевага реалізується лише за умови ефективної роботи інфраструктури об'єкта в відповідному діапазоні потужностей.
Системи резервного живлення стикаються з новими викликами від ШІ-інфраструктури високої щільності. Потужність ДБЖ та генераторів повинна відповідати піковому навантаженню об'єкта, забезпечуючи час роботи, достатній для коректного завершення роботи. Капітальні витрати на резервне живлення масштабуються із захищеним навантаженням, збільшуючи інфраструктурні інвестиції.
Фізичні форм-фактори
Передове корпусування впливає на фізичні форм-фактори на всіх рівнях системної ієрархії.
Розміри корпусу
Обмеження розміру інтерпозера визначають, скільки кристалів та стеків HBM поміщається в один корпус. Поточні корпуси CoWoS охоплюють кілька розмірів ретикля, наближаючись до меж виробничого обладнання. Збільшення розміру корпусу забезпечує більше можливостей на корпус, але ускладнює конструкції сокетів та плат.
Висота корпусу збільшується з кількістю стеків HBM. Кожен стек HBM додає вертикальний розмір, який повинні враховувати конструкції сокетів та радіаторів. Системні конструкції, що балансують кількість корпусів з обмеженнями висоти, роблять інші компроміси, ніж попередні покоління.
Масиви кулькових виводів (BGA) для передових корпусів включають тисячі з'єднань для живлення, сигналів та землі. Конструкції сокетів повинні надійно контактувати з усіма з'єднаннями, дозволяючи при цьому знімати корпус для обслуговування. Механічна інженерія сокетів з великою кількістю контактів впливає на зручність обслуговування системи.
Проєктування плат та систем
Конструкції материнських плат для передових корпусів виділяють значну площу для подачі живлення, каналів пам'яті та високошвидкісних з'єднань. Площа плати, необхідна на корпус, може обмежувати кількість корпусів на одній платі. Системні конструкції обирають між меншою кількістю великих корпусів або більшою кількістю менших корпусів залежно від вимог навантаження.
Форм-фактори серверів еволюціонують для задоволення вимог передових корпусів. Обмеження висоти в стандартних форм-факторах 1U та 2U конфліктують з рішеннями охолодження для потужних корпусів. Спеціалізовані конструкції ШІ-серверів надають пріоритет термічній продуктивності над щільністю в стійці.
Щільність потужності стійки зростає, оскільки корпуси стають більш потужними при незмінних форм-факторах. Об'єкти, спроєктовані для 10-15 кВт на стійку, виявляють, що ШІ-інфраструктура вимагає 50-100+ кВт на стійку. Невідповідність між встановленою інфраструктурою та вимогами до розгортання створює дорогі ситуації модернізації.
Наслідки для ланцюга постачання
Обмеження потужностей передового корпусування впливають на доступність ШІ-інфраструктури та горизонти планування.
Розподіл потужностей
TSMC планує розширити вісім об'єктів CoWoS у короткостроковій перспективі, включаючи об'єкти в науковому парку ChiaYi та придбані локації Innolux.[^5] Постачальники напівпровідникового обладнання підтверджують, що TSMC та інші гравці, включаючи ASE, Amkor та UMC
[Вміст скорочено для перекладу]