DomAktualnościWąskie gardło w połączeniach wzajemnych 448G: prawdziwym ograniczeniem sztucznej inteligencji nie jest moc obliczeniowa, ale przepustowość systemu

Wąskie gardło w połączeniach wzajemnych 448G: prawdziwym ograniczeniem sztucznej inteligencji nie jest moc obliczeniowa, ale przepustowość systemu

Wąskie gardło w połączeniach wzajemnych 448G: prawdziwym ograniczeniem sztucznej inteligencji nie jest moc obliczeniowa, ale przepustowość





W ciągu ostatnich dwóch lat prawie cała uwaga skupiła się na procesorach graficznych, mocy obliczeniowej i zaawansowanych węzłach procesowych.Wraz ze wzrostem wydajności pojedynczej karty i rozrastaniem się klastrów AI do dziesiątek tysięcy akceleratorów, po cichu wyłoniła się fundamentalna sprzeczność: Dane nie mogą już efektywnie przepływać przez cały system.

Można to zrozumieć za pomocą prostej miejskiej metafory: Węzły obliczeniowe są jak drapacze chmur – z każdym rokiem stają się wyższe i potężniejsze.Jednak drogi łączące te budynki nigdy nie były zsynchronizowane.Wynik jest jasny — wydajny sprzęt jest gotowy, jednak ruch danych jest poważnie przeciążony.

Najbardziej dający do myślenia pogląd zawarty w tym raporcie jest uderzający: W erze 448G chipy, a nawet moduły optyczne są w zasadzie w pełni dojrzałe i gotowe do masowego wdrożenia. Prawdziwym wąskim gardłem jest długo zaniedbywany sprzęt: złącza, łącza fizyczne i cały ekosystem połączeń elektrycznych.

Kiedy główne wyzwanie zmienia się z niewystarczająca moc obliczeniowa do niewystarczająca przepustowość systemu, a wąskie gardło przesuwa się z wnętrza chipa pomiędzy chipy i stojaki, logika konkurencji infrastruktury AI zostaje całkowicie przepisana.

Główny temat raportu

Gwałtowny popyt na sztuczną inteligencję popycha centra danych w erę szybkich połączeń wzajemnych 448G.Wyzwaniem dla branży nie jest już wykonalność technologiczna, ale to, czy pełny system połączeń wzajemnych – w tym SerDes, złącza i łącza optyczne – może dotrzymać kroku wykładniczemu rozwojowi sztucznej inteligencji.

Istota problemu: ekspansja AI równa się wybuchowemu zapotrzebowaniu na połączenie

W raporcie przedstawiono podstawową ocenę: wielkoskalowe klastry sztucznej inteligencji powodują gwałtowny, wykładniczy wzrost przepustowości centrów danych.Przyszły rozwój połączeń międzysystemowych definiują trzy główne ścieżki skalowania:

  • Skalowanie w górę (wewnątrzserwerowe): Szybsze SerDes 448 G/ścieżkę i większa gęstość upakowania
  • Skalowanie w poziomie (od stojaka do stojaka): Rozszerzone kanały optyczne z transmisją o dużej gęstości 8/16/32 linii
  • Skalowanie w poprzek (między centrami danych): Wielkoskalowa sieć optyczna do planowania zasobów na duże odległości

Podstawowy wniosek: największym problemem sztucznej inteligencji nie jest już niewystarczająca moc obliczeniowa, ale… niewystarczająca zdolność połączeń wzajemnych.

Trend ogólny: cała branża zmierza w stronę połączeń wzajemnych 448G

Raport skupia się na podstawowym standardzie: 448G na linię.

Powód 448G staje się nieunikniony: Obsługuj bardzo duże wymagania dotyczące przepustowości klastra AI i twórz możliwości przełączania na poziomie PB.

Istnieją już dojrzałe podstawy techniczne: Proces 3 nm CMOS zapewnia szerokość pasma wysokiej częstotliwości ponad 100 GHz, Szybki przetwornik cyfrowo-analogowy/ADC o prędkości 224GS/s, oraz wysokowydajną architekturę SerDes nowej generacji.

W skrócie: sprzęt po stronie chipa jest w pełni przygotowany na aktualizację 448G.

Prawdziwe wąskie gardło: nie chipy, ale ograniczenia łącza fizycznego

Jest to najbardziej krytyczne spostrzeżenie zawarte w raporcie.

1. Poważne ograniczenia fizyczne SerDes
Wymagająca szerokość pasma operacyjnego 112 GHz, jitter poniżej 100 fs i bardzo wysokie wymagania dotyczące współczynnika SNR, co sprawia, że szybkie elektryczne SerDes zbliżają się do fizycznych granic.

2. Złącza stają się najkrótszą płytką
Istniejące struktury OSFP ledwo obsługują modulację PAM6. Tradycyjne złącza nie mogą dostosować się do PAM4 w scenariuszach o dużej szybkości. Jasny wniosek: przyszłe zastosowania 448G nie mogą opierać się na dzisiejszych rozwiązaniach w zakresie złączy.

3. Poważne ryzyko integralności sygnału
Utrata wysokiej częstotliwości, zakłócenia przesłuchu i wąskie gardła przejścia BGA ograniczają stabilną transmisję. Rozwiązania branżowe skupiają się na elastycznych połączeniach wzajemnych i architekturach połączeń 2D o dużej gęstości.

Konkurs na schemat modulacji: PAM4 vs PAM6 vs PAM8

W raporcie dokonano dogłębnego porównania trzech głównych formatów modulacji:

  • PAM4: Wysokie zapotrzebowanie na przepustowość, ale najbardziej dojrzałe, stabilne i opłacalne
  • PAM6: Wyższy próg SNR, większe trudności w projektowaniu
  • PAM8 : Większa gęstość teoretyczna przy ograniczonych korzyściach praktycznych i nadmiernej złożoności

Kluczowy wniosek: dodatkowe korzyści wynikające z modulacji wyższego rzędu nie mogą zrównoważyć rosnących kosztów i ryzyka technicznego. Nawet do 2028 r. PAM4 pozostanie jedynym niezawodnym i głównym rozwiązaniem do wdrożeń na dużą skalę.

Połączenie optyczne: w pełni dojrzałe, aby przejąć przyszłe aktualizacje

Technologia optyczna stała się najbardziej niezawodnym przełomem:

  • Jednopasmowa transmisja optyczna 448G została w pełni sprawdzona
  • Obsługa transmisji na duże odległości do 2 km i wielkoskalowego systemu przełączania o przepustowości 3,2 Tb/s
  • Bezsterownikowa technologia TFLN i zaawansowane modulatory EML dodatkowo zmniejszają zużycie energii

Moduły optyczne nie stanowią wąskiego gardła – stanowią przełom w zakresie połączeń wzajemnych AI nowej generacji.

Ostateczny wyrok główny

  1. Napędzana sztuczną inteligencją przepustowość globalnych centrów danych w pełni wkracza w erę 448G.
  2. Chipy i moduły optyczne są gotowe pod względem technicznym, natomiast łącza elektryczne, złącza i dotychczasowa infrastruktura pozostają w tyle.
  3. W przyszłości konkurencja w zakresie mocy obliczeniowej AI nie będzie już skupiać się na wydajności pojedynczego chipa. Podstawowa konkurencyjność zostanie zdefiniowana przez możliwość połączeń wzajemnych na poziomie systemu.

Podsumowanie

Sztuczna inteligencja złamała pierwotną równowagę między przetwarzaniem a transmisją. W nowej erze 448G wzajemne połączenia zastępują moc obliczeniową jako podstawowe ograniczenie. Kto opanuje szybkie łącza, złącza i połączenia optyczne, zajmie dominującą pozycję w kolejnej fali konkurencji w zakresie infrastruktury AI.