Interkonnessjoni Ottika ta 'Veloċità Għolja: Soluzzjonijiet taċ-Ċentru tad-Data

Apr 27, 2026|

L-aħħar kwart kellna vapur tal-klijent lura erbgħin modulu 400G DR4 li jsostni flaps tal-link bl-addoċċ fuq l-iswiċċijiet Arista 7060X5 tagħhom. Qabel saħansitra ftaħna l-burokrazija tal-RMA, l-inġinier tat-test tagħna staqsa mistoqsija waħda: spezzjonajt il-Konnetturi MPOqabel l-installazzjoni? Huma ma kellhomx. Bgħatna l-moduli permezz tar-rigressjoni sħiħa tagħna, dijagrammi tal-għajnejn nodfa, BER taħt 1E-13 fl-erba' korsiji kollha,Qari DDM nominali. Imbagħad tlabniehom jibagħtu ritratti tal-uċuħ tat-trunk cable tagħhom-taħt mikroskopju tal-fibra. Kull konnettur wieħed kellu kontaminazzjoni tal-partikuli. Erbgħin modulu, żero difetti. Il-problema kienet it-trab.

 

Naraw xi verżjoni ta 'dan kull xahar. Skjeramenti ta 'interkonnessjoni ottika b'veloċità għolja fi kwalunkwe skala jolqtu l-istess ħajt, u n-numri jsostnuh: x'imkien bejn 65% u 70% tal-fallimenti kollha tal-link 400G u 800G jintraċċaw lura għall-kontaminazzjoni tal-konnettur, mhux għal difetti tat-transceiver. (Data tal-qasam IEEE 802.3 permezz ta' AscentOptics) Inġibu dan l-ewwel għax jifforma kif naħsbu dwar id-deċiżjoni kollha tal-interkonnessjoni. Il-modulu kważi qatt ma huwa l-iktar ħolqa dgħajfa. Is-saff fiżiku madwaru huwa.

Microscopic view of an MPO fiber optic connector end-face showing severe dust and particulate contamination on the four precision glass cores of a 400G module, illustrating the number one cause of link failure.

 

Il-Mudell tat-Traffiku Tiegħek Jiddeċiedi l-Arkitettura tal-Interkonnessjoni Ottika Tiegħek

 

Kulħadd jibda bin-numru tal-parti.QSFP-DD jew OSFP, SR jew DR, multimode jew single-mode. Nagħmluha wkoll. Iżda l-iskjeramenti li marru tajjeb għall-klijenti tagħna kollha bdew x'imkien ieħor: it-traffiku kif jidher fil-fatt?

It-taħriġ ta'-AI fuq skala kbira jiġġenera-għal-kollha komunikazzjoni tal-GPU li tirriżulta li tkun prevedibbli b'mod sorprendenti fuq skali ta' żmien minn minuti sa sigħat. Google jisfrutta dan bi swiċċijiet taċ-ċirkwiti ottiċi fin-netwerk Jupiter tagħhom, billi jikkonfiguraw mill-ġdid il-mogħdijiet tad-dawl fiżiċi bejn l-ixkafef minflok ma jaqilbu l-pakketti. Ir-riżultati ppubblikati tagħhom minn għaxar snin ta 'użu tal-produzzjoni: 41% tnaqqis tal-enerġija, 30% inqas capex, u 50x titjib fl-uptime tad-drapp kontra l-arkitettura Clos preċedenti tagħhom. (Google SIGCOMM'22) Dawk in-numri huma reali, iżda jappartjenu għal kumpanija li nefqet xi mkien bejn $500 miljun u $1 biljun fuq infrastruttura OCS fuq ħames snin. Kellna numru żgħir ta' klijenti ta'-daqs medju jistaqsuna biex nevalwaw il-fattibbiltà tal-OCS għall-ambjenti tagħhom. F'kull każ, ladarba ħarġu n-numri fuq skala sub-500 node, ir-rekwiżiti kapitali qabżu l-benefiċċji ta 'konfigurazzjoni mill-ġdid, u baqgħu ma' weraq tas-sinsla konvenzjonali bl-użu ta 'moduli pluggable.

Inferenza dawwar l-ekwazzjoni. It-traffiku huwa fqigħ u imprevedibbli fil-livell tal-fluss, u t-tolleranza tal-latency hija qrib iż-żero. Ma tistax tikkonfigura mill-ġdid mogħdijiet ottiċi fuq bażi ta' kull-talba. Dak li għandek bżonn huwa drapp konsistentement ipprovdizzjonat iżżejjed b'latenza deterministiku, li jimbuttak lejn transceivers li jistgħu jiġu pplaggjati f'topoloġija tal-weraq tas-sinsla-fejn kull rabta tkun dejjem mixgħula. Aħna nbiegħu moduli fiż-żewġ xenarji, u l-konversazzjonijiet tal-inġinerija huma kompletament differenti. Ix-xerrejja tal-clusters tat-taħriġ iridu jkunu jafu dwar bandwidth aggregat għal kull rack u qawwa għal kull bit. Ix-xerrejja tal-inferenza jistaqsu dwar il-latency tad-denb u x'jiġri meta rabta tinżel.

 

Conceptual architectural diagram of a data center network topology comparing a custom Optical Circuit Switch (OCS) fabric for long-running AI training jobs versus a standard non-blocking Spine-Leaf topology for bursty inference workloads.

 

Għal ambjenti ta 'intrapriża u colo tradizzjonali taħt l-iperscale, l-ispiża għal kull port tiddomina u l-kompatibilità b'lura ma' pjanti tal-fibra eżistenti hija aktar importanti mid-densità tal-bandwidth mhux maħduma. Aħna ttestjajna tagħnaModuli 400G QSFP-DD fuq 14-il pjattaforma tal-iswiċċinklużi Cisco Nexus 93600CD, Arista 7060X5, u Juniper QFX5220. F'dawk l-ambjenti, it-tħassib dominanti mhuwiex il-veloċità. Huwa jekk il-modulu jiġix rikonoxxut mill-firmware tal-iswiċċ mingħajr kmandi manwali ta' override.

 

Iż-Żona Mejta 800G Li Taqbad Inġiniera Off Guard

 

F'400G, il-ġbir ta' interkonnessjoni kien proċess ta' żewġ-passi: kejjel id-distanza, agħżel ir-ram jew il-fibra. DAC passiv kopra 3 sa 5 metri bil-kumdità. 800G kissru dak. Kull korsija tmexxi 112G PAM4. Telf tar-ram f'dawk il-frekwenzi bejn wieħed u ieħor jirdoppja kontra 400G, u r-riżultat huwa limitu iebes ta 'madwar 2 metri għal kejbil passiv.

 

High-speed cable comparison showing an Active Electrical Cable (AEC) vs a standard Direct Attach Copper (DAC) bundle. The AEC uses internal retimers to extend the 800G signal reach to 7 meters at the cost of slight latency overhead.

 

Tgħallimna dan il-mod għali. Klijent kmieni ordna tagħnaAssemblaġġi DAC passivi 800Gf'tulijiet ta '3 metri bbażati fuq it-tqassim tagħhom ta' l-ixtilliera 400G. It-taħriġ tal-link falla fuq aktar minn 60% tal-portijiet. Ir-ram ma kienx difettuż; il-fiżika sempliċement ma tippermettix dan. Huma qalbu għal AEC għall-ġirjiet ta '3 sa 5 metri u moduli ottiċi pluggable għal dak kollu lil hinn, u l-iskjerament stabbilizzat fi żmien ġimgħa. Minn dakinhar, waqfet nieħdu ordnijiet għal 800G DAC passiv 'il fuq minn 2.5 metri u żidna konsulenza dwar id-distanza tal-iskjerament mal-proċess ta' konferma tal-ordni tagħna.

 

L-AEC issa tippossjedi d-distakk bejn 3 u 7 metri. Retimers diġitali jirriġeneraw is-sinjal elettrikament mingħajr konverżjoni ottika, li żżomm l-ispiża baxxa iżda żżid latenza. KP4 FEC waħdu jpoġġi 50 sa 100 nanosekondi fuq kull ħops fi 800G, u r-retimer ipoġġi aktar fuq nett. Aħna kejlna latenza miżjuda totali f'85 sa 110 ns fuq l-assemblaġġi AEC li bħalissa nibgħatu. Għal links tad-drapp tal-weraq tas-sinsla-, dik l-overhead hija inviżibbli fil-prestazzjoni tal-applikazzjoni. Għal clusters GPU akkoppjati sewwa hija storja differenti. Ibbażat fuq data ta 'profiling minn tliet skjeramenti tal-klijenti li jmexxu nodi H100, jekk l-overhead tal-komunikazzjoni tax-xogħol tat-taħriġ tiegħek diġà tiltaqa' 'l fuq minn 15%, dak il-mitt nanosekondi żejda għal kull hop fuq livelli multipli ta' swiċċ jibda jingħaqad f'operazzjonijiet NCCL AllReduce.

 

Lil hinn minn 7 metri, transceivers ottiċi pluggable għal 800G huma l-unika triq vijabbli. It-talbiet tas-saff fiżiku jissikkaw b'mod konsiderevoli hawn. Tmiem-sa-baġits ta' telf ta' inserzjoni taħt IEEE 802.3ck jillandjaw taħt 1.5 dB għall-biċċa l-kbira tal-klassijiet ta' 800G reach, u kull konnessjoni MPO imqabbla trid tibqa' taħt 0.35 dB. Rajna fibra installata li għaddiet ċertifikazzjoni f'100G juru valuri PMD darbtejn sa tliet darbiet ogħla mill-ispeċifikazzjoni ratata tagħha wara bosta snin ta 'kompressjoni fi trejs tal-kejbil, konsistenti ma' dak li t-tim ta 'riċerka tan-netwerk ta' Juniper irrapporta fl-2023. Mhux kampjun. Kull segment. L-ispiża tal-ġbid mill-ġdid ta' żewġ kejbils tat-trunk hija frazzjoni tal-ispiża tad-debugging tal-flaps tal-link intermittenti għal sitt xhur.

 

CPO vs LPO vs Pluggable: Fejn Kull Teknoloġija Attwalment tinsab fl-2026

 

L-ottika ko-ippakkjata se tbiddel kif tinbena l-infrastruttura tal-iswiċċjar taċ-ċentru tad-dejta. Aħna ngħidu dan bħala manifattur tal-modulu pluggable, għalhekk ħu l-fehma tagħna bħala infurmati aktar milli newtrali.

 

Fl-OFC 2026, id-dejta tal-affidabbiltà fuq prototipi CPO wriet rati ta 'falliment potenzjalment aktar baxxi minn moduli pluggable tradizzjonali. Mingħajr ċikli ta 'inserzjoni mekkaniċi jew uċuħ ta' konnettur esposti, il-modi ta 'falliment dominanti ta' moduli pluggable sempliċement ma japplikawx. Il-pjattaforma tas-swiċċ Bailly 51.2T CPO ta 'Broadcom uriet bejn wieħed u ieħor 70% inqas enerġija tiġbed fuq is-saff ottiku meta mqabbla ma' konfigurazzjonijiet pluggable ekwivalenti. (Rapport tal-Interkonnessjoni Ottika tad-DataMIIntelligence) NVIDIA wriet is-swiċċijiet CPO-integrati fil-GTC 2026 immirati fuq skala-skjerament 'il fuq fit-tieqa 2027 sal-2028.

 

Il-pożizzjoni tagħna: jekk m'intix silikon tal-iswiċċ tad-dwana tal-bini ta 'hyperscaler, l-ottika li tista' tiġi pplaggjata hija l-unika għażla skjerata tiegħek sa mill-inqas 2027. CPO jeħtieġ arkitetturi tal-bord il-biċċa l-kbira tal-bejjiegħa tal-iswiċċ għadhom ma bagħtux, standards tal-konnetturi li mhumiex finalizzati, u playbook ġdid sħiħ għall-immaniġġjar ta 'fallimenti li ma tistax tiffissa billi tiġbed modulu. L-ekosistema għall-akkwist ġenerali tal-intrapriżi għadha ma teżistix. Kellna żewġ klijenti prospettivi fl-aħħar sena jdewmu l-aġġornamenti tagħhom minn 400G-għal-800G jistennew is-CPO. It-tnejn eventwalment ġew lura u għamlu ordnijiet pluggable wara li l-lakuni tal-bandwidth tagħhom saru inċidenti ta 'produzzjoni. Aħna ktibna dwar ir-raġuni tal-inġinerija għal din il-pożizzjoni f'aktar dettall fuq tagħnaAnaliżi tal-arkitettura tat-transceiver pluggable.

 

LPO joqgħod fi spazju differenti. It-tneħħija tad-DSP mill-modulu tnaqqas l-aktar komponent waħdieni tal-enerġija-bil-ġuħ, responsabbli sa nofs it-teħid totali tal-enerġija tal-modulu. Ir-riżultat huwa 30 sa 50% inqas konsum u sa 15 nanosekondi inqas latenza. Bdejna nkampaw RFQs speċifiċi għall-LPO-tard fl-2025. Tlieta mill-erbgħa ġew minn klijenti li jibnu raggruppamenti ta' GPU ta'-bejjiegħ wieħed fuq NVIDIA Spectrum-X. Ħadd ma kien jaħdem drappijiet ta' diversi bejjiegħa, li jgħidlek kollox dwar fejn jaħdem LPO illum. Jekk in-netwerk tiegħek iħallat bejjiegħa tal-iswiċċ, LPO mhux kompatibbli mal-ambjent tiegħek. Jekk tmexxi cluster AI ta'-bejjiegħ wieħed, jista' jkun l-aktar titjib intelliġenti disponibbli, u nistennew li jkollna moduli LPO-lesti fi kwalifika sa nofs l-2027.

X'Ifissru l-Marġini Termali 800G għall-Għażla tal-Modulu

 

Il-matematika termali f'800G taqbad lin-nies off guard. Id-densità tal-qawwa tal-interkonnessjoni ottika b'veloċità għolja f'din il-ġenerazzjoni toħloq problemi li sempliċement ma kinux jeżistu f'400G. Swiċċ ta '64 port kompletament mgħobbi b'moduli 800G f'16W kull wieħed jiġbed bejn wieħed u ieħor 1kW fil-qawwa tat-transceiver waħdu, qabel l-iswiċċ tal-ASIC stess 400 sa 500W. Dak huwa 1.4 sa 1.5 kW għal kull swiċċ. Tmien swiċċijiet f'saff tas-sinsla jpoġġuk aktar minn 11 kW mit-tagħmir tan-netwerk biss, fi xtillieri li ħafna drabi kienu pprovduti għal 8 sa 10 kW totali.

 

Juniper Networks iwissi b'mod espliċitu li moduli ta'-terzi b'enerġija għolja, partikolarment tipi koerenti ZR u ZR+, jistgħu jikkawżaw ħsara termali lit-tagħmir ospitanti, bir-responsabbiltà taqa' fuq l-utent. (Juniper Networks 800G Ottika FAQ) Dak mhux argument kontra moduli ottiċi-terzi. Huwa argument biex tkun taf eżattament dak li qed twaħħal. Fil-kwalifika tagħna taċ-ċikliżmu termali, aħna nittestjaw kull disinn tal-modulu 800G f'temperatura ta 'junction sostnuta ta' 85 grad għal 2,000 siegħa u ssegwi d-drift tal-kurrent bias tal-lejżer bħala l-indikatur primarju tat-tixjiħ. Unitajiet li drift 'il fuq minn 38 mA jinġibdu mil-linja tal-produzzjoni. F'densitajiet ta '800G, id-differenza bejn modulu li jiġbed 14W u tpinġija waħda ta' 18W tiddetermina jekk rack jibqax fi ħdan l-envelop termali jew iqajjem allarmi ta 'għeluq fis-2 AM. Li jkollok l-ispeċifikazzjoni ħażina dejjem kienet tedjanti. F'dawn il-livelli ta 'qawwa, huwa għali.

Thermal heatmap of a high-density switch rack illustrating extreme heat concentration in the transceiver cage area where 64 modules drawing 16W each generate significant thermal load, nearing cooling capacity limits.

 

 

Aħna nibgħatu moduli pluggable minn 1G SFP sa 800G OSFP, u nittestjaw kontra pjattaformi ta 'swiċċ ewlenin. Aħna nżommu rekords dwar dak li jaħdem u dak li ma jaħdimx. Jekk għandek bżonn verifika tal-kompatibilità ma' ambjent ta' swiċċ speċifiku, jew trid ispeċifikazzjonijiet termali u ta' klassi tal-enerġija-għall-ixkafef ta'-densità għolja 800G, l-inġiniera tagħna jmexxu dawk il-konversazzjonijiet kull ġimgħa. TagħnaPaġna tat-transceiver 800G OSFP u QSFP-DD800għandu specs, għażliet ta' -klassi, u formoli ta' talba ta' kampjuni għal kull modulu li nibgħatu.

Ibgħat l-inkjesta