Interkonnessjoni Ottika ta 'Veloċità Għolja: Soluzzjonijiet taċ-Ċentru tad-Data
Apr 27, 2026| L-aħħar kwart kellna vapur tal-klijent lura erbgħin modulu 400G DR4 li jsostni flaps tal-link bl-addoċċ fuq l-iswiċċijiet Arista 7060X5 tagħhom. Qabel saħansitra ftaħna l-burokrazija tal-RMA, l-inġinier tat-test tagħna staqsa mistoqsija waħda: spezzjonajt il-Konnetturi MPOqabel l-installazzjoni? Huma ma kellhomx. Bgħatna l-moduli permezz tar-rigressjoni sħiħa tagħna, dijagrammi tal-għajnejn nodfa, BER taħt 1E-13 fl-erba' korsiji kollha,Qari DDM nominali. Imbagħad tlabniehom jibagħtu ritratti tal-uċuħ tat-trunk cable tagħhom-taħt mikroskopju tal-fibra. Kull konnettur wieħed kellu kontaminazzjoni tal-partikuli. Erbgħin modulu, żero difetti. Il-problema kienet it-trab.
Naraw xi verżjoni ta 'dan kull xahar. Skjeramenti ta 'interkonnessjoni ottika b'veloċità għolja fi kwalunkwe skala jolqtu l-istess ħajt, u n-numri jsostnuh: x'imkien bejn 65% u 70% tal-fallimenti kollha tal-link 400G u 800G jintraċċaw lura għall-kontaminazzjoni tal-konnettur, mhux għal difetti tat-transceiver. (Data tal-qasam IEEE 802.3 permezz ta' AscentOptics) Inġibu dan l-ewwel għax jifforma kif naħsbu dwar id-deċiżjoni kollha tal-interkonnessjoni. Il-modulu kważi qatt ma huwa l-iktar ħolqa dgħajfa. Is-saff fiżiku madwaru huwa.

Il-Mudell tat-Traffiku Tiegħek Jiddeċiedi l-Arkitettura tal-Interkonnessjoni Ottika Tiegħek
Kulħadd jibda bin-numru tal-parti.QSFP-DD jew OSFP, SR jew DR, multimode jew single-mode. Nagħmluha wkoll. Iżda l-iskjeramenti li marru tajjeb għall-klijenti tagħna kollha bdew x'imkien ieħor: it-traffiku kif jidher fil-fatt?
It-taħriġ ta'-AI fuq skala kbira jiġġenera-għal-kollha komunikazzjoni tal-GPU li tirriżulta li tkun prevedibbli b'mod sorprendenti fuq skali ta' żmien minn minuti sa sigħat. Google jisfrutta dan bi swiċċijiet taċ-ċirkwiti ottiċi fin-netwerk Jupiter tagħhom, billi jikkonfiguraw mill-ġdid il-mogħdijiet tad-dawl fiżiċi bejn l-ixkafef minflok ma jaqilbu l-pakketti. Ir-riżultati ppubblikati tagħhom minn għaxar snin ta 'użu tal-produzzjoni: 41% tnaqqis tal-enerġija, 30% inqas capex, u 50x titjib fl-uptime tad-drapp kontra l-arkitettura Clos preċedenti tagħhom. (Google SIGCOMM'22) Dawk in-numri huma reali, iżda jappartjenu għal kumpanija li nefqet xi mkien bejn $500 miljun u $1 biljun fuq infrastruttura OCS fuq ħames snin. Kellna numru żgħir ta' klijenti ta'-daqs medju jistaqsuna biex nevalwaw il-fattibbiltà tal-OCS għall-ambjenti tagħhom. F'kull każ, ladarba ħarġu n-numri fuq skala sub-500 node, ir-rekwiżiti kapitali qabżu l-benefiċċji ta 'konfigurazzjoni mill-ġdid, u baqgħu ma' weraq tas-sinsla konvenzjonali bl-użu ta 'moduli pluggable.
Inferenza dawwar l-ekwazzjoni. It-traffiku huwa fqigħ u imprevedibbli fil-livell tal-fluss, u t-tolleranza tal-latency hija qrib iż-żero. Ma tistax tikkonfigura mill-ġdid mogħdijiet ottiċi fuq bażi ta' kull-talba. Dak li għandek bżonn huwa drapp konsistentement ipprovdizzjonat iżżejjed b'latenza deterministiku, li jimbuttak lejn transceivers li jistgħu jiġu pplaggjati f'topoloġija tal-weraq tas-sinsla-fejn kull rabta tkun dejjem mixgħula. Aħna nbiegħu moduli fiż-żewġ xenarji, u l-konversazzjonijiet tal-inġinerija huma kompletament differenti. Ix-xerrejja tal-clusters tat-taħriġ iridu jkunu jafu dwar bandwidth aggregat għal kull rack u qawwa għal kull bit. Ix-xerrejja tal-inferenza jistaqsu dwar il-latency tad-denb u x'jiġri meta rabta tinżel.

Għal ambjenti ta 'intrapriża u colo tradizzjonali taħt l-iperscale, l-ispiża għal kull port tiddomina u l-kompatibilità b'lura ma' pjanti tal-fibra eżistenti hija aktar importanti mid-densità tal-bandwidth mhux maħduma. Aħna ttestjajna tagħnaModuli 400G QSFP-DD fuq 14-il pjattaforma tal-iswiċċinklużi Cisco Nexus 93600CD, Arista 7060X5, u Juniper QFX5220. F'dawk l-ambjenti, it-tħassib dominanti mhuwiex il-veloċità. Huwa jekk il-modulu jiġix rikonoxxut mill-firmware tal-iswiċċ mingħajr kmandi manwali ta' override.
Iż-Żona Mejta 800G Li Taqbad Inġiniera Off Guard
F'400G, il-ġbir ta' interkonnessjoni kien proċess ta' żewġ-passi: kejjel id-distanza, agħżel ir-ram jew il-fibra. DAC passiv kopra 3 sa 5 metri bil-kumdità. 800G kissru dak. Kull korsija tmexxi 112G PAM4. Telf tar-ram f'dawk il-frekwenzi bejn wieħed u ieħor jirdoppja kontra 400G, u r-riżultat huwa limitu iebes ta 'madwar 2 metri għal kejbil passiv.

Tgħallimna dan il-mod għali. Klijent kmieni ordna tagħnaAssemblaġġi DAC passivi 800Gf'tulijiet ta '3 metri bbażati fuq it-tqassim tagħhom ta' l-ixtilliera 400G. It-taħriġ tal-link falla fuq aktar minn 60% tal-portijiet. Ir-ram ma kienx difettuż; il-fiżika sempliċement ma tippermettix dan. Huma qalbu għal AEC għall-ġirjiet ta '3 sa 5 metri u moduli ottiċi pluggable għal dak kollu lil hinn, u l-iskjerament stabbilizzat fi żmien ġimgħa. Minn dakinhar, waqfet nieħdu ordnijiet għal 800G DAC passiv 'il fuq minn 2.5 metri u żidna konsulenza dwar id-distanza tal-iskjerament mal-proċess ta' konferma tal-ordni tagħna.
L-AEC issa tippossjedi d-distakk bejn 3 u 7 metri. Retimers diġitali jirriġeneraw is-sinjal elettrikament mingħajr konverżjoni ottika, li żżomm l-ispiża baxxa iżda żżid latenza. KP4 FEC waħdu jpoġġi 50 sa 100 nanosekondi fuq kull ħops fi 800G, u r-retimer ipoġġi aktar fuq nett. Aħna kejlna latenza miżjuda totali f'85 sa 110 ns fuq l-assemblaġġi AEC li bħalissa nibgħatu. Għal links tad-drapp tal-weraq tas-sinsla-, dik l-overhead hija inviżibbli fil-prestazzjoni tal-applikazzjoni. Għal clusters GPU akkoppjati sewwa hija storja differenti. Ibbażat fuq data ta 'profiling minn tliet skjeramenti tal-klijenti li jmexxu nodi H100, jekk l-overhead tal-komunikazzjoni tax-xogħol tat-taħriġ tiegħek diġà tiltaqa' 'l fuq minn 15%, dak il-mitt nanosekondi żejda għal kull hop fuq livelli multipli ta' swiċċ jibda jingħaqad f'operazzjonijiet NCCL AllReduce.
Lil hinn minn 7 metri, transceivers ottiċi pluggable għal 800G huma l-unika triq vijabbli. It-talbiet tas-saff fiżiku jissikkaw b'mod konsiderevoli hawn. Tmiem-sa-baġits ta' telf ta' inserzjoni taħt IEEE 802.3ck jillandjaw taħt 1.5 dB għall-biċċa l-kbira tal-klassijiet ta' 800G reach, u kull konnessjoni MPO imqabbla trid tibqa' taħt 0.35 dB. Rajna fibra installata li għaddiet ċertifikazzjoni f'100G juru valuri PMD darbtejn sa tliet darbiet ogħla mill-ispeċifikazzjoni ratata tagħha wara bosta snin ta 'kompressjoni fi trejs tal-kejbil, konsistenti ma' dak li t-tim ta 'riċerka tan-netwerk ta' Juniper irrapporta fl-2023. Mhux kampjun. Kull segment. L-ispiża tal-ġbid mill-ġdid ta' żewġ kejbils tat-trunk hija frazzjoni tal-ispiża tad-debugging tal-flaps tal-link intermittenti għal sitt xhur.
CPO vs LPO vs Pluggable: Fejn Kull Teknoloġija Attwalment tinsab fl-2026
L-ottika ko-ippakkjata se tbiddel kif tinbena l-infrastruttura tal-iswiċċjar taċ-ċentru tad-dejta. Aħna ngħidu dan bħala manifattur tal-modulu pluggable, għalhekk ħu l-fehma tagħna bħala infurmati aktar milli newtrali.
Fl-OFC 2026, id-dejta tal-affidabbiltà fuq prototipi CPO wriet rati ta 'falliment potenzjalment aktar baxxi minn moduli pluggable tradizzjonali. Mingħajr ċikli ta 'inserzjoni mekkaniċi jew uċuħ ta' konnettur esposti, il-modi ta 'falliment dominanti ta' moduli pluggable sempliċement ma japplikawx. Il-pjattaforma tas-swiċċ Bailly 51.2T CPO ta 'Broadcom uriet bejn wieħed u ieħor 70% inqas enerġija tiġbed fuq is-saff ottiku meta mqabbla ma' konfigurazzjonijiet pluggable ekwivalenti. (Rapport tal-Interkonnessjoni Ottika tad-DataMIIntelligence) NVIDIA wriet is-swiċċijiet CPO-integrati fil-GTC 2026 immirati fuq skala-skjerament 'il fuq fit-tieqa 2027 sal-2028.
Il-pożizzjoni tagħna: jekk m'intix silikon tal-iswiċċ tad-dwana tal-bini ta 'hyperscaler, l-ottika li tista' tiġi pplaggjata hija l-unika għażla skjerata tiegħek sa mill-inqas 2027. CPO jeħtieġ arkitetturi tal-bord il-biċċa l-kbira tal-bejjiegħa tal-iswiċċ għadhom ma bagħtux, standards tal-konnetturi li mhumiex finalizzati, u playbook ġdid sħiħ għall-immaniġġjar ta 'fallimenti li ma tistax tiffissa billi tiġbed modulu. L-ekosistema għall-akkwist ġenerali tal-intrapriżi għadha ma teżistix. Kellna żewġ klijenti prospettivi fl-aħħar sena jdewmu l-aġġornamenti tagħhom minn 400G-għal-800G jistennew is-CPO. It-tnejn eventwalment ġew lura u għamlu ordnijiet pluggable wara li l-lakuni tal-bandwidth tagħhom saru inċidenti ta 'produzzjoni. Aħna ktibna dwar ir-raġuni tal-inġinerija għal din il-pożizzjoni f'aktar dettall fuq tagħnaAnaliżi tal-arkitettura tat-transceiver pluggable.
LPO joqgħod fi spazju differenti. It-tneħħija tad-DSP mill-modulu tnaqqas l-aktar komponent waħdieni tal-enerġija-bil-ġuħ, responsabbli sa nofs it-teħid totali tal-enerġija tal-modulu. Ir-riżultat huwa 30 sa 50% inqas konsum u sa 15 nanosekondi inqas latenza. Bdejna nkampaw RFQs speċifiċi għall-LPO-tard fl-2025. Tlieta mill-erbgħa ġew minn klijenti li jibnu raggruppamenti ta' GPU ta'-bejjiegħ wieħed fuq NVIDIA Spectrum-X. Ħadd ma kien jaħdem drappijiet ta' diversi bejjiegħa, li jgħidlek kollox dwar fejn jaħdem LPO illum. Jekk in-netwerk tiegħek iħallat bejjiegħa tal-iswiċċ, LPO mhux kompatibbli mal-ambjent tiegħek. Jekk tmexxi cluster AI ta'-bejjiegħ wieħed, jista' jkun l-aktar titjib intelliġenti disponibbli, u nistennew li jkollna moduli LPO-lesti fi kwalifika sa nofs l-2027.
X'Ifissru l-Marġini Termali 800G għall-Għażla tal-Modulu
Il-matematika termali f'800G taqbad lin-nies off guard. Id-densità tal-qawwa tal-interkonnessjoni ottika b'veloċità għolja f'din il-ġenerazzjoni toħloq problemi li sempliċement ma kinux jeżistu f'400G. Swiċċ ta '64 port kompletament mgħobbi b'moduli 800G f'16W kull wieħed jiġbed bejn wieħed u ieħor 1kW fil-qawwa tat-transceiver waħdu, qabel l-iswiċċ tal-ASIC stess 400 sa 500W. Dak huwa 1.4 sa 1.5 kW għal kull swiċċ. Tmien swiċċijiet f'saff tas-sinsla jpoġġuk aktar minn 11 kW mit-tagħmir tan-netwerk biss, fi xtillieri li ħafna drabi kienu pprovduti għal 8 sa 10 kW totali.
Juniper Networks iwissi b'mod espliċitu li moduli ta'-terzi b'enerġija għolja, partikolarment tipi koerenti ZR u ZR+, jistgħu jikkawżaw ħsara termali lit-tagħmir ospitanti, bir-responsabbiltà taqa' fuq l-utent. (Juniper Networks 800G Ottika FAQ) Dak mhux argument kontra moduli ottiċi-terzi. Huwa argument biex tkun taf eżattament dak li qed twaħħal. Fil-kwalifika tagħna taċ-ċikliżmu termali, aħna nittestjaw kull disinn tal-modulu 800G f'temperatura ta 'junction sostnuta ta' 85 grad għal 2,000 siegħa u ssegwi d-drift tal-kurrent bias tal-lejżer bħala l-indikatur primarju tat-tixjiħ. Unitajiet li drift 'il fuq minn 38 mA jinġibdu mil-linja tal-produzzjoni. F'densitajiet ta '800G, id-differenza bejn modulu li jiġbed 14W u tpinġija waħda ta' 18W tiddetermina jekk rack jibqax fi ħdan l-envelop termali jew iqajjem allarmi ta 'għeluq fis-2 AM. Li jkollok l-ispeċifikazzjoni ħażina dejjem kienet tedjanti. F'dawn il-livelli ta 'qawwa, huwa għali.

Aħna nibgħatu moduli pluggable minn 1G SFP sa 800G OSFP, u nittestjaw kontra pjattaformi ta 'swiċċ ewlenin. Aħna nżommu rekords dwar dak li jaħdem u dak li ma jaħdimx. Jekk għandek bżonn verifika tal-kompatibilità ma' ambjent ta' swiċċ speċifiku, jew trid ispeċifikazzjonijiet termali u ta' klassi tal-enerġija-għall-ixkafef ta'-densità għolja 800G, l-inġiniera tagħna jmexxu dawk il-konversazzjonijiet kull ġimgħa. TagħnaPaġna tat-transceiver 800G OSFP u QSFP-DD800għandu specs, għażliet ta' -klassi, u formoli ta' talba ta' kampjuni għal kull modulu li nibgħatu.


