Sovraccarico di corrente / Power surge
Sovraccarico di corrente / Power surge
Segnalato dal Dott. Giuseppe Cotellessa / Reported by Dr. Giuseppe Cotellessa
L'approccio di Avicena alle comunicazioni ottiche utilizza matrici di microLED che accoppiano la luce a fasci di fibre ottiche. / Avicena’s approach to optical communications uses arrays of microLEDs coupling light into fibre bundles.
Il settore dell'informatica di fascia alta sta gradualmente adottando la fotonica per l'interconnessione. Tuttavia, come scopre Chris Edwards, l'energia e la manutenzione rimangono ostacoli importanti.
Il passaggio alle comunicazioni ottiche per il calcolo ad alte prestazioni era nell'aria da tempo. E non è chiaro se persino i grandi produttori di infrastrutture su larga scala che lavorano sull'intelligenza artificiale generativa (IA) siano davvero pronti ad abbandonare il rame per qualsiasi cosa debba passare da un PCB all'altro o persino tra rack di PCB.
In teoria, per trasmettere dati tramite fibra ottica è necessaria meno energia rispetto ai cavi in rame, ma c'è un problema. Il vantaggio derivante dall'utilizzo dei fotoni aumenta con la distanza. Se si lavora su una distanza pari alla lunghezza del backplane di un rack da 19 pollici, tale vantaggio scompare rapidamente, almeno con i componenti attuali.
Ci sono anche dubbi sull'affidabilità quando si ha a che fare con le decine di migliaia di connessioni necessarie ai data center di fascia alta. I tassi di guasto dei collegamenti ottici causati da problemi al laser od al connettore significano che gli operatori devono esaminare la situazione più volte al giorno.
Pertanto, per quello che gli operatori definiscono il regime di scalabilità, in cui i server vicini lavorano a stretto contatto, è ancora in corso un dibattito su quanto le comunicazioni a breve raggio si allontaneranno dal rame.
"Si discute molto se Nvidia passerà alla tecnologia su rame od a quella ottica. Noi faremo entrambe le cose", ha dichiarato Jensen Huang, CEO di Nvidia, durante la conferenza tecnica dell'azienda a marzo.
Ciò che serve alla tecnologia ottica per fare il salto di qualità è una drastica riduzione della potenza, in modo che l'energia per bit a 1 Tbit/s per connessione scenda ben al di sotto di quella della segnalazione su rame. Il problema non risiede tanto nella generazione dei fotoni quanto nella manipolazione elettrica necessaria in precedenza per garantire che il segnale raggiunga la sua destinazione intatto. La quantità di tale manipolazione necessaria è alla base di diversi approcci.
I protocolli di comunicazione a lungo raggio si sono concentrati sull'ottimizzazione della quantità di dati racchiusi in singoli simboli. Il PAM4, che codifica due bit per simbolo, è ora dominante sia nelle versioni ottiche ad alta velocità che in quelle in rame di Ethernet. Poiché il margine di errore è minore con quattro livelli di ampiezza distinti anziché due, la segnalazione PAM4 spesso funziona in combinazione con un'elaborazione del segnale estesa e la correzione degli errori in avanti (FEC). Oltre all'equalizzazione digitale, i produttori di ricetrasmettitori includono circuiti elettronici per correggere la temporizzazione del segnale e ridurre il jitter. L'elaborazione aggiuntiva comporta costi e consumi energetici maggiori.
Il passaggio alla trasmissione lineare, ottenuto spostando alcune funzioni nello switch host o nell'ASIC dell'interfaccia di rete e rimuovendone completamente altre, può avere un impatto significativo sul consumo energetico dei circuiti optoelettronici. Gli ASIC di interfaccia contengono già elementi di trasmissione e ricezione adattivi che apprendono le caratteristiche di un collegamento utilizzando pattern di test e possono quindi adattarsi ai problemi presenti nei connettori in fibra ed ottici senza dover ricorrere ad elaborazioni di segnale esterne, originariamente sviluppate per supportare collegamenti a distanze molto maggiori.
La riduzione del consumo energetico migliora con velocità di trasmissione dati più elevate. Alla conferenza Hot Interconnects dello scorso anno, Andreas Bechtolsheim, co-fondatore e chief architect di Arista Networks, ha descritto come il consumo energetico di un collegamento ottico da 1,6 Tbit/s sia sceso da 30 W a soli 10 W. Per un collegamento da 800 Gbit/s, il consumo si è dimezzato, arrivando a 8 W.
La questione è quanta parte del DSP dedicato si possa rimuovere prima che le prestazioni si degradino. L'opzione più semplice finora individuata è quella dell'ottica di ricezione lineare (LRO). Questa soluzione mantiene il DSP sul lato trasmettitore, ma rimuove i ricevitori. Negli esperimenti di Arista, il risparmio energetico è stato di appena un terzo su una connessione a 1,6 Tbit/s. Rimuovere l'elaborazione del segnale dal trasmettitore comporta problemi maggiori, dovuti principalmente a riflessioni non corrette quando la luce ad alta potenza del laser entra nel connettore. Tuttavia, modifiche ai connettori ed ottimizzazione degli ASIC host potrebbero compensare questi problemi.
Ricevitori ottici collegabili
Un anno fa, un gruppo di oltre 50 aziende, riunitesi attorno all'idea di un'elaborazione semplificata, ha lanciato le proprie specifiche per i moduli ottici plug-in. Si trattava di moduli per la segnalazione PAM4 a 100 Gbit/s, seguiti in autunno da una versione a 400 Gbit/s. La versione più veloce della proposta MSA (Multi-Source Agreement) per i moduli ottici plug-in lineari (LPO) trasmette quattro colori di luce, con lunghezze d'onda distanziate di 20 nm, su una singola fibra.
Abbandonare il PAM4 e tornare al vecchio schema di modulazione binaria non-return to zero (NRZ) può ridurre ulteriormente il consumo energetico e, aspetto forse importante per gli acceleratori che lavorano in parallelo, anche la latenza. Come le successive specifiche LPO MSA, il consorzio Optical Compute Interconnect (OCI) MSA adotta la multiplazione a divisione di lunghezza d'onda a quattro colori, ma su una trasmissione di base più lenta di poco più di 50 Gbit/s per supportare un flusso di dati aggregato di 200 Gbit/s.
A differenza di LPO, la specifica OCI è progettata non solo per moduli plug-in, ma anche per ottiche co-confezionate o quasi-confezionate, in cui i convertitori elettro-ottici sono saldati al PCB ma non integrati nel package dello switch host o del processore. È ancora da definire una versione che spinga la velocità di trasmissione dati per fibra a 800 Gbit/s, con l'obiettivo finale di raggiungere i 3,2 Tbit/s.
Se il collegamento non deve superare un paio di metri e si è disposti a raggruppare le fibre in parallelo per un'unica connessione, un'altra opzione è quella di rinunciare completamente al laser.
Avicena propone l'idea di utilizzare microLED, derivati dai componenti impiegati nei televisori di fascia alta, come modulatori di luce ad alta velocità e basso consumo energetico. Poiché la luce non è coerente fin dall'inizio, le fibre multimodali, più economiche, risultano più adatte. L'azienda afferma di poter ridurre il consumo energetico fino a 200 fJ/bit per il flusso di dati grezzo, rispetto ai pochi picojoule dei collegamenti ottici di grado LPO, e che la segnalazione parallela potrebbe consentire di collegare memorie ad alta densità ai processori all'interno della stessa macchina.
Le velocità di trasmissione dati ottenute dall'uscita LED grezza dell'azienda sono di gran lunga superiori a quelle che ci si aspetterebbe da un dispositivo di livello televisivo. Tuttavia, restano ben lontane dai laser a semiconduttore progettati appositamente. Avicena ha dimostrato la capacità di raggiungere 15 Gbit/s per corsia. Esistono però già connettori paralleli che raggruppano otto o più fibre in un unico involucro, raggiungendo una larghezza di banda aggregata di 100 Gbit/s. Per i ricevitori, l'azienda adatta i sensori delle telecamere.
È davvero necessario utilizzare luce visibile o infrarossa? Il passaggio dalle frequenze infrarosse a quelle dei terahertz e delle microonde rende i connettori più resistenti a disallineamenti e sporco. Questo approccio è diverso dalla tradizionale trasmissione RF su fibra ottica utilizzata dall'industria della telefonia mobile per connettere le stazioni base, che prevede il passaggio di luce visibile modulata da un segnale RF su una fibra ottica convenzionale.
Le soluzioni offerte da aziende come AttoTude e Point2 rispecchiano invece il lavoro sulle fibre a nucleo cavo per la fotonica. Questo sfrutta la maggiore velocità della luce nell'aria o nel vuoto rispetto al vetro od alla plastica. Point2 ha sviluppato quello che chiama un "e-tube", una guida d'onda in plastica simile ad una fibra per trasmettere segnali RF con frequenze prossime ai 100 GHz. AttoTude sta ottimizzando la propria guida d'onda a nucleo cavo. Come quella di Point2, sarà probabilmente realizzata in qualche tipo di polimero. Tuttavia, la guida d'onda sarà sintonizzata per segnali nella gamma da 300 GHz a 10 THz. Come per la fibra ottica, l'azienda intravede la possibilità di utilizzare la multiplazione di lunghezza d'onda per aumentare la velocità di trasmissione dei dati.
Attualmente, l'interesse è rivolto alle proposte di ottimizzare l'ottica laser per le comunicazioni a corto raggio, con i sostenitori che sperano in una riduzione del consumo energetico tale da indurre i progettisti di chip ad abbandonare il rame. Tuttavia, le alternative basate su microLED e radiofrequenza potrebbero offrire sistemi più facili da assemblare e manutenere. In ogni caso, i massicci investimenti derivanti dal boom dell'intelligenza artificiale potrebbero fornire ad altri settori opzioni commercialmente valide per alternative rapide ed economiche al cablaggio.
ENGLISH
High-end computing is gradually embracing photonics for interconnect. But energy and maintenance remain big hurdles, as Chris Edwards discovers.
The shift to optical communications for high-performance computing has been a long time coming. And it is not clear that even the hyperscalers working on generative artificial intelligence (AI) are quite ready to move away from copper for anything that needs to hop from one PCB to another or even between racks of them.
In theory, you need less power to send data over optical fibre than with copper cabling, but there is a catch. The benefit from using photons increases with distance. If you are working over something the length of a 19in rack’s backplane, that advantage quickly disappears, at least with today’s components.
There are also questions over reliability when dealing with the tens of thousands of connections that high-end data centres need. The failure rates of optical links caused by laser or connector problems mean operators are looking at several times a day.
So, for what operators call the scale-up regime, where servers close together work closely together, there is still a debate as to how much short-reach communications will move away from copper.
“There's a lot of conversation about, ‘is Nvidia going to copper scale up or optical scale up?’ We're going to do both,” said Nvidia CEO Jensen Huang at the company’s technical conference in March.
What optical needs to push it over the edge is a dramatic reduction in power so that the energy per bit at 1Tbit/s per connection drops far enough below copper signalling. The problem does not lie in generating the photons so much as the electrical massaging needed beforehand to make sure the signal gets to its destination intact. How much of that is necessary is driving several approaches.
Longer-range communication protocols focused on packing as much as possible into individual symbols. PAM4, which encodes two bits per symbol, now dominates in both high-speed optical and copper versions of Ethernet. Because the margin for error is smaller with four distinct amplitude levels rather than two, PAM4 signalling often works hand in hand with extensive signal processing and forward error correction (FEC). As well as digital equalisation, transceiver makers include electronics to correct signal timing to reduce jitter. The added processing means higher costs and power consumption.
Going to linear transmission by shifting some functions into the host switch or network interface ASIC and removing some completely can have a dramatic effect on the power consumed by the optoelectronic circuitry. The interface ASICs already contain adaptive transmitter and receiver elements that learn the characteristics of a link using test patterns and so can adjust to problems in the fibre and optical connectors without having to rely on external signal processing that was originally developed to support much longer-distance links.
The power reduction improves at higher data rates. At Hot Interconnects last year, Andreas Bechtolsheim, co-founder and chief architect at Arista Networks, described how the power for a 1.6Tbit/s optical link fell from 30W to just 10W. For an 800Gbit/s link, the power halved to 8W.
The question is how much of the dedicated DSP you can remove before performance degrades so far. The easiest option found so far is for linear-receive optics (LRO). This keeps the DSP on the transmitter’s end but removes the receivers. In Arista’s experiments, the power saving was just a third on a 1.6Tbit/s connection. Removing the signal processing from the transmitter leads to bigger issues. They mostly come from uncorrected reflections as the high-power light from the laser enters the connector. However, changes to connectors and tuning the host ASICs may compensate for these problems.
Pluggable optical receivers
A year ago, a group of over 50 companies that formed around the idea of stripped-down processing launched its specification for pluggable optical modules. That was for 100Gbit/s PAM4 signalling, followed in the autumn by a 400Gbit/s version. The faster version of the linear pluggable optics (LPO) multi-source agreement (MSA) proposal transmits four colours of light, with wavelengths spaced 20nm apart, over a single fibre.
Ditching PAM4 and going back to the older non-return to zero (NRZ) binary modulation scheme can trim a little more from power and also, perhaps importantly for accelerators working on parallel, latency. Like the later LPO MSA specifications, the Optical Compute Interconnect (OCI) MSA consortium adopts four-colour wavelength division multiplexing but on a slower core transmission of just over 50Gbit/s to support an aggregate 200Gbit/s stream of data.
Unlike LPO, the OCI specification is designed not just for pluggable modules but for co-packaged optics or near-packaged optics, where the electrical-optical converters are soldered to the PCB but not integrated into the host switch or processor’s package. Yet to be defined is a version that pushes the per-fibre data rate to 800Gbit/s, with plans to ultimately reach 3.2Tbit/s.
If the link does not need to go more than a couple of metres and you are willing to bundle fibres in parallel for a single connection, another option is to forego the laser entirely.
Avicena is pitching the idea of using microLEDs adapted from the components used in high-end TVs to act as high-speed, low-power light modulators. As the light is not coherent to begin with, cheaper multimode fibres make more sense. The company claims it can bring energy down as far as 200fJ/bit for the raw bitstream rather than the low picojoules of LPO-grade optical links and that the parallel signalling may lend itself to connecting high-density memories to processors within the same machine.
The data rates from the raw LED output the company has achieved are way higher than anything expected from a TV-grade device. But they remain a long way short of purpose-designed semiconductor lasers. Avicena has demonstrated the ability to hit 15Gbit/s per lane. However, parallel connectors that bundle eight or more fibres together into one shell already exist, reaching 100Gbit/s in aggregate bandwidth. For receivers, the company adapts camera sensors.
Do you even need visible or infrared light at all? Moving down from infrared into the terahertz and microwave regimes makes the connectors more forgiving of misalignment and dirt. This approach is not like the conventional RF over fibre used by the cellular industry to connect base stations. That passes visible light modulated by an RF signal over a conventional optical fibre.
The offerings from the likes of AttoTude and Point2 instead mirror the work on hollow-core fibre for photonics. This takes advantage of the faster speed of light through air or a vacuum compared to glass or plastic. Point2 has developed what it calls an e-tube, a plastic fibre-like waveguide to convey RF signals close to 100GHz in frequency. AttoTude is optimising its own hollow-core waveguide. Like Point2’s, they will probably be made from some kind of polymer. But the waveguide will be tuned for signals in the 300GHz to 10THz range. As with optical fibre, the company sees the possibility of using wavelength multiplexing to increase data rates.
The momentum is currently behind proposals to tune laser optics for short-reach communications, with proponents hoping energy usage drops far enough to push chip designers away from copper. But the microLED and RF alternatives may deliver systems that are easier to assemble and maintain. Either way, the massive investment that has come through the AI boom could give other sectors commercially viable options for fast, lower-cost alternatives.
Da:
https://www.newelectronics.co.uk/content/features/power-surge?utm_source=content_recommendation&utm_medium=blueconic
Commenti
Posta un commento