La massiccia interruzione di Facebook: cosa è successo?

Hai riscontrato l'ultima interruzione di Facebook? Ha sollevato infinite domande e infinite teorie, ma questo articolo spiegherà tutto.

Facebook è andato offline completamente lunedì, portando Instagram e WhatsApp (insieme a molti altri siti Web) con esso. Fonti all’interno di Facebook, hanno portato molti a concludere che l’incidente avesse a che fare con il BGP (Border Gateway Protocol). Il social network è ora di nuovo online e ha rilasciato delle scuseCos’è il BGP? E in cosa consisteva quella massiccia interruzione di Facebook?

Cos’è il BGP?

In sostanza, BGP è un sistema che Internet utilizza per distribuire il traffico il più rapidamente possibile su internet. Finirai per prendere molti percorsi diversi per portare i tuoi dati, ad esempio, su Facebook poiché ci sono così tanti provider di servizi Internet, router e server responsabili . Il compito di BGP è navigarci.

BGP è stato confrontato con uffici postali, controllori del traffico aereo e altro, ma penso che il mio confronto preferito è quello di una mappa. Pensa a BGP come a un gruppo di persone che creano e aggiornano mappe per YouTube e Facebook.   

solen feyissa iurEAyYyU c unsplash

Come risultato del BGP, Internet viene scomposto in grandi reti, dette anche sistemi autonomi. In un certo senso, puoi visualizzarle come nazioni insulari: sono reti controllate da un’entità, come un ISP come Comcast, una società come Facebook, o qualche altra grande organizzazione come un governo o un’università. Poiché ci vorrebbe molto tempo per costruire ponti che colleghino tutte le isole, BGP è ciò che ti dice quali isole (o sistemi autonomi) devi attraversare per raggiungere la tua destinazione.

Dato che Internet è in continua evoluzione, anche le mappe dovrebbero essere aggiornate. Non vuoi essere condotto su vecchie strade che non portano a Google. Le mappe dei sistemi autonomi sono condivise perché mappano l’intera Internet i tempi sarebbero estremamente dispendiosi in termini di tempo. Periodicamente, si consultano con i loro vicini per vedere quali aggiornamenti hanno fatto alle loro mappe.

Il concetto di errore può essere facilmente visualizzato utilizzando le mappe. Quando il GPS è stato reso disponibile per la prima volta ai consumatori, c’erano sempre battute sul fatto che saresti caduto da una scogliera o nel deserto se lo avessi usato. Allo stesso modo, un errore BGP potrebbe portare il traffico nella direzione sbagliata,

Un esempio reale

Ecco un esempio estremamente semplificato, ma fai finta di volerti connettere a un sito web chiamato convergenza. DecadeConnect è utilizzato da Convergence e NetSend dal tuo ISP. DecadeConnect e NetSend non possono comunicare direttamente tra loro, ma il tuo ISP può condividere le informazioni con Border Communications, che a sua volta può condividerle con Form, che può quindi parlare con NetSend. Tu e Convergence sareste in grado di comunicare su quel percorso se è l’unico percorso disponibile. Il traffico verrebbe probabilmente instradato attraverso ThirdLevel se sia DecadeConnect che NetSend fossero collegati ad esso. Sarà più veloce instradare il traffico attraverso di essa che attraverso NetSend.

Che a sua volta può condividerlo con Form, che può quindi parlare con NetSend. Tu e Convergence sareste in grado di comunicare su quel percorso se è l’unico percorso disponibile. Il traffico verrebbe probabilmente instradato attraverso ThirdLevel se sia DecadeConnect che NetSend fossero collegati ad esso. Sarà più veloce instradare il traffico attraverso di essa che attraverso NetSend.

Hai bisogno di maggiori dettagli?

BGP fornisce essenzialmente una mappa che mostra tutti i percorsi più veloci da te a un sito, giusto?

Corretto! Il problema si complica ulteriormente perché il più corto potrebbe non essere sempre il migliore. Oltre alla selezione del percorso, alcune reti addebitano ad altre l’inclusione nei loro percorsi. Diversi fattori influenzano le scelte degli algoritmi di routing: il costo è uno di questi.

Inoltre, le mappe possono essere una vera sfida!

Cosa c’entra il DNS con tutto questo?

Come spiegato da Cloudflare: DNS è dove stai andando, e BGP è come arrivarci. Un server DNS dice a un computer a quale indirizzo IP o altre risorse si può trovare un sito web.

Cosa può andare storto con BGP?

Tante cose!

Secondo Cloudflare, due incidenti degni di nota si sono verificati nel 2004 quando un ISP turco ha reindirizzato accidentalmente e inconsapevolmente tutto il traffico Internet al suo servizio e nel 2012, quando un ISP pakistano ha bandito involontariamente YouTube per tutti gli utenti. Un gruppo che commette un errore può riversarsi su altri gruppi a causa della capacità di BGP di diffondersi da un sistema autonomo a un sistema autonomo (ricorda, questa è una delle cose che lo rendono così utile).

Quando un gruppo viene violato, possono sorgere problemi: nel 2018, gli hacker sono riusciti a rubare migliaia in Ethereum tramite un server BGP violato che appartiene a un ISP separato. Il traffico destinato ad Amazon è stato dirottato altrove perché non è stato violato.

Di conseguenza, l’intero sistema potrebbe non essere disponibile se commetti un errore di configurazione. Nessun adesivo è perfetto, ma puoi chiamare amorevolmente BGP il nastro adesivo di Internet. 

Allora, cosa è successo a Facebook?

zuck2

A quanto pare, BGP ha svolto un ruolo centrale nei problemi di Facebook, ma non ne è stata la causa. Come Facebook spiegato in dettaglio martedì, un comando emesso nell’ambito della manutenzione ordinaria ha disconnesso accidentalmente tutti i data center di Facebook. I server DNS dell’azienda hanno smesso di inviare annunci BGP non appena hanno notato che la spina dorsale non parlava con Internet.

Questa interruzione è stata innescata dal sistema che gestisce la capacità della nostra rete backbone globale. La spina dorsale è la rete che Facebook ha costruito per connettere tutte le nostre strutture informatiche, che consiste in decine di migliaia di chilometri di cavi in ​​fibra ottica che attraversano il globo e collegano tutti i nostri data center.

Questi data center sono disponibili in forme diverse. Alcuni sono enormi edifici che ospitano milioni di macchine che archiviano dati ed eseguono i pesanti carichi di calcolo che mantengono in funzione le nostre piattaforme, e altri sono strutture più piccole che collegano la nostra rete backbone a Internet più ampio e alle persone che utilizzano le nostre piattaforme. 

Togliere i server di Facebook da una mappa sembrava essenzialmente che Facebook dicesse a tutti di farlo. Nei minuti prima del blackout di Facebook, il CTO di Cloudflare ha osservato un numero enorme di aggiornamenti BGP dal social network (per lo più ritiri di percorso o linee che scompaiono dalla mappa che porta a Facebook). È stato il responsabile tecnico di Fastly a twittato che Facebook ha interrotto il routing Fastly quando il servizio è stato interrotto giù e KrebsOnSecurity ha confermato che il BGP di Facebook era stato aggiornato.

Alla fine, però, sì. Il sistema BGP di Facebook ha effettivamente cancellato il suo servizio. Tuttavia, le mappe indicavano un’isola più piccola che non esisteva più poiché l’infrastruttura di Facebook era inattiva per altri motivi. Ed è anche importante ricordare che Facebook ha perso fino a $ 100 milioni di entrate. 

Se il problema fosse BGP, come lo risolverebbe Facebook?

Le reti interne di Facebook non avrebbero potuto essere rimosse facilmente. Ci sono state segnalazioni di dipendenti di Facebook che sono stati chiusi da porte protette da badge e che i dipendenti avevano difficoltà a comunicare sul sito di social media. Facebook ha descritto in dettaglio le difficoltà incontrate nel ripristinare i suoi sistemi nel post sul blog del martedì. 

Prendersi cura di un problema di questa portata non richiede semplicemente di capire chi sa come risolverlo e chi ha i permessi per aiutare, ma anche determinare come collegarli. The Verge segnala che gli ingegneri di Facebook avevano fisicamente inviato a un data center della California per cercare di risolvere il problema quando l’intera azienda si ferma.

Sarebbe stato necessario che Facebook verificasse la configurazione del BGP e verificasse se la rete pubblica avesse raccolto i record corretti. Come regola generale, le mappe dovrebbero essere corrette e facilmente accessibili a tutti.

È stato il risultato di un hack?

Le piattaforme di Facebook sono ovviamente una fonte importante di teorie del complotto, ma nonostante la sua importanza, le teorie del complotto sulle piattaforme di Facebook che non funzionano senza la piattaforma sono fuggite online.

Ci sono stati post su forum di hacker clandestini nello stesso momento in cui si è verificata un’interruzione che affermava di vendere i dati degli utenti di Facebook, ma la maggior parte delle autorità affermano che si tratta di una truffa opportunistica e non di una vera violazione.

E i tempi dell’interruzione di Facebook?

Quell’interruzione è sicuramente avvenuta in un momento strano viste le brutte notizie su Facebook, vero?

In primo luogo, è abbastanza facile trovare spiegazioni alternative quando un informatore è andato in televisione e ha mandato in onda i panni sporchi di Facebook. C’è anche la possibilità che questo sia stato solo un errore innocente commesso da uno sfortunato (molto, molto sfortunato) membro dello staff IT di Facebook.

Ecco come Facebook spiega la situazione. Secondo il rapporto, il problema derivava da una “modifica di configurazione errata” apportata dall’organizzazione, non da un attacco subdolo.

Redazione Trend-online.com
Redazione Trend-online.com
Di seguito gli articoli pubblicati dalla Redazione di Trend-online. Per conoscere i singoli autori visita la pagina Redazione Trend-online.com
Seguici
161,688FansLike
5,188FollowersFollow
779FollowersFollow
10,800FollowersFollow

Mailing list

Registrati alla nostra newsletter

Leggi anche
News Correlate