Hotmail riceve miliardi di messaggi e-mail ogni giorno e questi devono essere memorizzati in modo sicuro e devono essere resi prontamente disponibili in modo efficiente. Il sistema di storage basato su cloud di Hotmail supporta oltre un miliardo di cassette postali e centinaia di petabyte di dati (un petabyte è un milione di gigabyte). Gestire in modo efficiente centinaia di migliaia di transazioni simultanee su questa scala è una sfida ingegneristica. Il sistema di archiviazione è realizzato utilizzando la tecnologia Microsoft, inclusi Windows Server e Microsoft SQL Server.
Microsoft ha lavorato a un importante aggiornamento a questo sistema di archiviazione. Dall'inizio di quest'anno un nuovo sistema basato su tecnologie sviluppate su Hotmail è stato eseguito su un cluster pilota utilizzando account personali di dipendenti Microsoft. E dopo test rigorosi, il nuovo sistema è stato certificato che offre una maggiore affidabilità ad un prezzo significativamente più basso.
Vediamo alcune di queste nuove tecnologie utilizzate da Hotmail.
Implementazione di JBOD in sostituzione di RAID:
"RAID (Redundant Array of Inexpensive Disks) è una tecnologia che consente di collegare diversi dischi rigidi a una singola scheda controller, che li fa apparire come un unico disco rigido più grande e più affidabile (a volte chiamato" unità logica ") a il software che esegue il sistema di archiviazione."
Così hanno sviluppato JBOD (Just a Bunch Of Disks) dove le copie dei dati risiedono su hard disk, controller e macchine indipendenti. Così facendo il controller del disco rigido quasi completamente fuori mano e consegnandolo al software da controllare. Questo software di sistema JBOD è stato sviluppato da Hotmail.
“The storage system consists of a set of machines, each of which has its copy of an email message and a journal recording messages that have arrived, organized by arrival date. The machines talk to each other from time to time, compare their journals, and copy any messages that they realize haven’t been copied to all machines.“
Implementazione di unità a stato solido (SSD) invece di dischi rigidi.
Sappiamo che gli SSD sono molto più veloci dei dischi rigidi. I dischi rigidi, anche se più grandi e più economici, sono lenti nel gestire il tasso di richieste.
“A normal hard drive can perform a little more than one hundred read/write operations per second, whereas some of the fastest SSDs can do over one hundred thousand operations per second.”
Anche se questa velocità ha un prezzo in quanto sono molto costosi / gigabyte rispetto ai dischi rigidi.
Gli SSD gestiscono il carico in continuo cambiamento in modo efficiente. Questo può essere spiegato come Hotmail non solo memorizza i messaggi e-mail, ma tiene anche traccia dei vari metadati che cambiano costantemente, come l'elenco dei messaggi nella posta in arrivo, lo stato letti / non letti dei messaggi, il threading delle conversazioni ecc. Questi metadati però occupano una piccola parte dello spazio di archiviazione mette il carico massimo sui dischi rigidi a causa della natura sempre mutevole. Pertanto, l'utilizzo di SSD per la memorizzazione di metadati e dischi rigidi per i messaggi rappresenta una combinazione migliore ed efficiente.
Se hai notato, Hotmail è diventato davvero veloce. Se non l'hai - prova ora.