Faire face à l’explosion des données (2)

09 nov. 2010
Publié par Gare
Version imprimableEnvoyer à un ami

Zettaoctets35 Zettaoctets en 2020 ! C’est le volume des données qui devront être stockées à cette échéance soit une croissance moyenne par an de 45 % par rapport au 1,2 Zo de la fin de 2010. Face à cette croissance exponentielle des données, les capacités de stockage croîtront d’un facteur 30. Les budgets n’augmenteront eux que d’un facteur 1,4. Il est facile de voir qu’il n’y aura pas le compte !

Il faudra cependant faire face à ce tsunami numérique. On en parlait déjà dans ce billet. Voici d'autres éléments. Une partie de la réponse viendra du ciel ! Le Cloud pourrait être une partie de la réponse.
 
La question devient urgente : comment stocker les données sans cesse crées par un monde entièrement numérique ? Les chiffres que nous avançons proviennent de prévisions d’IDC qui suit pour constructeur du monde du stockage la croissance des données dans le monde. Selon cette étude, s’il avait fallu conserver chaque octet numérique créé en 2009, ce volume aurait dépassé de 35 % les capacités de stockage disponible. Merci donc à tous ceux qui ont perdus des données ou qui simplement en ont supprimées ! D’ici 2020 ce déficit de capacité sera de l’ordre de 60 %. Entre temps de nombreuses données auront été créées par des terminaux mobiles de plus en plus nombreux. Pourtant pour bon nombre d’entreprises il est impossible de se passer de ce monceau de données pour leurs activités. Ainsi dans le secteur de la Santé, le volume des données est multiplié par 4 tous les deux ans.
 
Des serveurs plus efficaces
 
Les nouvelles générations de serveurs de stockage bénéficient des améliorations de toute l’industrie. On peut commencer par les processeurs. Les dernières générations de machines intègrent les plates-formes les plus récentes Power chez IBM ou Intel et AMD dans les environnements x86. Ce point n’est pas le plus important dans le stockage. Le traitement des entrées/sorties, la bande passante de transfert des données et la capacité de stockage et son évolution sont les éléments principaux. Sur ces points les constructeurs ont fait d’importants efforts.
Les disques durs ou les supports magnétiques connaissent régulièrement des améliorations de performances. En haut des performances mais avec des coûts encore prohibitifs, les disques SSD ou le support s’appuyant sur la technologie Flash ont conquis le haut du marché et les environnements nécessitant de rapides transactions ou requêtes.
De 7000 tours, les disques durs les plus rapides du moment culminent à 15 000 tours désormais et des supports comme les disques durs SAS à 10 0000 tours deviennent le nec plus ultra des indices de performance reléguant peu à peu les disques Fibre Channel à une parenthèse de l’histoire de l‘informatique.
A côté de ces disques très rapides et ultra-performants, la réalité des coûts de stockage et d’archivage font que les données les moins accédées sont déplacées vers de supports peu chers comme des disques SATA. Ce schéma d’éloignement des données vers des supports de plus en plus économiques au long de leur cycle de vie continue en migrant les données de ces disques économiques vers d’autres supports comme des bandes virtuelles ou physiques. Le coût total de possession des bandes reste inférieurs pour des données peu ou rarement accédées à des supports disques. Selon une étude du Clipper Group, le ratio du To stocké sur un disque SATA et une bande LTO-4, la génération précédente de bande est de 1 pour 23 !
Plus rapides, les disques et bandes contiennent plus de données. De 500 Go, les disques durs intégrés dans les solutions de stockage ont des capacités de 2 To.
Les serveurs de stockage bénéficient d’autre part des recherches dans le secteur des mémoires et de l’extension des caches dans les cartes processeurs pour faciliter les opérations d’entrées/sorties, goulet d’étranglement des processus hardware dans le stockage. Des systèmes de serveurs en lames actuels proposent jusqu’à 2 To de mémoire vive par blade. Par rack de 48 serveurs, il suffit d’imaginer les possibilités ainsi créées pour la gestion des entrées/sorties.
 
Ne pas oublier la connectivité
 
Dans le même ordre d’idée, le stockage profite de l’augmentation des débits dans la connectivité à l’intérieur des centres de données et entre les sites de l’entreprise et les usines à informatiques. Pour montrer l’importance de cette question, IBM vient de mettre près de 400 millions de dollars (estimation Barron’s) pour mettre la main sur les appliances réseaux de ce constructeur californien. L’équipementier proposait des lames de connectivité à des vitesses de 1 Gb/s ou 10 Gb/s pour les complexes BladeCenter d’IBM. Vishal Sikka, lors d’une allocution récente à SAP TechEd a évoqué une connectivité à près de 300 Gb/s à moyen terme (2012).
 
Le Cloud une réponse ?
 
Malgré ces nombreux points d’améliorations directement sur les éléments matériels des environnements de stockage, les entreprises ne peuvent à termes gérer le différentiel entre la croissance des données et la capacité de stockage disponible. Une des réponses possibles est de pouvoir éloigner d’importants volumes de données vers d’autres infrastructures. Le Cloud pourrait devenir ainsi un outil privilégié pour le faire.
Le recours au nuage est une évidence devant la situation qui se profile. Tout d’abord, le Cloud réduirait le coût des infrastructures IT en réduisant les dépenses de maintenance des équipements de stockage. Il reste encore à savoir si le nuage sera juste un simple « garde-données » comme il y a des garde-meubles dans le monde physique. Le mode transactionnel vers le Cloud connaît encore des limites de performances. Cela plaiderait donc pour cette application de simple éloignement des données peu utilisées ou accédées pour des périodes de rétention de plus en plus longues. Cependant les progrès rapides des technologies pourraient faire revenir sur cette vis dans le domaine transactionnel avec la possibilité d’utiliser le stockage en ligne comme un véritable NAS (Network Attached Storage) en ligne. Ce phénomène n’en devrait pas être négligeable. 14 % des données devraient être hébergées, gérées ou mises en mémoire sur des services sur le nuage en 2020. La même année, ce seront près de 30 % de l’ensemble des données numériques qui seront sur le Cloud.
 
 
 
Share/Save
Tags:


Nos abonnements

Abonnez-vous aux flux RSS :

RSSle fil des blogs

RSSle fil des articles


La newsletter de l'Infrastructure Intelligente

Tenez-vous au courant de nos dernières nouvelles!

Syndiquer le contenu