Pourquoi une telle course au gigantisme des data warehouses, bases de données décisionnelles ? Est-ce simplement parce que la technologie le permet ?
Savez-vous combien de pages contient la base de recherche de Google ?
Ouif ! Facile la question ! C'est comme le Port-Salut, c'est écrit dessus : 8 Milliards de pages :
8.000.000.000 pages. (1)
Bon. Combien de pages consultez-vous régulièrement ?
Pas tant que cela j'imagine... Chacun prend vite ses habitudes et se limite à ses centres d'intérêt.
Autre question : Savez-vous combien de pages de textes pourrait-on stocker dans une base de 1Tera Octets ?
...
1 Tera octet c'est 1.000.000.000.000 octets.
A raison de 3000 octets par page, je vous laisse faire le calcul....
Le tera-Octet, c'est aussi la nouvelle unité de stockage des Data Warehouses. En tout cas d'après le vendeur que j'ai rencontré dernièrement, on y coupera pas !
Ne me dites pas qu'avec autant de données, vous ne trouverez pas l'information essentielle !
Ah ! Bon ? Vous n'êtes pas sûr de trouver l'information décisive ?
Vous ne pensez pas que de disposer d'autant de données améliorera la qualité de vos décisions ?
Et pourquoi donc ?
Ah parce qu'il vous faut pouvoir accéder aisement uniquement aux données qui vous intéressent, les autres vous vous en fichez !
Très bien. Et quelles sont les données qui vous intéressent ?
Ah voilà la question.
Cela dépend comme dirait l'autre...
En fait c'est bien par là qu'il faudrait commencer.
Par où ?
Et bien par définir quelles sont les données qui nous intéressent et les rendre facilement accessibles.
Alors pourquoi des data warehouses aussi gigantesques ?
Parce que la technologie le permet !
C'est un peu vrai et d'ailleurs Teradata avait publié un papier à ce sujet.
Cela dit, il ne faut pas jeter la pierre à la technologie. Elle n'est pas responsable du manque de structure. Car c'est bien par la question de structure qu'il faut commencer.
Le raisonnement se déroule en ce sens :
1 A quelles informations veut-on pouvoir accéder ?
2 Quelles données faut-il alors mettre dans le DW ?
3 Comment doit-on les organiser ?
Ensuite, la capacité de stockage intervient dans un second temps et chacun verra cette question en fonction des réponses ci-dessus. A noter une question subsidiaire d'importance avant de dimensionner définitivement le système : Et demain ? On évolue comment ?
(1) Pan sur le doigt ! Google n'affiche plus en première page le nombre de pages indexées. La quantité n'est plus un argument face à Yahoo. Ce chiffre doit très largement dépasser les 10-15 Milliards...
Copyright : Alain FERNANDEZ ©2004-2010- Tous droits réservés


Les nouveaux tableaux de bord des managers
Livre de référence
4ème éd 2008 Eyrolles
Best seller,
25.000 ex.
Voir fiche détaillée

L'essentiel du tableau de bord
Réalisez sans effort votre tableau de bord avec Excel
2ème éd 2008 Eyrolles
Voir fiche détaillée

Le bon usage des technologies expliqué au manager
les concepts IT expliqués simplement
Voir fiche détaillée
"Vive la Performance !"
Le perfologue |
|
|
|
|
|
Le Fil RSS du Perfologue