Pourquoi une telle course au gigantisme des data warehouses, bases de données décisionnelles ? Est-ce simplement parce que la technologie le permet ?
Savez-vous combien de pages contient la base de recherche de Google ?
Ouif ! Facile la question ! C'est comme le Port-Salut, c'est écrit dessus : 8 Milliards de pages :
8.000.000.000 pages. (1)
Bon. Combien de pages consultez-vous régulièrement ?
Pas tant que cela j'imagine... Chacun prend vite ses habitudes et se limite à ses centres d'intérêt.
Autre question : Savez-vous combien de pages de textes pourrait-on stocker dans une base de 1Tera Octets ?
...
1 Tera octet c'est 1.000.000.000.000 octets.
A raison de 3000 octets par page, je vous laisse faire le calcul....
Le tera-Octet, c'est aussi la nouvelle unité de stockage des Data Warehouses. En tout cas d'après le vendeur que j'ai rencontré dernièrement, on y coupera pas !
Ne me dites pas qu'avec autant de données, vous ne trouverez pas l'information essentielle !
Ah ! Bon ? Vous n'êtes pas sûr de trouver l'information décisive ?
Vous ne pensez pas que de disposer d'autant de données améliorera la qualité de vos décisions ?
Et pourquoi donc ?
Ah parce qu'il vous faut pouvoir accéder aisement uniquement aux données qui vous intéressent, les autres vous vous en fichez !
Très bien. Et quelles sont les données qui vous intéressent ?
Ah voilà la question.
Cela dépend comme dirait l'autre...
En fait c'est bien par là qu'il faudrait commencer.
Par où ?
Et bien par définir quelles sont les données qui nous intéressent et les rendre facilement accessibles.
Alors pourquoi des data warehouses aussi gigantesques ?
Parce que la technologie le permet !
C'est un peu vrai et d'ailleurs Teradata avait publié un papier à ce sujet.
Cela dit, il ne faut pas jeter la pierre à la technologie. Elle n'est pas responsable du manque de structure. Car c'est bien par la question de structure qu'il faut commencer.
Le raisonnement se déroule en ce sens :
1 A quelles informations veut-on pouvoir accéder ?
2 Quelles données faut-il alors mettre dans le DW ?
3 Comment doit-on les organiser ?
Ensuite, la capacité de stockage intervient dans un second temps et chacun verra cette question en fonction des réponses ci-dessus. A noter une question subsidiaire d'importance avant de dimensionner définitivement le système : Et demain ? On évolue comment ?
(1) Pan sur le doigt ! Google n'affiche plus en première page le nombre de pages indexées. La quantité n'est plus un argument face à Yahoo. Ce chiffre doit très largement dépasser les 10-15 Milliards...
Suivez aussi les news du portail sur Twitter et rejoignez-nous sur Facebook
Pour établir un lien vers cet article depuis votre site recopiez le lien suivant.
La reproduction ou la traduction totale ou partielle de ce texte, images et documents est formellement interdite. Voir ici les conditions pour publier un extrait sur votre site ou blog.
Ce texte et les images et documents qu'il contient est déposé auprès de l'IDDN
Copyright : Alain FERNANDEZ ©2004-2012- Tous droits réservés


Le chef de projet efficace
.
12 bonnes pratiques pour une démarche d'entrepreneur
4ème édition 2011
Eyrolles
Voir fiche détaillée

L'essentiel du tableau de bord
Une méthode pratique simple et claire pour concevoir son tableau de bord avec Excel.
3ème édition 2011
Eyrolles
Voir fiche détaillée
Le bon usage des technologies expliqué au manager
Guide pratique pour comprendre en langage simple les concepts IT. Editions d'organisation
Voir fiche détaillée
Perfonomique
PDF, livres blancs, ebook à télécharger, gratuits et en téléchargement libre pour la plupart, bonus pour les lecteurs des livres de référence ci-dessus.
Le perfologue |
|
|
|
|
|
|
|
|
|
Blog pro
Performance BPM
Tb de bord gestion
Tb de bord Excel
Management de projet
Contrôle de gestion
A son compte
?