Collecter les données

La Collecte des données ou de l'importance des préliminaires....

La phase la plus importante d'un projet se situe bien en amont du lancement proprement dit. On parle alors de l'avant-projet.
Cette caractéristique n'est pas propre aux projets technologiques. Lors de grands travaux de génie civil, le terrassement, la consolidation des sols, la préparation des fondations peuvent représenter une part importance du projet que ce soit en terme de coûts, de délais ou de compétences techniques à mobiliser.
La qualité de l'ouvrage dépendra directement du soin accordé à ces travaux préparatoires.

Dans le cadre d'un projet décisionnel, ce n'est pas la conception des interfaces utilisateurs mais bien les tâches de collecte, de nettoyage et de mise en forme des données qui constitueront le gros morceau, équivalent par analogie aux travaux de préparation des terrains du chantier de génie civil....

Cette phase préalable peut représenter plus des ¾ des coûts et des délais globaux du projet. Et les compétences techniques à mettre en place ne seront pas en reste. Cette phase essentielle était il y a encore peu bien rarement estimée à sa juste valeur. Sa mésestimation est pourtant une des principales causes des échecs des projets décisionnels.

Pourquoi ?
Les entreprises n'ont que rarement conscience de la lourdeur des travaux à entreprendre pour transformer des données de terrain en informations utilisables au sein du processus décisionnel. Les données collectées au coeur des systèmes de production, même lorsque ceux-ci sont pleinement opérationnels, ne peuvent être utilisés telles quelles à des fins décisionnelles. Les données, dites de production, sont trop souvent imprécises et incohérentes voire erronées.
D'autre part, l'analyse décisionnelle consiste essentiellement à rapprocher des données de sources différentes. Cette opération fondamentale n'est possible que lorsque les informations utilisent un même format et sont dans une logique similaire de gestion.

Il est simplement dommage qu'il faille trop souvent se casser le nez sur cette problématique fondamentale avant d'en saisir la portée.

Afin d'illustrer mon propos, je vous conterai lors d'une prochaine publication une expérience de terrain. Elle m'a été rapportée récemment par un collègue spécialiste du data mining. Je tiens cependant à lui soumettre le texte avant de le publier.


4 commentaires


1 C'est vrai que la collecte est un sujet dont on parle de plus en plus. Pour mon cas particulier nous sommes sur un projet de ce type et on a quand même quelques difficultés à faire établir un devis précis. Des idées ? (Recopié par AlainF suite transfert)
Remy

2 Je bute moi même sur un pb de ce type. J'aimerai savoir s'il existe des sites ou forums francais traitant du theme des outils ETL comme : Comment choisir, comment les utiliser, faut-il préférer l'open source, enfin tous ce genre de pb .
Phil
Philippe Davout

3 Phil> tu peux essayez le forum suivant : http://www.developpez.net/forums/forumdisplay.php?f=502
rudy

4 Je réalise un mémoire sur l'intégration (ou l'integrité) des données au sein d'un datawarehouse. Auriez vous des sources documentaires à me proposer pour que je puisse avancer dans mes recherches?
grimaud

Nouveau commentaire


Partagez avec Twitter  Partagez sur Facebook  Partagez sur LinkedIn  Partagez sur Viadeo  Partagez sur Del.icio.us  

Envoyer le lien de cet article par e-mail  Recommandez cet article

Suivez aussi les news du portail sur Twitter et rejoignez-nous sur Facebook

Pour établir un lien vers cet article depuis votre site recopiez le lien suivant.
La reproduction ou la traduction totale ou partielle de ce texte, images et documents est formellement interdite. Voir ici les conditions pour publier un extrait sur votre site ou blog.
Ce texte et les images et documents qu'il contient est déposé auprès de l'IDDN

  • Voir le chapitre :Maitriser les technologies



    Copyright : Alain FERNANDEZ ©2004-2012- Tous droits réservés


  • Articles les + lus
    Comment réussir son analyse de risques ?
    Concevoir les tableaux de bord des ressources humaines
    Comment réussir l'accompagnement du changement ?
    Une réunion efficace, comment faire ?
    Comment choisir un indicateur de performance KPI Key Performance Indicator ?
    Tableau de bord, Excel et les Sparklines


    Nouveaux tableau de bord Nouveaux tableaux de bord des managers
    Livre de référence
    Le projet décisionnel en totalité
    5ème édition 2011
    Eyrolles
    Voir fiche détaillée


    chef de projet Le chef de projet efficace .
    12 bonnes pratiques pour une démarche d'entrepreneur
    4ème édition 2011
    Eyrolles
    Voir fiche détaillée


    Essentiel du tableau de bord L'essentiel du tableau de bord
    Une méthode pratique simple et claire pour concevoir son tableau de bord avec Excel.
    3ème édition 2011
    Eyrolles
    Voir fiche détaillée


    tableau de bord Le bon usage des technologies expliqué au manager
    Guide pratique pour comprendre en langage simple les concepts IT. Editions d'organisation

    Voir fiche détaillée

    Perfonomique, e-book du managementPerfonomique
    36 Recommandations pour une management de la performance assumé- 4ème Edition 2011
    E-book gratuit
    250 pages Format PDF
    A télécharger ici

    PDF, livres blancs, ebook à télécharger, gratuits et en téléchargement libre pour la plupart, bonus pour les lecteurs des livres de référence ci-dessus.

    6 Sigma Actualités Autogestion Business Intelligence Conduire le Changement Consultant CRM Data Mining Data Warehouse Décision Développement Durable Economie Entreprise ERP ETL Excel Formation Gimsi Gouvernance Humour Management Indicateurs Information Informatique Décisionnelle Intelligence Collective Knowledge Management KPI Livres Management Méthode OLAP Performance Procédures Processus Projet Qualité Reporting Risques Tableau de bord Technologie Tranches de vie Wiki alain fernandezLe perfologue
    est depuis 2004 le blog pro dédié au pilotage de la performance d'Alain Fernandez profil
    Contact

    Profil Facebook Profil Facebook
    Profil Linkedin Profil Linkedin
    Profil Viadeo Profil Viadeo

    Toutes les pages de ce site, textes, graphiques images sont sous Copyright Alain Fernandez 2004-2012. Mentions légales, confidentialité
    IDDN Certification IDDN Certification

      Maitriser     Gouvernance du SI     Projet BI     Perspectives 2011 de la BI    Qu'est-ce que la BI 2.0 ?   Le cloud computing   Piloter par les enjeux 

      Blog pro      Performance BPM     Tb de bord gestion     Tb de bord Excel      Management de projet     Contrôle de gestion     A son compte         ?  

    Le perfologue, le blog pro du management de la performance
    Vive la performance, e-book du perfologue
    Vive la performance, e-book du perfologue