webleads-tracker

Qualité de la donnée : un défi permanent

Qualité de la donnée : un défi permanent

La mise en place et le maintien de la qualité des données sont des challenges permanents pour la Direction des Services Informatiques. L’explosion du nombre des données produites rend ces défis de plus en plus difficiles à relever.  Avant de douter de la qualité de vos données, adoptez plutôt une démarche proactive. Voici quelques pratiques visant à l’améliorer.

Dans un contexte où de nouvelles plateformes analytiques fleurissent et tendent à supplanter des frameworks comme Hadoop, une approche réactive s’impose. Sans un dispositif proactif de ‘checking »des informations, les erreurs risquent de s’accumuler. L’objectif ce type de dispositif est d’améliorer la qualité des données, de procéder à l’identification les erreurs potentielles avant qu’elles ne surviennent.

Voici quelques conseils pour vous faciliter la mise en oeuvre d’un dispositif programmatique d’amélioration de la qualité de vos données. 

Essayez d’insuffler un état d’esprit favorable à la qualité des données.

Comme toutes les initiatives visant à faire évoluer une organisation, la création d’un état d’esprit compatible avec le soutien de ce type d’initiative est un préalable. À cette fin, il vous faudra convaincre à la fois, la direction, les équipes IT et métiers de tout l’intérêt des nouveaux dispositifs de vérification. 

Formez les bonnes personnes en les dotant descompétences ad hoc.

Les experts de la donnée sont une denrée rare et généralement très chère. La formation de vos propresexperts est donc une solution intéressante. Nous vous conseillons de proposer ces formations de sciences de la donnée à des profils techniques ou de statisticiens,susceptibles d’être directement confrontés au manque de qualité de certains jeux de données. 

Pas de budget : pas de souci

Vous n’avez pas assez de budget à consacrer à l’acquisition d’outils de gestion des données de référence (MDM) ou de data quality. Ce n’est pas rédhibitoire. On constate en effet que les dispositifs d’amélioration de la qualité des données dans les PME sont souvent composés de procédures, de documents, de bibliothèques de processus et de produits open source. Vous pourrez aussi trouver sur la marché plusieurs solutions MDM et de « checking » des informations en open source, proposés par certains éditeurs comme en autres, Talend, etc.

Un dispositif qui doit être actif dès la création et l’acquisition des données.

Afin d’assurer la qualité permanente des jeux  de données, vous devez instaurer les meilleures pratiques dés la création ou l’acquisition des données provenant de sources externes. Questionnez les utilisateurs d’information afin de déterminer leurs modes d’utilisation. Identifiez comment ces jeux de données sont exploités commercialement. Vous pourrez ensuite créer un standard et des règles de définition des datas pour inciter au respect de leurconformité.

Nous conseillons aux entreprises de toutes tailles une évaluation des suites MDM. L’environnement d’une telle solution et les procédures associées seront à la base de votre programme de qualité des données. 

Le maintien de la qualité des données

L’évaluation régulière du niveau de qualité des données est assurément une composante essentiellede ce type de dispositif.

Cela passe par :

L’identification des données et des experts en la matière, du type d’information prioritaire pour l’entreprise, l’évaluation des actifs les plus importants, la correction des valeurs inexactes.

L’identification des valeurs incorrectes effectuée, votre objectif est la détermination de leur gravité, de leur étendue, des conséquences et de l’origine du problème. Ensuite, il s’agit de prendre les actions nécessaires pour corriger le tir…