webleads-tracker

 

Les entreprises recherchent de plus en plus la qualité des données

Les entreprises recherchent de plus en plus la qualité des données

Dans le même temps que les lacs de données font leur apparition dans les contextes de production, la recherche de qualité des données s’impose peu à peu dans les entreprises. C’est un peu comme enfoncer une porte ouverte, mais c’est une des conclusions de la l’étude annuelle de Syncsort (éditeur d’outils BigData), identifiant la recherche de qualité de données comme l’une les grandes tendances de 2018 en matière de Big Data. Pour autant, c’est une conclusion riche d’enseignements : l’étude révèle par exemple que parmi les secteurs d’activités les plus concernés par la qualité des données, ceux de la finance et de la santé sont ceux qui utilisent le plus des lacs de données en production – des secteurs hautement régulés dans le monde entier. Les questionnés ayant participé à cette étude sont également issus d’entreprises du secteur public et du secteur de l’information.

Ainsi sur les deux cents entreprises sondées, 40% déclarent avoir déjà déployé des lacs de données. 32% évoquent des déploiements en cours. Syncsort précise que ces dispositifs inhérents au Big Data sont aujourd’hui considérés comme des éléments clé des Systèmes d’information des entreprises. À Plus de 70% les process de transformation des données (ETL – Extract, Transfert and Load) sont les premiers cas d’utilisation des lacs de données. Suivent les analyses avancées, l’analyse prédictive (64,5%) et l’analyse en temps réel (60%).

Avec des contextes d’activité d’entreprise toujours plus complexes, ces dernières sont aujourd’hui confrontées à l’exploitation de données provenant de différentes sources et leur transfert dans le data lake pour y effectuer les précieuses analyses. Parmi ces sources, la base de données relationnelle est le premier contributeur, enrichisseur de ces plateformes (69,5%) vient ensuite l’entrepôt de données (62,3). Les bases de données NoSQL (46,2%) et les fournisseurs de bases de données tiers (45%) sont aussi des sources importantes, ainsi que le Cloud, une source pour 40,6% des entreprises questionnées.

L’on comprend ainsi l’intérêt croissant des entreprises pour la qualité des données de ces data lakes et pour leur gouvernance. Ce sont là les deux principaux soucis rencontrés par les entreprises questionnées. Ils détrônent d’ailleurs la pénurie de compétences, difficulté n°1 des entreprises lors des trois précédentes études annuelles.

Plus la diversité des formats et des sources de données est grande, plus les entreprises ressentent l’exigence de travailler sur la qualité des données, conclut ainsi Syncsort.

Pour 60% des questionnés, la moyenne des sources de données est de 4, mais pour les entreprises qui en utilisent plus de 5, la recherche de la qualité des données est 4 fois plus importante.

Pour autant, la recherche de la qualité des données n’est pas encore recherchée par toutes les entreprises, y compris par celles qui procèdent par exemple à des opérations d’analyses prédictives. Un véritable « souci », précise Syncsort, rappelant que la qualité des analyses produites sera directement liée à la qualité des données analysées…