Thursday 23 May 2013

Contrôle de la qualité des données

Le truisme de l'informatique, " à données inexactes, résultats erronés ", s'applique tout aussi bien au SIG et aux analyses spatiales. Pour l'analyse des risques maritimes, la qualité des sources des données varie considérablement. D'une part, certains trafics de bateaux ont été simulés sur la base du SIG ou de pistes radar, les deux sources fournissant des données exactes sur l'emplacement des bateaux pendant une période quasi continue. D'autre part, les données d'enquête sur les plaisanciers servent à estimer la fréquence et l'emplacement approximatif de ce type d'activité.

Les chercheurs du groupe MARIN sont très scrupuleux dans la conservation des registres (metadonnées) sur les sources des données, leur exactitude relative, les hypothèses et les processus utilisés pour élaborer les données. Certaines de ces procédures sont complexes, combinant des méthodes automatisées et semi-automatisées de vérification et de validation des registres et des domaines dans les bases de données. Pour les analyses spatiales en particulier, des écarts mineurs au niveau des renseignements relatifs à l'emplacement peuvent parfois se transformer en de grosses erreurs dans les résultats de l'analyse, d'où le besoin de méticulosité dans l'élaboration des données. Sous la rubrique générale du nettoyage des données, nous avons inventé le terme géonettoyage pour décrire les processus par lesquels les données sur l'emplacement (telles que la latitude/longitude) sont vérifiées et corrigées.