Géocodage : quel outil pour quel besoin ?

Pour être capable de positionner une adresse sur une carte, pour calculer un itinéraire ou pour identifier l’ensemble des commerces dans un quartier donné, il est nécessaire de passer par une étape fondamentale : le géocodage. Cette opération consiste, à partir d’une adresse postale, comme “Av. Fonsny 20, 1060 Bruxelles”, d’une part à la “standardiser” (partie bordeaux de l’image ci-dessous), d’autre part à lui assigner des coordonnées géographiques (“location” dans l’image).   Continue reading

Typologie des anomalies, un cadre pour l’action : le cas du machine learning

La qualité d’une donnée désigne son adéquation aux usages et objectifs visés (« fitness for use ») (Boydens, 1999, Boydens 2014). Dans cet article nous allons voir comment une typologie rigoureuse des anomalies offre un cadre pour l’amélioration de la qualité des données, dans de nombreux domaines, dont le machine learning. Continue reading

Machine Learning : data quality challenges in the scope of a “fitness for use” (ULB, 18/05/22, 14h, on line)

La prochaine journée FNRS “Analyse critique et amélioration de la qualité de l’information numérique” aura lieu le 18 mai de 14h à 15h30 en mode on line.    Le thème cette année, « Apprentissage automatique (ML) : les challenges de la qualité … Continue reading

Data Quality Tools : retours d’expérience et nouveautés

Isabelle Boydens(*), Isabelle Corbesier(**) et Gani Hamiti(**) (*) Data Quality Expert, Research Team (**) Data Quality Analyst, Databases Team La problématique de la qualité des données (ou “fitness for use“, adéquation aux usages) est maintenant reconnue au plan international comme … Continue reading

Data Quality : “Anomalies & Transactions Management System” (ATMS), prototype & “work in progress”

ATMS

Cet article a été mis à jour le 20 novembre 2024.. En 2019, nous annoncions un Proof of Concept relatif à la mise en place ultérieure d’un service générique d’ATMS (Anomalies & Transactions Management System). Nous en rappelons ici les principales motivations en termes de Data Quality et de ROI, illustrées sur la base de use cases ainsi que les spécifications fonctionnelles. Nous en développerons ensuite les avancées sur le plan technique et en évoquerons les perspectives de développement ultérieur. Continue reading

Data Quality: “Anomalies & Transactions Management System” (ATMS), prototype & “work in progress”

Dit artikel werd bijgewerkt op 20 november 2024. In 2019 kondigden we een Proof of Concept aan voor de latere invoering van een generieke ATMS service (Anomalies & Transactions Management System). We halen hier opnieuw de voornaamste redenen aan op het vlak van Data Quality en  ROI, aangetoond met use cases alsook de functionele specificaties. Vervolgens gaan we van daaruit over op de  technische voortgang en bespreken we de verdere ontwikkelperspectieven. Continue reading

Géocodage : contourner les lacunes d’OpenStreetMap (partie 2)

Dans notre article précédent, nous présentions les difficultés que nous avons rencontrées dans notre tentative de géocoder (convertir une adresse en coordonnées géographiques, et standardiser cette adresse) avec Nominatim, le géocodeur d’OpenStreetMap. Nous avons aussi évoqué qu’en modifiant légèrement les … Continue reading

Géocodage : contourner les lacunes d’OpenStreetMap (partie 1)

Pour divers clients, nous avons été à la recherche d’une solution permettant de nettoyer (standardiser) des adresses postales, principalement en Belgique. Nous avions besoin d’une solution « on-premise », idéalement en Open-Source. Nous avons voulu construire une solution basée sur … Continue reading