Typologie des anomalies, un cadre pour l’action : le cas du machine learning

La qualité d’une donnée désigne son adéquation aux usages et objectifs visés (« fitness for use ») (Boydens, 1999, Boydens 2014). Dans cet article nous allons voir comment une typologie rigoureuse des anomalies offre un cadre pour l’amélioration de la qualité des données, dans de nombreux domaines, dont le machine learning. Continue reading

Machine Learning : data quality challenges in the scope of a “fitness for use” (ULB, 18/05/22, 14h, on line)

La prochaine journée FNRS “Analyse critique et amélioration de la qualité de l’information numérique” aura lieu le 18 mai de 14h à 15h30 en mode on line.    Le thème cette année, « Apprentissage automatique (ML) : les challenges de la qualité … Continue reading

Data Quality Tools : retours d’expérience et nouveautés

Isabelle Boydens(*), Isabelle Corbesier(**) et Gani Hamiti(**) (*) Data Quality Expert, Research Team (**) Data Quality Analyst, Databases Team La problématique de la qualité des données (ou “fitness for use“, adéquation aux usages) est maintenant reconnue au plan international comme … Continue reading

Data Quality : “Anomalies & Transactions Management System” (ATMS), prototype & “work in progress”

ATMS

Update 20 novembre 2024 Isabelle Boydens(*), Gani Hamiti(**), Rudy Van Eeckhout(***) (*) Data Quality Expert, Research Team (**) Data Quality Analyst, Databases Team (***) Databases R&D, Databases Team En 2019, nous annoncions un Proof of Concept relatif à la mise … Continue reading

Géocodage : contourner les lacunes d’OpenStreetMap (partie 2)

Dans notre article précédent, nous présentions les difficultés que nous avons rencontrées dans notre tentative de géocoder (convertir une adresse en coordonnées géographiques, et standardiser cette adresse) avec Nominatim, le géocodeur d’OpenStreetMap. Nous avons aussi évoqué qu’en modifiant légèrement les … Continue reading

Géocodage : contourner les lacunes d’OpenStreetMap (partie 1)

Pour divers clients, nous avons été à la recherche d’une solution permettant de nettoyer (standardiser) des adresses postales, principalement en Belgique. Nous avions besoin d’une solution « on-premise », idéalement en Open-Source. Nous avons voulu construire une solution basée sur … Continue reading

« I want to talk to a HUMAN! » : impact de la qualité des bases de connaissances sur les chatbots (29/01/2020, ULB)

Rencontre « Data quality » FNRS-ULB-Smals le 29/01/2020 à l’Université libre de Bruxelles La prochaine réunion du groupe de contact FNRS « Analyse critique et amélioration de la qualité de l’information numérique » se tiendra le mercredi 29 janvier 2020 dès 13h30 à l’Université libre … Continue reading