Een eigen vraag- en antwoordsysteem op basis van taalmodellen

Naar aanleiding van de lancering van ChatGPT duiken er massaal tools op die toelaten om vragen te beantwoorden over je eigen content. Het wordt heel eenvoudig voorgesteld: upload je documenten (PDF, Word, etc.) en je kan quasi onmiddellijk vragen beginnen stellen, typisch in een chatbot-achtige omgeving.

In dit artikel geven we aan hoe zo’n question answering systeem in elkaar steekt en vertellen we wat meer over de kwaliteit die we kunnen verwachten van de output. Continue reading

Typologie van de anomalieën, een kader voor actie: de case van machine learning

De kwaliteit van een gegeven is de geschiktheid ervan voor gebruik en voor de beoogde doelstellingen (‘fitness for use’) (Boydens, 1999, Boydens 2014). In dit artikel gaan we bekijken hoe een rigoureuze typologie van de anomalieën een kader biedt voor de verbetering van de kwaliteit van de gegevens, in verschillende domeinen, waaronder machine learning. Continue reading

Wat is spraakroutering en wat kan het bijbrengen?

In een eerdere blogpost gaven we een overzicht van opportuniteiten voor het verbeteren van de klantenondersteuning. Contactcenters staan namelijk blijvend onder druk om vragen zo efficiënt mogelijk te beantwoorden. In deze blogpost gaan we dieper in op één van de mogelijke technieken, namelijk spraakroutering. Continue reading

Opportuniteiten voor het verbeteren van de klantenondersteuning

Overal staan contactcenters onder druk om vragen van klanten, burgers en ondernemingen zo efficiënt mogelijk af te handelen. Wachttijden kunnen soms hoog oplopen, tot grote frustratie van wie zijn vraag beantwoord wil zien en antwoordverstrekkers die overstelpt worden en moeten … Continue reading

Typologie des anomalies, un cadre pour l’action : le cas du machine learning

La qualité d’une donnée désigne son adéquation aux usages et objectifs visés (« fitness for use ») (Boydens, 1999, Boydens 2014). Dans cet article nous allons voir comment une typologie rigoureuse des anomalies offre un cadre pour l’amélioration de la qualité des données, dans de nombreux domaines, dont le machine learning. Continue reading

Honey, I scraped the kids – over taalmodellen en privacy

Through the looking glass

De datasets die ten grondslag liggen van enorme taalmodellen zijn zonder veel poespas gescraped van het internet. Een korte zoektocht naar persoonsgebonden gegevens hierin, brengt al snel heel wat boven water. Continue reading

Data Quality Tools : retours d’expérience et nouveautés

Isabelle Boydens(*), Isabelle Corbesier(**) et Gani Hamiti(**) (*) Data Quality Expert, Research Team (**) Data Quality Analyst, Databases Team La problématique de la qualité des données (ou “fitness for use“, adéquation aux usages) est maintenant reconnue au plan international comme … Continue reading

Data Quality : “Anomalies & Transactions Management System” (ATMS), prototype & “work in progress”

ATMS

Cet article a été mis à jour le 20 novembre 2024.. En 2019, nous annoncions un Proof of Concept relatif à la mise en place ultérieure d’un service générique d’ATMS (Anomalies & Transactions Management System). Nous en rappelons ici les principales motivations en termes de Data Quality et de ROI, illustrées sur la base de use cases ainsi que les spécifications fonctionnelles. Nous en développerons ensuite les avancées sur le plan technique et en évoquerons les perspectives de développement ultérieur. Continue reading