Souveraineté numérique

Nous assistons une fois de plus à l’émergence de questions fondamentales d’indépendance, de sécurité et d’autonomie stratégique : la souveraineté numérique est tendance. Continue reading
Joachim Ganseman is informaticus en heeft een verleden als doctoraatsstudent aan de Universiteit Antwerpen, met zijsprongen naar Queen Mary University in London en Stanford University, waarbij hij focuste op digitale signaalverwerking en analyse van audio. Sinds 2018 werkt hij bij Smals Research waar hij zich concentreert op AI-gerelateerde onderwerpen - o.a. machine learning, natural language processing, data science - en hun mogelijke toepassingen in overheidscontext. Naast het werk is hij een uitstekend pianist, en als medestichter en -organisator van de Belgische Informatica-olympiade ontving hij in 2016 de jaarprijs wetenschapscommunicatie van de Koninklijke Vlaamse Academie voor Wetenschappen van België.
Email: joachim.gansemanblah [at] blah blahsmals.be
Website: https://www.ganseman.be/
Twitter: jganseman
Slides van de webinar voor Smals Academy op 14/12/2023 (texte français : voir ci-dessous)
Languages: | English |
Author: | Joachim Ganseman |
Category: | Presentation |
Date: | 2023/12 |
License: | CC Attribution-NonCommercial-ShareAlike |
Download: | Download |
GPT4All laat je toe om op je eigen computer met open taalmodellen te experimenteren op ChatGPT-achtige wijze, zonder nood aan internetverbinding of GPU. Spelen met de parameters verschaft inzicht in de werking, de benodigde rekenkracht en de outputkwaliteit. De tool heeft ook een ingebouwde server en wordt ondersteund in de populaire LangChain library.
GPT4All vous permet d'expérimenter des modèles de langue ouverts sur votre propre ordinateur, à la manière de ChatGPT, sans connexion Internet ni GPU. Jouer avec les paramètres permet de mieux comprendre le fonctionnement, les besoins en puissance de calcul et la qualité des résultats. L'outil dispose également d'un serveur intégré et est compatible avec la bibliothèque logicielle LangChain.
Languages: | Nederlands |
Author: | Joachim Ganseman |
Category: | Quick Review |
Date: | 2023/07 |
Platforms: | Windows |
License: | Open Source |
Keywords: | Artificial Intelligence, Open Source Software |
Download: | Download |
Slides van de webinar voor Smals Academy op 01/12/2022 (texte français : voir ci-dessous)
Languages: | English |
Author: | Joachim Ganseman |
Category: | Presentation |
Date: | 2022/12 |
Platforms: | Windows |
License: | CC Attribution-NonCommercial-ShareAlike |
Keywords: | Synthetic Data, Artificial Intelligence, Analytics |
Download: | Download |
Slides van de webinar voor Devoxx op 12/10/2022
Using ‘real’ data may be tempting, yet under the GDPR it’s not a good idea when dealing with personal information. Unfortunately, testing or debugging software may be harder without having full access to all underlying data. A synthetic dataset can be a good solution: generating fictitious replacement data, that mimics the structure and distribution of the original data. Joachim Ganseman from Smals Research talks about how synthetic data can be generated, and especially about the practical concerns and limitations. How do we deal with rarely occurring values, correlations or dependencies? What about the balance between maximum privacy protection vs. retaining enough functional usability? Can we do reliable analytics on a synthetic dataset? He will share some practical examples using open source software in Python.
Video recording published on YouTube
Languages: | English |
Author: | Joachim Ganseman |
Category: | Presentation |
Date: | 2022/10 |
License: | CC Attribution-NonCommercial-ShareAlike |
Keywords: | syn |
Download: | Download |
SDV (Synthetic Data Vault)is een populaire open source library voor het genereren van een nieuwe synthetische dataset naar het model van een zelf opgegeven dataset. Ze is gemakkelijk te integreren in een data processing workflow op basis van Python. De library is nog in alfa-status en actief in ontwikkeling, Ze is gratis en vrij beschikbaar onder MIT licensie.
SDV (Synthetic Data Vault) est une bibliothèque open source populaire permettant de générer un nouvel ensemble de données synthétiques modélisé sur un ensemble de données spécifié. Il s'intègre facilement dans un flux de traitement de données basé sur Python. La bibliothèque est toujours en version alpha et en développement actif. Elle est gratuite et librement disponible sous licence MIT.
Languages: | Nederlands |
Author: | Joachim Ganseman |
Category: | Quick Review |
Date: | 2022/03 |
Platforms: | Windows, Linux, Mac OS X |
License: | Open Source |
Keywords: | Artificial Intelligence, Synthetic Data, NLP, Privacy, anonimisatie |
Download: | Download |
Slides van de webinar voor SAI op 17/02/2022
Natural Language Generation (NLG) gaat over het automatisch creëren van correcte en inhoudelijk betekenisvolle tekst. Dit kan vandaag ook met behulp van Artificiële Intelligentie, net zoals men realistische foto's en zelfs video’s kan namaken. Wat is de stand van zaken van deze technologie, wat zijn de opportuniteiten en de gevaren? Artificiële Intelligentie is echter niet zaligmakend, en we bekijken in dit webinar ook alternatieven voor het automatisch genereren van tekst die eenvoudiger of robuuster kunnen zijn.
We stofferen alles met voldoende voorbeelden en ervaringen geput uit experimenten die Smals Research het voorbije jaar heeft uitgevoerd. Tot slot peilen we naar toepassingen binnen een overheidscontext. We hopen u met dit webinar te inspireren om de mogelijkheden van NLG binnen uw organisatie te ontdekken.
Languages: | Nederlands |
Author: | Joachim Ganseman |
Category: | Presentation |
Date: | 2022/02 |
License: | CC Attribution-NonCommercial-ShareAlike |
Keywords: | NLG, Artificial Intelligence, NLP |
Download: | Download |
Slides van de webinar voor Smals Academy op 28/10/2021
(texte français : voir ci-dessous)
Natural Language Generation (NLG) gaat over het automatisch creëren van correcte en inhoudelijk betekenisvolle tekst. Dit kan vandaag ook met behulp van Artificiële Intelligentie, net zoals men realistische foto’s en zelfs video’s kan namaken. Wat is de stand van zaken van deze technologie, wat zijn de opportuniteiten en de gevaren? Artificiële Intelligentie is echter niet zaligmakend, en we bekijken in dit webinar ook alternatieven voor het automatisch genereren van tekst die eenvoudiger of robuuster kunnen zijn.
Languages: | Nederlands |
Author: | Joachim Ganseman |
Category: | Presentation |
Date: | 2021/10 |
License: | CC Attribution-NonCommercial-ShareAlike |
Keywords: | NLP, NLG, Artificial Intelligence |
Download: | Download |
Leximancer is een commerciële tool die uit een grote hoeveelheid tekst de belangrijkste onderwerpen identificeert, deze groepeert in gerelateerde concepten, en de relaties ertussen visualiseert. De gebruiker kan bij elke tussenstap de resultaten verfijnen. Mogelijke toepassingsdomeinen zijn digitaal forensisch onderzoek of inspectie, analyse van grootschalige bevragingen, of pers- of literatuurreviews.
Leximancer est un outil commercial qui dans une grande quantité de texte, identifie les sujets les plus importants, les regroupe en concepts connexes, et visualise les relations entre eux. L'utilisateur peut affiner les résultats à chaque étape intermédiaire. Parmi les domaines d'application possibles se trouvent la criminalistique ou l'inspection numérique, l'analyse des questionnaires à grande échelle ou encore les revues de presse/littérature.
Languages: | Nederlands |
Author: | Joachim Ganseman |
Category: | Quick Review |
Date: | 2021/10 |
Platforms: | Windows, Linux, Mac OS X, iOS |
License: | Commercial |
Keywords: | NLP, Analytics, Leximancer |
Download: | Download |
RosaeNLG is een Natural Language Generation templating engine, gebouwd op de Pug templating engine voor node.js. In RosaeNLG kan je templates definiëren om JSON objecten om te zetten in een beschrijving in natuurlijke taal. RosaeNLG maakt daarbij in de achtergrond gebruik van woordenboeken om de correcte grammaticale regels toe te passen voor lidwoorden, vervoegingen, verbuigingen en naamvallen. Er worden momenteel 5 talen ondersteund: Engels, Frans, Duits, Spaans en Italiaans.
RosaeNLG est un moteur de génération de langage naturel, construit sur le moteur de modèles Pug pour node.js. Dans RosaeNLG, vous pouvez définir des modèles pour convertir les objets JSON en une description en langage naturel. RosaeNLG utilise des dictionnaires pour appliquer les règles grammaticales correctes pour les articles, les conjugaisons, les inflexions et les cas. Actuellement, 5 langues sont supportées : anglais, français, allemand, espagnol et italien.
Languages: | Nederlands |
Author: | Joachim Ganseman |
Category: | Quick Review |
Date: | 2021/07 |
License: | Open Source |
Keywords: | Artificial Intelligence, NLP, NLG |
Download: | Download |
Slides van de webinar voor InfoSecurity op 31/03/2021
Natural Language processing technologieën gebruiken we ondertussen dagelijks, in de vorm van chatbots en virtuele assistenten – denk Siri of Google Assistant – of in tools gaande van autocomplete tot automatische vertaling. In het Engels werkt dat vrij goed; Nederlands blijft moeilijker maar er is toch ook snelle vooruitgang. Hoe kan je nu zelf een systeem maken voor herkenning van entiteiten in Nederlandstalige documenten? Met een focus op tekst (spraak is voor een andere keer), werken we een praktisch voorbeeld uit waarvoor we gebruik maken van openlijk beschikbare documenten en open source componenten.
Les technologies de traitement du langage naturel sont désormais utilisées quotidiennement, sous la forme de chatbots et d'assistants virtuels - pensez à Siri ou Google Assistant - ou dans des outils allant de l'autocomplétion à la traduction automatique. En anglais, cela fonctionne assez bien; le néerlandais reste plus difficile mais les progrès sont rapides. Alors comment faire un système de reconnaissance des entités dans les documents néerlandais ? En nous concentrant sur le texte (la parole est pour une autre fois), nous élaborons un exemple pratique en utilisant des documents librement disponibles et des composants open source.
Languages: | Nederlands |
Author: | Joachim Ganseman |
Category: | Presentation |
Date: | 2021/04 |
License: | CC Attribution-NonCommercial-ShareAlike |
Keywords: | Artificial Intelligence, Open Source Software, NLP, NER |
Download: | Download |
Slides van de webinar voor Smals Academy op 15/09/2020.
Zoals bij alle statistische en data onderzoeken, kunnen toepassingen van Artificial Intelligence (AI) leiden tot verkeerde en/of zelfs ongepaste resultaten. Dit is bijvoorbeeld het geval bij gezichtsherkenning of tekstanalyse, met mogelijk negatieve impact voor individuen (vb. recruterings tools op basis van AI).
Naast een algemene uiteenzetting over de meest voorkomende struikelstenen van AI, hebben we het ook kort over de impact op individu en maatschappij, en over hoe negatieve neveneffecten voorkomen of verminderd kunnen worden.
Languages: | English |
Author: | Joachim Ganseman |
Category: | Presentation |
Date: | 2020/09 |
License: | CC Attribution-NonCommercial-ShareAlike |
Download: | Download |
BabbleLabs Clear Edge slaagt uitzonderlijk goed in het wegfilteren van verschillende soorten storend achtergrondlawaai uit spraak. De Windows 10 applicatie integreert vlot met VoIP toepassingen (Skype, Teams, Webex etc.), en is nuttig voor wie regelmatig VoIP gesprekken aangaat of ontvangt vanuit een lawaaierige omgeving. Een multiplatform SDK is beschikbaar voor ontwikkelaars die spraakgestuurde toepassingen bouwen. BabbleLabs Clear Edge Client is commerciële software die 3 maanden gratis geprobeerd kan worden.
BabbleLabs Clear Edge parvient exceptionnellement bien à éliminer différents types de bruit de fond gênants lors de la parole. L'application Windows 10 s'intègre facilement aux applications VoIP (Skype, Teams, Webex...) et se montre utile pour ceux qui passent ou reçoivent régulièrement des appels VoIP dans des environnements bruyants. Un SDK multiplateforme est disponible pour les développeurs qui construisent des applications à commande vocale. BabbleLabs Clear Edge Client est un logiciel commercial qui peut être testé gratuitement pendant 3 mois.
Annexes: | |
Languages: | Nederlands |
Author: | Joachim Ganseman |
Category: | Quick Review |
Date: | 2020/06 |
Platforms: | Windows, Windows Mobile |
License: | Commercial |
Download: | Download |
Languages: | Nederlands |
Author: | Joachim Ganseman |
Category: | Annexe |
Date: | 2020/06 |
Download: | Download |
Languages: | Nederlands |
Author: | Joachim Ganseman |
Category: | Annexe |
Date: | 2020/06 |
Download: | Download |
OBS Studio is een stabiel en matuur desktop programma om screencasts of podcasts te maken of om evenementen of presentaties te livestreamen. Het treedt op als encoder voor streamingplatformen en biedt ruime opties voor paralelle inputs en lay-outing. Voor live interactie is het minder geschikt. Documentatie en tutorials zijn snel gevonden. OBS Studio is open source en gratis.
OBS Studio est un logiciel stable et mature permettant de réaliser des screencasts ou des podcasts ou encore de diffuser en direct des événements ou des présentations. Il agit comme un encodeur pour des plateformes de streaming et offre un large éventail de possibilités d'entrées parallèles et de mise en pages. Il convient toutefois moins aux interactions en direct. On peut rapidement trouver de la documentation ainsi que des tutoriels. OBS Studio est un logiciel open source gratuit.
Languages: | Nederlands |
Author: | Joachim Ganseman |
Category: | Quick Review |
Date: | 2020/04 |
Platforms: | Windows, Linux, Mac OS X |
License: | GNU General Public License |
Keywords: | OBS; screencast; livestream; broadcast; elearning; open source |
Download: | Download |
NL
Dat AI een hype is, is een understatement. Waar komt dat vandaan, wat stelt dat nu allemaal voor en wat kan je ermee in de praktijk? Smals Onderzoek experimenteert op verschillende vlakken met AI, soms met veelbelovende resultaten maar soms ook niet. Sowieso zijn er heel wat barrières te overwinnen vooraleer je tot een betrouwbaar, laat staan productieklaar, AI-systeem komt. Op 18 en 24 juni laten onze onderzoekers hun licht schijnen over AI-toepassingen in de overheidssector vanuit de praktijk. Daartoe putten zij uit de in de voorbije 2 jaar gevoerde experimenten als onderdeel van een continu leerproces dat nog niet te einde is. Tipje van de sluier: was het allemaal maar zo gemakkelijk als de marketingafdelingen het laten uitschijnen!
FR
Dire que l'IA fait couler beaucoup d'encre est un euphémisme. Pourquoi un tel battage ? Qu'en est-il aujourd'hui ? Que permet l'intelligence artificielle dans la pratique ? Smals Research expérimente l'IA dans divers domaines, parfois avec des résultats prometteurs, parfois non. En tout état de cause, il y a de nombreux obstacles à surmonter avant d'aboutir à un système d'IA fiable, sans même parler d'un système prêt pour la production. Les 18 et 24 juin, nos chercheurs proposeront un retour pratique sur les applications d'IA dans le secteur public. Pour ce faire, ils s'appuieront sur les expériences menées au cours des deux dernières années dans le cadre d'un processus d'apprentissage continu qui n'est pas encore terminé. Petit avant-goût : si seulement c'était aussi simple que les services marketing le laissent entendre !
Languages: | Français, Nederlands |
Author: | Katy Fokou, Joachim Ganseman |
Category: | Presentation |
Date: | 2019/06 |
License: | CC Attribution-NonCommercial-ShareAlike |
Keywords: | Artificial Intelligence, E-government, Pdf |
Download: | Download |
AI systems are more and more expected to take autonomous decisions, often well hidden from plain view. This is not necessarily without danger. In this talk I'll give a high-level overview of some common pitfalls in AI-powered applications, that require more thought than many AI gurus would admit. On the menu: bias and fairness, confounding variables, adversarial attacks, ethics, explainability, ... As this presentation was given at a security-focused event, special attention is given to security concerns for individuals and society, such as AI-augmented phishing and disinformation campaigns.
Languages: | English |
Author: | Joachim Ganseman |
Category: | Presentation |
Date: | 2019/03 |
License: | CC Attribution-NonCommercial-ShareAlike |
Keywords: | Artificial Intelligence |
Download: | Download |
Rocket.Chat is een on-premise en gratis Team Messaging Platform, een alternatief voor Slack, Microsoft Teams of Google Hangouts. De gebruikersinterface is intuïtief en de vele integraties maken het mogelijk om de software in te zetten als team chat oplossing, configureerbaar voor een brede waaier aan teams binnen de organisatie.
Rocket.Chat est une Team Messaging Platform sur site et gratuite, une alternative à Slack, Microsoft Teams et Google Hangouts. L'interface utilisateur est intuitive et les nombreuses intégrations permettent d'utiliser le logiciel comme une solution de messagerie instantanée largement personnalisable pour les diverses équipes au sein de l'organisation.
Languages: | Nederlands |
Author: | Joachim Ganseman |
Category: | Quick Review |
Date: | 2019/01 |
Platforms: | Windows, Linux, Mac OS X, iOS, Android |
License: | Open Source |
Keywords: | messaging; team; chat; communication; open source |
Download: | Download |
Conversational Interfaces zijn flink in opmars. Vandaag zijn het vooral chatbots en spraakassistenten die in de kijker staan. Maar hoe werken deze interfaces? Waar kunnen ze toegepast worden? Wat is de rol van artificiële intelligentie? En wat moet u weten als u er zelf één wilt bouwen? De dienst Onderzoek van Smals ging zelf aan de slag en werkte twee experimenten uit met een chatbot en spraakassistent.
Conversational interfaces sturen systemen aan met spraak, zoals bij Amazon Alexa, of tekst, zoals bij chatbots. Eindgebruikers zien ingewikkelde formulieren en procedures zo vervangen door een intuïtieve ervaring. Bovendien kan de interactie met de gebruiker gepersonaliseerd worden: de interface kan context onthouden en herkennen, zoals de geschiedenis van eerder gestelde vragen of klantengegevens van de gebruiker. Artificiële Intelligentie en Machine Learning liggen dan ook aan de grondslag van een goed werkende conversational interface. Het is dankzij de fors toegenomen belangstelling in chatbots dat conversational AI in zijn geheel steeds meer aandacht krijgt.
De onderzoeksgroep van Smals nam conversational interfaces onder de loep en realiseerde twee succesvolle experimenten:
Languages: | Nederlands |
Author: | Joachim Ganseman & Bert Vanhalst |
Category: | Presentation |
Date: | 2018/09 |
Platforms: | Windows |
Keywords: | chatbot; AI; artificial intelligence |
Download: | Download |
Grafana is een open-source tool om informatie uit databases flexibel te visualiseren in een dashboard. De weergave kan automatisch geüpdated worden, en notificaties kunnen ingesteld worden bij het opmerken van bepaalde events. Grafana is breed inzetbaar voor het monitoren van live systemen, en ook nuttig voor eenvoudige data-exploratie en analytics.
Grafana est un outil open source permettant de visualiser avec flexibilité, dans un dashboard, des informations présentes dans des bases de données. L’affichage peut être actualisé automatiquement et il est possible de paramétrer les notifications de certains événements. Grafana est largement exploitable pour le monitoring de systèmes opérationnels, mais aussi utile pour aisément explorer et analyser des données.
Languages: | Nederlands |
Author: | Joachim Ganseman |
Category: | Quick Review |
Date: | 2018/03 |
Platforms: | Windows, Linux, Mac OS X |
License: | Open Source |
Keywords: | Monitoring, Analytics, Open Source Software, Grafana, Event |
Download: | Download |
Nous assistons une fois de plus à l’émergence de questions fondamentales d’indépendance, de sécurité et d’autonomie stratégique : la souveraineté numérique est tendance. Continue reading →
We zien vandaag fundamentele kwesties rond onafhankelijkheid, veiligheid en strategische autonomie opnieuw ter sprake komen: Digitale Soevereiniteit is hot. Continue reading →
Comment protéger les données personnelles communiquées sans méfiance avec des agents conversationnels ? Le filtrage automatique peut partiellement aider, mais il ne s’agit pas d’une solution miracle. Continue reading →
Hoe beschermen we persoonsgegevens die nietsvermoedend via chat worden meegedeeld? PII filtering kan gedeeltelijk helpen, maar is geen mirakeloplossing. Continue reading →
Nous vous en disons plus sur l’AI Act européen, dernière pierre angulaire d’une série d’initiatives législatives à grande échelle destinées à réglementer l’économie numérique en Europe. Continue reading →
Meer over de Europese AI Act, de laatste hoeksteen van een reeks grootschalige wetgevende initiatieven die de digitale economie in Europa in een gereguleerd framework moeten gieten. Continue reading →
Un assistant de codage respectueux de la vie privée pour un IDE avec des outils open source – comment faire ? Continue reading →
Een privacyvriendelijke coding assistant voor een IDE met open source tools – hoe doe je dat? Continue reading →
1 an plus tard, l’impact de ChatGPT peut être qualifié de transformateur. Petite rétrospective et petite prospective Continue reading →
Na 1 jaar mag de impact van ChatGPT gerust transformatief genoemd worden. Een terugblik op een bewogen jaar, en een voorzichtige poging tot vooruitblik. Continue reading →