Les modèles de langage open-source – Une alternative sérieuse à ChatGPT?

L’article explorera les large language models open-source en abordant leur mise en œuvre sur des machines locales, leur facilité d’utilisation et leur qualité de résultats comparée aux modèles propriétaires. Ensuite, il examinera les différentes possibilités d’amélioration des performances de ces modèles sur des tâches spécifiques. Continue reading

Explorer une base de données orientée graphes

Depuis 2017, nous mettons en avant dans ces pages (ici, là, ou encore ici) l’utilisation de bases de données orientées graphes (ou Graph Databases). Gartner prédit que d’ici 2025, les technologies graphes seront utilisées dans 80 % des innovations en données et analytique, contre 10 % en 2021, facilitant la prise de décision rapide au travers d’une organisation. Continue reading

“Data Observability”, un nouveau topic dans le paysage “Data Quality” ?

Depuis deux ans apparaissent des outils de “data observability” : ont-ils une valeur ajoutée dans le paysage “data quality” ? Quelles sont leurs fonctionnalités potentielles par rapport aux approches “data quality” préventives et curatives ? Quelle est la maturité actuelle de ces outils ? Continue reading

Un propre système de questions/réponses basé sur des modèles de langue

Suite au lancement de ChatGPT, une masse d’outils permettant de répondre à des questions concernant votre propre contenu voient le jour. Le principe est très simple : téléchargez vos documents (PDF, Word, etc.) et vous pouvez presque immédiatement poser des questions, généralement dans un environnement de type “chatbot”.

Dans cet article, nous décrivons le fonctionnement d’un tel système de réponse aux questions et nous apportons quelques précisions sur la qualité que l’on peut attendre des résultats. Continue reading