Dans cet article je vous propose de découvrir Apache Superset: un outil de Dataviz Open Source distribué sous licence Apache.
Introduction à Apache SupersetAuteur/autrice : Benoit Cayla
Ingénieur en informatique avec plus de 20 ans d’expérience dans la gestion et l’utilisation de données, Benoit CAYLA a mis son expertise au profit de projets très variés tels que l’intégration, la gouvernance, l’analyse, l’IA, la mise en place de MDM ou de solution PIM pour le compte de diverses entreprises spécialisées dans la donnée (dont IBM, Informatica et Tableau). Ces riches expériences l’ont naturellement conduit à intervenir dans des projets de plus grande envergure autour de la gestion et de la valorisation des données, et ce principalement dans des secteurs d’activités tels que l’industrie, la grande distribution, l’assurance et la finance. Également, passionné d’IA (Machine Learning, NLP et Deep Learning), l’auteur a rejoint Blue Prism en 2019 et travaille aujourd’hui en tant qu’expert data/IA et processus. Son sens pédagogique ainsi que son expertise l’ont aussi amené à animer un blog en français (datacorner.fr) ayant pour but de montrer comment comprendre, analyser et utiliser ses données le plus simplement possible.
ExYPro, La méthodologie de Process Mining
La « Process Intelligence » fait référence à la collecte, à l’analyse et à l’interprétation des données générées par les processus (c’est-à-dire les journaux ou logs) ainsi que les diverses activités métiers au sein d’une organisation dans le but d’améliorer l’efficacité, la productivité et les performances globales.
ExYPro, La méthodologie de Process MiningIntroduction à LIME (XAI)
Dans cet article je vous propose de découvrir l’outil de XAI (eXplainable AI) très utilisé qu’est LIME. Avec Google colab, et au travers d’un cas pratique guidé pas à pas vous allez voir comment il est simple et pratique d’utiliser cette librairie avec Python.
Introduction à LIME (XAI)Filtrer vos données avec la Variance
Dans cet article nous allons voir une technique très simple pour filtrer vos colonnes (features) dés lors que vous modéliser votre modèle de Machine Learning.
Filtrer vos données avec la Variance