Archives des Préparation - datacorner par Benoit Cayla

Document chunking !

Benoit Cayla 14 mars 2024 No Comments chunk llm

Le document chunking est une pratique courante en intelligence artificielle qui prend de plus en plus d’importance avec la démocratisation des LLM et dutraitements de données textuelles via NLP en général. Son objectif est de permettre le découpage de vastes ensembles de documents en segments plus petits. Cette méthode ou technique facilite grandement l’analyse et le traitement des informations permettant aux algorithmes d’IA d’opérer de manière plus efficiente sur des portions de texte réduites. L’objectif est de réduire la surcharge d’informations et les problèmes de performance liés au traitement de documents entiers. De plus, cette segmentation permet de réduire la complexité des tâches d’analyse, en offrant une approche plus gérable pour les modèles d’IA.

Préparation SLIDER Texte

Filtrer vos données avec la Variance

Benoit Cayla 13 janvier 2022 No Comments feature préparation de données variance

Dans cet article nous allons voir une technique très simple pour filtrer vos colonnes (features) dés lors que vous modéliser votre modèle de Machine Learning.

Préparation SLIDER XAI

Evaluez l’importance des variables (« Feature Importance »)

Benoit Cayla 4 janvier 2022 2 Comments evaluation feature importance

Le Machine Learning fait sans doute peur aujourd’hui à cause de son coté boite noire. L’approche « mathématiques » (statistiques / Probabilités) fait peur car nous comprenons difficilement la raison des choix du modèle qui a été conçu. Dans cet article nous allons voir comment ces approches statistiques permettent de trouver quelles variables permettent de déterminer ce ou ces choix du modèle. Car c’est finalement bien là l’essence du Machine Learning: trouver les éléments/variables qui on conduit à faire un choix ou prendre une décision non ?

Analyse de données Préparation Python

dataprep.eda : un nouveau venu dans l'analyse de données

Benoit Cayla 10 août 2020 No Comments data preparation python

Dans cet article je vous montre comment utiliser le nouvel arrivé de l'analyse de données avec Python : datapre.eda