Dans cet article nous allons voir une technique très simple pour filtrer vos colonnes (features) dés lors que vous modéliser votre modèle de Machine Learning.
Filtrer vos données avec la VarianceCatégorie : Préparation
Après avoir analysé les données, il faut les retravailler afin de pouvoir modéliser et entrainer correctement son modèle de Machine Learning. Dans ces articles datacorner aborde les différentes techniques qui permettent de faire ce travail le plus simplement possible.
Evaluez l’importance des variables (« Feature Importance »)
Le Machine Learning fait sans doute peur aujourd’hui à cause de son coté boite noire. L’approche « mathématiques » (statistiques / Probabilités) fait peur car nous comprenons difficilement la raison des choix du modèle qui a été conçu. Dans cet article nous allons voir comment ces approches statistiques permettent de trouver quelles variables permettent de déterminer ce ou ces choix du modèle. Car c’est finalement bien là l’essence du Machine Learning: trouver les éléments/variables qui on conduit à faire un choix ou prendre une décision non ?
Evaluez l’importance des variables (« Feature Importance »)dataprep.eda : un nouveau venu dans l'analyse de données
Dans cet article je vous montre comment utiliser le nouvel arrivé de l'analyse de données avec Python : datapre.eda
dataprep.eda : un nouveau venu dans l'analyse de donnéesComparaison de chaînes de caractères
Découvrez dans cet article comment utiliser les algorithmes de distance et la librairie Fuzzywuzzy pour comparer des chaînes de caractères.
Comparaison de chaînes de caractères