Si vous désirez avoir une approche analytique de vos données, vous avez bien sur été confronté à la difficulté d'exploiter des chaînes de caractères. A tel point que bien souvent vous avez certainement dû en mettre de coté certaines. Manque d'outillage, complexité de gérer des sémantiques complexes … Dans cet article (premier d'une série) nous allons aborder ces problèmes et surtout voir comment les résoudre.
Gérer les chaînes de caractèresCatégorie : Préparation
Après avoir analysé les données, il faut les retravailler afin de pouvoir modéliser et entrainer correctement son modèle de Machine Learning. Dans ces articles datacorner aborde les différentes techniques qui permettent de faire ce travail le plus simplement possible.
Le Web Scraping
Le Web Scrapping est une technique bien souvent indispensable pour enrichir ses données brutes. Découvrez comment écrire simplement des scripts Python pour aspirer les données d'un site web.
Le Web ScrapingTraiter des données de localisation
Découvrez dans cet article comment utiliser, nettoyer et visualiser simplement des données géo-localisées avec Python.
Traiter des données de localisationBagage minimal de statistiques pour le Machine Learning
C'est bientôt la rentrée, il a fait chaud, la plage a été bonne et le sable bien chaud. Vous êtes donc bien reposé et prêt à attaquer la rentrée. C'est donc le bon moment pour remettre à plat quelques bases de statistiques qui vous permettront de mieux comprendre et utiliser les algorithmes de Machine Learning.
Bagage minimal de statistiques pour le Machine Learning