Comparaison de chaînes de caractères-Découvrez dans cet article comment utiliser les algorithmes de distance et la librairie Fuzzywuzzy pour comparer des chaînes de caractères.
Le big data est-il mort ? Vive le Machine Learning-Vous avez remarqué ? on ne parle plus ou presque de Big Data ! Pourtant ce Buzword a été le cœur de la stratégie marketing de beaucoup d'entreprises et éditeurs de logiciels autour de la données. Mais si qu'en est-il réellement ? il est difficile d'imaginer que le déluge de données n'aura pas lieu.
Les expressions régulières (RegEx)-Découvrez dans cet article comment construire ses expressions régulières puis les utiliser avec Python et Java.
Vous avez dit Open Data … oui mais où ?-Vous cherchez des données ? mais ... vous ne savez pas où. Je vais essayer dans cet article de vous fournir un certain nombre de liens vers les sites d'Open Data les plus utiles.
Traiter des données de localisation-Découvrez dans cet article comment utiliser, nettoyer et visualiser simplement des données géo-localisées avec Python.
Accéder à Hive & HDFS via PySpark-Découvrez dans ce tuto comment récupérer via Python (PySpark) vos données dans Hadoop HDFS et Hive.
Le Profiling-Découvrez comment les outils d'analyse de données peuvent vous aider à préparer votre modèle de Machine Learning ou tout simplement garantir le succès de vos projets data.
PIM et Intelligence Artificielle-Découvrez dans cet article comment les algorithmes d'intelligence artificielle peuvent booster un PIM pour automatiser encore mieux les processus de gestion de données produit.
PIM et Intelligence Artificielle-Découvrez dans cet article comment les algorithmes d'intelligence artificielle peuvent booster un PIM pour automatiser encore mieux les processus de gestion de données produit.
TUTO : Appel du SIF Informatica MDM-Dans ce court tutoriel vous découvrirez comment appeller un service du SIF informatica MDM via un appel web service.
Vidéos : Informatica TCR-Découvrez au travers de cette démo comment la solution Informatica peut vous aider à mieux gérer et centraliser vos informations client.
TUTO : Créer des règles de validation dans Informatica MDM Hub- Objectif L’objectif est de configurer l’affichage de messages d’erreur ciblés sur des champs en particulier à l’aide d’une cleanse function dans Informatica MDM Hub. Process Développement d’une Cleanse Function En input : les champs à contrôler En output : un String « validationStatus ». ATTENTION : la syntaxe est importante. La syntaxe du message doit être « nom_de_l’input.message d’erreur ; » Il est […]
Master Data Management : PIM, CDI ou Multi-domaine ?-Les solutions de MDM ont maintenant atteint un certain stade de maturité et pléthore d’éditeurs proposent des solutions qui permettent de mettre en œuvre plus ou moins rapidement un référentiel d’entreprise. Pensez-vous être capable de faire votre choix entre CDI, PIM ou solutions multidomaines ?
Big Data
Le big data est-il mort ? Vive le Machine Learning-Vous avez remarqué ? on ne parle plus ou presque de Big Data ! Pourtant ce Buzword a été le cœur de la stratégie marketing de beaucoup d'entreprises et éditeurs de logiciels autour de la données. Mais si qu'en est-il réellement ? il est difficile d'imaginer que le déluge de données n'aura pas lieu.
Vous avez dit Open Data … oui mais où ?-Vous cherchez des données ? mais ... vous ne savez pas où. Je vais essayer dans cet article de vous fournir un certain nombre de liens vers les sites d'Open Data les plus utiles.
Accéder à Hive & HDFS via PySpark-Découvrez dans ce tuto comment récupérer via Python (PySpark) vos données dans Hadoop HDFS et Hive.
Big data, au-delà du concept un nouvel axe de développement stratégique-Parler Big Data c’est aujourd’hui évoquer un nouveau phénomène. Marketing « poussif » ou bien réel conséquence d’une informatique qui évolue et change constamment ? Ce phénomène ne peut plus laisser indifférent. Essayons d’y voir plus clair …
Qualité de données
Comparaison de chaînes de caractères-Découvrez dans cet article comment utiliser les algorithmes de distance et la librairie Fuzzywuzzy pour comparer des chaînes de caractères.
Les expressions régulières (RegEx)-Découvrez dans cet article comment construire ses expressions régulières puis les utiliser avec Python et Java.
Traiter des données de localisation-Découvrez dans cet article comment utiliser, nettoyer et visualiser simplement des données géo-localisées avec Python.
Le Profiling-Découvrez comment les outils d'analyse de données peuvent vous aider à préparer votre modèle de Machine Learning ou tout simplement garantir le succès de vos projets data.