Facebook, Twitter & Instagram, Scraping de Masse
Lorsqu’une citation/mention était trouvée, il fallait extraire le post dans son ensemble, l’url, le profile, le nombre de likes, les commentaires, retweets et hashtags utilisés.
Scraping sur Réseaux Sociaux,
une de nos spécialités
Facebook, Twitter et Instagram était notre source de données principale.
Pour ce suivi de réputation et de ressenti client, il était important que cette surveillance ait lieu quotidiennement. Notre équipe de développement a fournit un code à façon embarquant crawling social, reconnaissance de mots-clefs, et extraction structurée.
Par contre, même si Facebook fournit également une API, pour des raisons de délai de mise en oeuvre nous avons implémenté un Scraping plus classique à base d’outils interne (en effet, Facebook nous imposait un processus de vérification/contrat d’usage trop complexe pour nos délais de projet).
Cette mission a conduit à fournir un système de crawling spécifique, une extraction spécifique, le tout fonctionnant sur une infrastructure adaptée également. Le client nous a demandé de lui fournir les enregistrements en format JSON.
Le setup complet du projet a été fait en 4 jours, et démarré en production le jour suivant.
Le client voulait désynchroniser son système d’information de nos services, et nous avons mis en place une livraison de ce contenu structuré par archives zip déposées sur Dropbox. C’est ce que nous avons mis en place, sur base quotidienne.
Intérêt de la solution pour le Client
Le projet de développement était réalisé en 4 jours, et le flux de données était en production le jour suivant
La livraison effective, et la qualité des informations livrée a donné lieu à la création de KPI, indicateurs intégrés eux-mêmes dans l’application de monitoring global du client
Collecte et analyse massive de données, sans effort coté client, sans projet informatique risqué du fait de notre engagement au forfait, rapide et centré
Le client a été capable de percevoir les sentiments exprimés par ses propres clients sur les réseaux sociaux (positif/négatif et le pourquoi, sur les réceptions de campagnes, les présentations de produits, etc…)
Le coût de mise en place total était significativement moins cher que toutes les solutions étudiées en interne
Depuis vos besoins spécifiques, obtenez un devis personnalisé
Sites Crawlés
Clients Heureux
Pages Crawlés / Jour
Dîtes-nous vos Besoins
Derniers Posts du Blog
Scrapy Tutorials
Nothing brand new under the sun, just good documented video tutorials if you want to…
Machine Intelligence, which tool for which usage ?
It's starting to be complex to select a Machine Intelligence solution. Not only because of…
Google lance la version 3 de Recaptcha.
Google vient de sortir sa dernière version de reCAPTCHA, qui de nombreuses façons change les…