mercredi 20 novembre 2013

Des livres pour le développement web

La plupart du temps lorsque j'ai besoin d'information ponctuelle sur un outil que j'utilise, je la trouve sur le site internet qui lui est dédié. Par contre quand il s'agit de veille technologique ou de choisir un outil pour des projets futurs, j'aime bien aussi lire de bout en bout des livres qui traitent du sujet.
Il y a trois sources d'ouvrages que j'apprécie particulièrement :

mardi 12 novembre 2013

Piwik et Ubuntu pour analyser la fréquentation d'un site internet

Durant l'été j'ai dû installer Piwik pour un client qui souhaitait analyser les logs bruts de son site internet, ce dernier résidant sur un serveur mutualisé chez OVH.
A mon sens les statistiques représentent bien la principale lacune des hébergements mutualisés OVH actuels. Certes les logs bruts d'Apache sont disponibles ce qui est l'essentiel mais les possibilités d'exploitation à travers les solutions logicielles mises à disposition laissent à désirer. Awstats est limité à l'analyse des logs du jour et Urchin n'est plus à la hauteur vis à vis des versions actuelles de Google Analytics.

Pour diverses raisons qui n'appartiennent qu'à lui, mon client ne souhaite justement pas utiliser la solution Google. Il m'a donc demandé de lui trouver une solution open source équivalente qui puisse intégrer les logs bruts fournis quotidiennement par OVH.

Après quelques recherches, la meilleure solution actuellement disponible semblait bien être Piwik.
Piwik est un logiciel d'analyse des statistiques de fréquentation des sites internet très proche de Google Analytics en terme d'interface et sachant travailler soit à partir d'informations fournies par du code JavaScript inséré dans les pages du site à analyser soit a partir des logs bruts du serveur web.
Sur le plan technique, Piwik est construit autour de Php et MySql et se consulte grâce à n'importe quel navigateur récent.

J'ai donc recyclé un ancien PC de bureau obsolète en le reformattant et en installant Ubuntu 12.04 serveur accompagné d'Apache, Php et MySql. une fois cette configuration de base opérationnelle il ne me restait plus qu'à télécharger Piwik depuis le site internet de l'éditeur.
L'installation et la configuration initiale se sont déroulées facilement en suivant la documentation. Si je souviens bien j'ai juste eu un petit soucis pour faire fonctionner le plugin de localisation.

Avec Piwik est fourni un script permettant d'injecter le contenu d'un fichier de logs dans la base de données.
Je l'ai essayé manuellement avec quelques fichiers en vérifiant les résultats au fur et à mesure puis j'ai lancé l'intégration progressive d'environ deux ans d'archives. Sur un vieux PC pour un site recevant environ 300 visites par jour, c'est vraiment très long (plusieurs jours).
La dernière étape à été le développement d'un script Php chargé de télécharger quotidiennement les logs depuis le serveur de stats d'OVH et de les injecter dans la base Sql. Ce script est lancé la nuit par le cron.

Après trois ou quatre mois de fonctionnement, tout tourne bien et mon client est content du résultat.

Note : OVH à annoncé récemment que Piwik serait la solution standard d'analyser des stats des hébergements mutualisés en 2014.