Proposition de TER pour la Maîtrise d'Informatique: affichage hyperbolique de logs des serveurs Web


Encadrants:
Roberto Di Cosmo et Alexandre Miquel
Université de Paris 7
http://www.dicosmo.org, E-mail: roberto@dicosmo.org
Tel: 01 44 27 86 55.
Laboratoires d'accueil:

PPS (Université de Paris 7).

Cadre de la recherche:

Ces dernières années ont vu un essor spectaculaire des technologies liées au Web, et un accroissement exponentiel de l'information disponible en ligne.
En conséquence, les sites web d'intérêt général reçoivent désormais une quantité de trafic imprévisible il y a quelques années, et il est devenu important d'évaluer le flux des visiteurs d'un site, afin de mieux connaître ce que les visiteurs aiment ou n'aiment pas, ou tout simplement pour savoir d'où les visiteurs viennent, et vers ou ils partent.
Pour permettre de tracer plus facilement le parcours d'un visiteur sur un site web, les versions actuelles du protocole HTTP prévoient un champs MIME spécifique, qui est renseigné par tous les navigateurs lors de l'accès à une page web, il s'appelle Http-Referer: et contient l'adresse de la page web ou l'on a trouvé le lien qui conduit le visiteur sur la page web demandée au serveur.
Ensuite, cette information est gardée dans des fichiers de log par le serveur, et des outils comme webalizer l'analysent et permettent d'obtenir un résumé des visites reçues.
Malheureusement, même sur des sites pas sponsorisés par des campagnes publicitaires, il est facile d'obtenir des dizaines de milliers d'accès par mois, ce qui rend désormais les résumés produits par les outils traditionnels fort peu pertinents.
Idéalement, on aimerait pouvoir visualiser le faisceaux des accès au site web par un graphe dont les noeuds sont les pages du serveur, et les arêtes ont une taille proportionnel au nombre de visiteur qui sont passés entre ces deux pages, mais même pour un site comme http://www.demolinux.org, ce graphe, affiché par le moyens conventionnels, comme webdot, occuperait plusieurs dizaines de mètres carrés de papier, si on devait l'imprimer de façon à pouvoir lire les caractère présents sur le graphe.
Le but de ce stage est d'expérimenter avec Ocaml et la géométrie hyperbolique pour afficher ces graphes d'accès de façon beaucoup plus efficace.
On vous fournira les informations de base sur la représentation hyperbolique, ainsi que du code pour afficher des arbres sur le plan hyperbolique, et on vous demandera de parser un fichier de log, construire le graphe correspondant en mémoire, et explorer les différents mouvement hyperboliques possibles pour rendre la visualisation du trajet des visiteurs intéressant.


This document was translated from LATEX by HEVEA.