Internet-map et cartes du web similaires

La carte disponible sur le site internet-map est censé être une “carte de l’internet” datant de 2011. Elle est entièrement basée sur les données de 350000 sites fournies par la plateforme Alexa et a été réalisée par Ruslan Enikeev.

Sur cette carte, on retrouve globalement trois sets d’informations :

  • La taille d’un nœud (ou site) correspond à son rang au classement général Alexa et donc finalement représente le trafic général généré par le site web.
  • La couleur d’un nœud correspond à la nationalité du site perçue par le site Alexa. Pour information, la nationalité est déduite par un traceroute des IPs des utilisateurs du site : si un site est visité majoritairement par des Français, alors il est vraisemblablement de nationalité française.
  • La spatialisation des nœuds permet de représenter la proximité de deux sites internet : plus un site est lié à un autre (en terme d’utilisateurs utilisant des hyperliens de l’un à l’autre), plus il est proche de ce dernier. C’est à dire que les utilisateurs vont souvent de l’un à l’autre.

Ainsi, la carte internet-map est finalement une représentation virtuelle de la proximité des sites sur internet, mais ne représente en rien la topologie d’internet matérielle et son ensemble de serveurs.

Pour information, la spatialisation des nœuds n’utilise pas l’algorithme ForceAtlas2, mais un algorithme maison écrit par Ruslan Enikeev en C#. Une vidéo de démonstration de l’algorithme est disponible ici : https://youtu.be/eIW70a2mhMw et nous pouvons nous rendre compte que les résultats sont légèrement différents que ceux obtenus avec ForceAtlas. De plus, il fallait avec son logiciel et un ordinateur de bureau classique un peu plus de deux semaines pour réaliser la cartographie complète des 350000 sites.

Finalement, ce graph est relativement simple si l’on arrive à capitaliser le même genre de base de données. Par ailleurs, après avoir cherché sur le code source, il est impossible de récupérer le set de données de la carte internet-map. En effet, tout est hebergé sous forme d’images sous forme d’un set de “tiles” qui sont affichées et assemblées à la manière d’un puzzle en fonction des coordonnées de la fenêtre utilisateur et de son niveau de zoom. Les photos sont disponibles a cette adresse par une URL paramétrée :

'https://d2h9tsxwphc7ip.cloudfront.net/' + zoom + '/' + coord.x + ' ' + coord.y + '.png'

Cette carte réalisée en 2013 par PEER1 HOSTING est disponible uniquement sous forme d’application Android/iOS. Des images sont disponibles ici par exemple : https://gigaom.com/2013/03/06/want-a-map-of-the-internet-theres-an-app-for-that/.

Cette carte extrêmement graphique est basée sur les données des fournisseurs d’accès à internet avec la répartition de leurs serveurs, câbles, fibre optiques, ainsi que les interconnexions avec d’autres hébergeurs. Finalement, ces données ne représente pas les sites internet à proprement parler, mais plutôt la topologie matérielle d’internet et le trajet réel d’un paquet IP à travers le réseau ; il est d’ailleurs possible d’afficher des traceroute directement sur la carte avec un temps de trajet calculé en temps réel. Les données utilisées pour réaliser cette carte son disponibles ici : http://as-rank.caida.org/.

La carte est disponible sous deux type d’affichages :

  • Globe : les points sont positionnés à la surface de la terre grâce à leurs coordonnés GPS. On obtient une “carte” au sens commun du terme avec les liaisons physiques entre les serveurs.
  • Network : les points sont cette fois ci spatialisés avec un algorithme de type ForceAtlas dans un espace 3D et permet de représenter internet et ses connexions de manière indépendante de la position géographique des serveurs.

Cette carte publiée sur DeviantArt en 2014 par un artiste nommé JaySimons représente, sous un aspect très graphique, internet. En revanche, cette carte est une vue d’artiste basée principalement sur des données d’Alexa mais non spatialisée de façon mathématique : l’artiste à choisi de positionner les sites à sa manière sur un planisphère.

La carte est composée d’un très grand nombre d’éléments dont principalement une carte d’internet générale mettant en scène les 500 premiers sites référencés par Alexa. En secondaire, on retrouve des cartes représentent la surveillance organisée par la NSA, les réseaux sociaux les plus utilisés, les navigateurs internet les plus utilisés, ou encore l’utilisation globale d’internet par pays. Enfin on retrouve également disséminés un peu partout sur l’oeuvre, une timeline de l’histoire d’internet, les entreprises les plus influentes dans le domaine des nouvelles technologies, ainsi que de nombreux autres petits détails.

Cette carte réalisée sous forme de trois itérations est disponible sur le site de OPTE Project. Elle représente (à la manière de PEER1 HOSTING) une topologie matérielle du réseau internet par l’utilisation de dumps BGP. Ces dumps BGP fournissent des données très similaires aux traceroute : des tables de routage des paquets IP à travers le réseau internet.

Ces données sont disponibles de façon publique et les sources sont citées sur la légende de la carte. On retrouve donc pour l’Europe l’utilisation des données de la plateforme RIPE.

En revanche, la différence entre cette carte et les autres cartes de ce type est principalement au niveau de l’exploitation : elle a un but scientifique pour montrer la topologie du réseau internet, mais aucune légende permet de connaitre les données que l’on voit. De plus, l’auteur vends la licence d’utilisation 2500$ pour une carte qui devient finalement inutile si l’on ne peut pas savoir ce qui est représenté et s’apparente alors plutôt à une oeuvre artistique.

L’algorithme utilisé pour la spatialisation des points sur cette carte est open source et se nomme LGL. Il est disponible ici : http://lgl.sourceforge.net

Les cartographies disponibles sur ce site sont très ancienne, basée sur des traceroutes qui représentent la globalité d’internet (publique) à cette époque. Les cartes son disponibles ici : http://www.cheswick.com/ches/map/gallery/index.html

  • txs/autre/map_p18/bibliomap.txt
  • de 127.0.0.1