Au cœur de la première connexion française à l’ARPAnet

Imaginez un monde sans Internet… c’était il y a tout juste 50 ans ! Le premier message transféré entre deux ordinateurs sur le réseau ARPAnet, précurseur de l’Internet tel qu’on le connaît aujourd’hui, fut envoyé à 22h30 : il s’agissait du mot login. À cause d’un bug, les trois dernières lettres mettront une heure pour arriver. ARPAnet a ouvert la voie à une révolution scientifique et sociétale majeure. Retraçons ce moment clé de l’histoire des réseaux.

Un peu de contexte historique
Le 29 octobre 1969, fut envoyé le premier message d’Arpanet entre un ordinateur de l’équipe du Professeur Leonard Kleinrock à UCLA (University of California at Los Angeles) et un ordinateur de l’université de Stanford, à environ 500 km. Cet envoi considéré plus tard comme marquant la naissance d’Internet (plus précisément d’Arpanet) reposait sur la technique dite de « commutation de paquets ». Inventée dans les années soixante indépendamment par Paul Baran et Donald Davies, cette technique présentait une différence fondamentale par rapport à la « commutation de circuits » adoptée pour les réseaux téléphoniques. Jusqu’alors, avec la « commutation de circuits », les ressources de transmission sur les liens et de stockage en mémoire étaient réservées de façon exclusive pour toute la durée de communication. À l’inverse, en « commutation de paquets », les données à transmettre sont découpées en messages courts, appelés « paquets », envoyés sur les liens de communication entre ordinateurs. Cette technique permettait alors un partage efficace des liens en évitant qu’ils soient monopolisés par l’envoi d’un long message. Les fondements théoriques de la commutation de paquets avaient été édifiés dans la thèse de Kleinrock alors étudiant au MIT en 1962. Les performances des réseaux à commutation de paquets ont été étudiées par l’équipe de Kleinrock, devenu professeur à UCLA.

Même si la commutation de paquets s’est imposée comme le mode de transmission privilégié pour les réseaux de transmission de données, deux variantes étaient étudiées par les chercheurs dans les années soixante-dix.

La première était le mode datagramme, selon lequel les paquets de données sont transmis indépendamment les uns des autres pour parvenir à la destination, en empruntant éventuellement des chemins différents, avant que le message d’origine ne soit reconstruit, en recourant à une retransmission des paquets perdus si besoin.

La seconde était le mode circuit virtuel proposé par les opérateurs de réseaux téléphoniques, proche de la commutation de circuit, dans lequel les paquets empruntent tous le même chemin bien identifié par les nœuds intermédiaires du réseau.

Les deux modes, datagramme et circuit virtuel, étaient adoptés par différents concepteurs de réseaux, ce qui a mené à la coexistence de deux « services réseaux » : le mode « sans connexion » ou datagramme et le mode « orienté connexion » ou circuit virtuel. Dans le même temps, plusieurs formats de représentation des données et plusieurs mécanismes de synchronisation des échanges entre les ordinateurs étaient développés par les constructeurs des équipements de réseaux.

En effet, en 1974, IBM a annoncé son architecture de réseau propriétaire appelée Systems Network Architecture (SNA) pour l’interconnexion des ordinateurs et des ressources associées. Deux architectures concurrentes, DECnet et Distributed System Architecture (DSA) furent respectivement proposées par Digital Equipement Corporation et CII-Honeywell-Bull dans le même temps. Les pouvoirs publics avaient lancé aux États-Unis le projet ARPAnet (1969) et en France le projet Cyclades (1971) dans l’objectif de réaliser une interconnexion des ordinateurs des universités fabriqués par des constructeurs différents

Deux mondes
Les projets publics aux États-Unis et en France ont dans les deux pays adopté le concept de « datagramme » pour le service réseau, bien qu’il ait été fortement rejeté par les puissants opérateurs de télécommunications à l’époque. Le projet français, avec en première ligne Louis Pouzin, a démontré assez rapidement la faisabilité du service réseau sans connexion. Plus tard, les américains Vint Cerf et Robert Kahn ont défini un ensemble de protocoles de communication, appelé « la pile » TCP/IP, qui sera adopté pour l’ARPAnet. Le terme « pile » fait référence à la relation logique entre les deux protocoles : TCP utilise le « service rendu » par IP. En effet, IP est implanté au niveau de tous les équipements du réseau et il est conçu pour rendre un service d’envoi de datagramme sans garantie de livraison des paquets. TCP quant à lui est implanté uniquement au niveau des équipements terminaux et il assure la fiabilité de la transmission et la régulation du débit en s’appuyant sur le service d’envoi de datagramme assuré par IP. Il s’agit d’un protocole de « bout en bout » car les équipements intermédiaires du réseau (les routeurs) ne participent pas aux mécanismes de TCP. Cette approche connaîtra un succès mondial !

En France, un autre chemin sera suivi. La Délégation à l’informatique qui soutenait le projet Cyclades est supprimée en 1974, ce qui entraîne l’abandon du projet en 1978. Deux ans plus tôt, en 1976, le Comité consultatif international téléphonique et télégraphique (CCITT) avait adopté la norme pour un service réseau « orienté connexion », appelée X.25, basée sur les « circuits virtuels ». La norme X.25 sera utilisée dans le réseau de données Transpac dont le Minitel fut l’application phare pour le grand public. Le débat à propos du « service réseau » — devrait-il être orienté connexion (comme X.25) ou sans connexion (comme IP) ? — n’ayant pu être tranché par la communauté scientifique, les deux piles protocolaires ont été standardisées par l’organisation internationale de standardisation dans le cadre de la norme pour l’interconnexion des systèmes ouverts. À l’époque, l’approche « datagramme » adoptée outre-Atlantique n’avait pas encore pris le dessus en Europe où les opérateurs de télécommunication soutenaient très fortement l’approche « circuit virtuel ».

Le rêve d’un réseau mondial interconnectant tous les ordinateurs semblait alors compromis. Pendant les années quatre-vingts fleurissent alors les fameux « convertisseurs de protocoles ». Il s’agissait de logiciels dont la finalité était d’assurer des « passerelles » pour l’interconnexion de parties du réseau adoptant des services réseaux différents (avec ou sans connexion). Un polytechnicien français, Christian Huitema, maîtrisait bien les deux « mondes » : d’un côté, il avait participé, alors qu’il était au Centre national d’études des télécommunications (CNET) entre 1980 et 1985, à la mise en œuvre des protocoles réseaux de la station de travail SM90 de Bull. Ces protocoles étaient basés sur la norme X.25 et donc sur le service réseau orienté connexion en circuit virtuel. D’autre part, Christian Huitema avait travaillé sur l’évaluation des réseaux de communication par satellite (dans le cadre du projet NADIR) avec Jean-Louis Grangé, farouche défenseur du « datagramme », aux côtés de Louis Pouzin, face à l’approche « circuit-virtuel » des PTT. Dès son arrivée à l’Inria Sophia Antipolis en 1986, Christian Huitema avait d’ailleurs démarré la réalisation de plusieurs logiciels pour l’interconnexion des deux architectures TCP/IP et X.25 dans l’objectif de permettre leur interopérabilité.

Pendant ce temps-là, le département américain de défense avait commencé à exporter le modèle TCP-IP dans le cadre du projet NSFNET (réseau mis en place en 1985 aux États-Unis pour interconnecter les universités américaines en particulier). À ce moment, le mode datagramme avait clairement pris le dessus. On dira plus tard « IP over everything » pour signifier que l’approche Internet peut fonctionner avec n’importe quelle technologie de réseau sous-jacent mais aussi pour faire référence à sa « supériorité » par rapport aux autres approches comme X.25

Un réseau astronomique
L’équipe du Professeur Lawrence Landweber à l’université du Wisconsin avait un projet collaboratif NSF-Inria avec l’équipe de recherche RODEO (Réseaux à hAUt Débit, réseaux Ouverts) de Christian Huitema à l’Inria Sophia-Antipolis sur les passerelles pour l’interconnexion de réseaux hétérogènes.

Dans le cadre de ce projet NSF-Inria, une passerelle de niveau application a été développée. Cette passerelle, qui assurait la conversion entre les deux services, Telnet du côté TCP/IP et Triple-X du côté X.25, permettait un accès à travers un terminal distant à des ordinateurs connectés à deux réseaux hétérogènes. L’idée d’une connexion de la France au NSFNET était en discussion entre les deux équipes. L’opportunité s’est présentée à l’occasion de l’assemblée générale de l’Union Astronomique Internationale à Baltimore début août 1988. La NASA et la Fondation nationale pour la science (National Science Foundation, ou NSF) souhaitaient démontrer à cette occasion l’accès à la base de données SIMBAD (Set of Identifications, Measurements and Bibliography for Astronomical Data), probablement la meilleure base de données du genre au monde, hébergée à l’époque au centre de calcul de l’université d’Orsay et aujourd’hui par l’université de Strasbourg. En effet, la base de données étant accessible par Transpac, les astronomes américains payaient plus de 100 dollars par accès pour la connexion internationale en X.25. La disponibilité d’une liaison TCP-IP jusqu’en France, d’une passerelle Telnet – Triple-X à l’Inria puis d’une liaison expérimentale en France au-dessus de Transpac représentait donc pour ces astronomes une alternative très intéressante.

Une liaison transatlantique
La décision fut donc prise : un circuit serait mis en place à travers une liaison à haut débit transatlantique sous-marine ( 56 kbps, du haut débit pour l’international à l’époque ! ), puis des liaisons louées jusqu’aux locaux des deux équipes. La connectivité IP au NSFNET serait amenée à Sophia Antipolis. Les astronomes américains pourraient donc se connecter sur un ordinateur dédié à Sophia Antipolis, puis, en utilisant la passerelle applicative Telnet – Triple-X, ils pourraient prolonger la connexion vers la base de données. La passerelle était développée et tout semblait prêt pour la démonstration… sauf que l’établissement de la liaison par l’opérateur prit du retard et que les vacances de juillet arrivèrent avant la mise en place du « circuit » par les opérateurs. La passerelle avait été testée en local, mais pas à travers une liaison longue distance ni avec les implémentations de TCP-IP installées sur les ordinateurs américains.

Afin de concentrer les efforts, un étudiant de l’université du Wisconsin, Mitchell Tasman, fut dépêché à Sophia Antipolis pour participer aux tests préopérationnels. À quelques jours du colloque, la connectivité put être établie mais les performances restaient médiocres : on pouvait se connecter du côté américain à la base de données mais on ne pouvait pas vraiment l’exploiter, tellement le débit effectif était faible. La décision de la NASA tomba : annulation de la démonstration, retour de l’étudiant aux États-Unis. À peine Mitchell débarqua-t-il outre-Atlantique qu’un deuxième revirement survint : l’opérateur de téléphonie américain MCI, qui était chargé de la mise en place du lien de communication, demanda de reconsidérer la décision et mit en place les moyens, en termes de débit, pour réussir la démonstration. Mitchell Tasman retourna en France en Concorde, une équipe d’ingénieurs du centre d’opération réseaux (NOC) de l’opérateur MCI fut mobilisée et un pont téléphonique permanent permit de discuter les configurations et les ajustements (jusqu’à l’aube heure française). Parmi ces ajustements, on peut mentionner l’absence de compatibilité entre les deux implémentations de TCP installées sur les ordinateurs américains et français, qui fut détectée et contournée ainsi que la modification du code X.25 de la SM90 pour éviter les déconnexions. La démonstration fut un grand succès. La France devint à ce moment-là le troisième pays après les États-Unis et le Canada à se connecter au NSFNET.

Plusieurs personnes participèrent à cette aventure côté français : Christian Huitema, l’instigateur et chef du projet, Luc Ottavj, le responsable du service des moyens informatiques et Walid Dabbous, alors jeune doctorant travaillant sur les architectures des réseaux hétérogènes, parmi d’autres

Depuis 1988, des innovations incessantes

Depuis cette époque, les protocoles TCP/IP se sont imposés comme standard de fait avec le déploiement universel d’Internet. Les avancées scientifiques ont permis la connectivité universelle, le support de la mobilité et de la vidéo dans le réseau. Là aussi, l’Inria fut un précurseur avec le logiciel de vidéo conférence multi-utilisateur IVS développé entre 1992 et 1994. D’autres activités furent réalisées pour faciliter l’intégration de réseaux satellite dans l’Internet à l’IETF et ont abouti au lancement de la start-up UDcast spécialisée dans la convergence des réseaux IP par liens numériques satellites et hertziens terrestres. Le souci d’interopérabilité avait pourtant mené à une ossification du protocole IP et du réseau. Afin d’assurer la compatibilité avec l’existant et de ne pas remettre en question les services fournis au dessus de TCP/IP, il n’était plus concevable d’ajouter de nouvelles fonctionnalités dans le réseau. Ceci a « poussé » l’innovation à l’extérieur du réseau vers les utilisateurs et des protocoles comme BitTorrent, l’un des protocoles phares des réseaux pair à pair, ont vu le jour. Des études sur les performances de ces protocoles et les risques de divulgation d’informations sensibles concernant la vie privée des utilisateurs de ces protocoles, mais aussi de Skype et de Twitter, ont d’ailleurs été réalisées au sein des équipes de recherche RODEO, PLANETE et DIANA et ont rencontré un écho mondial.

Ces dernières années ont vu une tendance forte vers la programmabilité des équipements réseaux avec les réseaux « logiciels » (Software Defined Networks ou SDN) et avec le déploiement dynamique de nouveaux services à travers la virtualisation des fonctions réseaux (Network Function Virtualization ou NFV). En effet, la complexité et la diversité des protocoles de la famille TCP/IP ont mené à une sorte de monopole des équipementiers. L’idée alors était de simplifier la conception matérielle des équipements réseaux et d’ouvrir aux fonctions réseaux logicielles. Et l’aventure continue.

Quelques références bibliographiques
Mail de Steve Goldstein, directeur du programme international à la NSF à l’INRIA au sujet de la démonstration SIMBAD
Interview avec Steve Goldstein mentionnant la liaison NSF-INRIA
Interview avec Yves Devillers dans Code-Source (Numéro 27, page 2) mentionnant la liaison (PDF)
Article historique mentionnant qu’en 1988, seuls trois pays (USA, France et Canada) étaient connectés au NSFNET (en anglais)
Programme du colloquium Library and Information Sevices in Astronomie (LISA) de l’International Astronomical Union mentionnant SIMBAD (PDF)
Le RFC 983 (puis 1006) décrivant la méthodologie d’interconnexion mise en œuvre lors de la première connexion à l’ARPAnet, voir http://tools.ietf.org/html/rfc983
Entretien avec Louis Pouzin sur Interstices
Entretien avec Jean-Louis Grangé (en anglais)