Ce que coûtent les logiciels «non libres» et la science «non ouverte»

https://www.acfas.ca/publications/decouvrir/2019/03/ce-que-coutent-logiciels-non-libres-science-non-ouverte

Le libre ne pèse pas lourd dans les institutions d’enseignement supérieur du Québec. Au cours des dix dernières années, les cégeps et les universités de la province ont dépensé près de 270 millions de dollars pour des logiciels propriétaires (environ 190 millions $) et pour des abonnements à des publications scientifiques payantes (environ 80 millions $). En d’autres mots, de 2009 à 2018, l’accès à des logiciels produits par des entreprises comme Microsoft ou Oracle, ou encore à des ouvrages distribués par Elsevier, Taylor and Francis et d’autres grands éditeurs, a représenté environ 3,4% de l’ensemble des dépenses contractuelles des cégeps et des universités québécoises.

C’est ce qui ressort de la présente analyse inédite des contrats publics diffusés par le Système électronique d’appels d’offres (SÉAO) du gouvernement du Québec . Entre 2009 et 2018, près d’un contrat public sur huit, au Québec, a été octroyé par l’un des 68 établissements d’enseignement supérieur. Faire des affaires avec les cégeps (comme il s’agit de contrats publics, cela exclut les cégeps privés) ou les universités peut donc être payant. Au cours des 10 années étudiées, ces institutions ont octroyé pas moins de 38 758 contrats d’une valeur totale de 7,8 milliards de dollars.

Logiciel libre et science ouverte vont de pair
Dans l’ensemble des contrats octroyés par les cégeps et les universités, nous avons isolé les contrats donnés à de grandes firmes logiciel, à de grands éditeurs d’ouvrages scientifiques, ou à des entreprises tierces qui distribuent leurs produits, des licences pour ces mêmes produits ou d’autres services en lien avec ces mêmes produits (méthodologie plus détaillée ci-dessous).

Il peut sembler étrange d’amalgamer ce que coûtent les logiciels propriétaires avec ce que coûtent les abonnements à des revues savantes. Il s’agit pourtant de deux types de dépenses similaires parce qu’on pourrait les réduire à deux pratiques qui, elles, sont intimement liées : le logiciel libre et la science ouverte.

L’oligopole des publications savantes
On sait déjà que les publications scientifiques se concentrent entre les mains d’un nombre de plus en plus petits d’éditeurs, au point de former un oligopole1. C’est un phénomène connu, dénoncé par la communauté scientifique , notamment parce que le coût des abonnements aux publications de ces éditeurs est de plus en plus difficile à assumer par les bibliothèques universitaires2.

Ce qui est surtout reproché à ces éditeurs, c’est de profiter doublement des fonds publics. D’un côté, ils prennent du contenu (les articles scientifiques) pour lequel ils ne paient pas puisqu’il est rédigé par des chercheuses et chercheurs relevant généralement des institutions publiques. De l’autre, ils facturent des frais exorbitants à ces mêmes institutions pour qu’elles achètent ce même contenu.

Nous avons donc inclus dans cette analyse tout contrat à une firme qui revend à nos institutions de haut savoir le contenu qu’elles ont souvent contribué à créer. En plus des suspects habituels que sont Elsevier, SAGE, Taylor and Francis ou John Wiley & Sons, on compte également EBSCO, Gartner, ProQuest, etc.

Le florissant marché du logiciel
Au cours des dernières décennies, le coût des licences logicielles a provoqué une réflexion au sein de plusieurs administrations publiques dans le monde (Schmitz, 2001; Lewis, 2010). Outre son prix faible, voire inexistant, le logiciel libre a l’avantage de reposer sur des normes transparentes et sur une communauté dynamique, souvent réactive en cas de pépin, ce qui se traduit généralement par une plus grande robustesse. Mais les logiciels libres ne sont pas toujours gratuits. Les grandes organisations de la taille d’universités ou de cégeps doivent souvent payer des licences pour utiliser des logiciels à code source libre et bénéficier de soutien technique. Nous avons d’ailleurs trouvé quelques contrats pour du logiciel libre dans notre analyse. Il arrive aussi de payer des développeurs pour aménager le logiciel libre à ses besoins, mais ces coûts seront moindres et les développements pourront être partagés à la communauté tout comme vous pourrez profiter des avancées des autres.

En revanche, le libre demande des changements dans les organisations. Elles doivent changer leurs processus; et leurs employés, leurs habitudes. Elles doivent aussi étudier ces logiciels avant de les implanter, sans compter qu’elles ont parfois des obligations contractuelles qui les empêchent d’essayer d’autres solutions que les payantes. Toutes ces raisons expliquent que les organismes publics demeurent réfractaires à adopter le libre.

Il faut dire, aussi, que des alternatives libres n’existent pas toujours. Dans certains secteurs spécialisés, en santé ou en sécurité, les établissements d’enseignement n’ont pas le choix d’acheter certains logiciels ou systèmes. Fait cocasse, en 2011, l’Université Laval a fait l’acquisition d’un logiciel de gestion… des échantillons dans les congélateurs (montant : 38 000 dollars). Nous les avons malgré tout inclus dans notre analyse afin de mesurer l’ensemble des dépenses pour du logiciel dans les établissements d’enseignement supérieur.

Nous avons donc inclus les acquisitions de ces logiciels, mais également leur entretien et (surtout) les licences, abonnements et autres « forfaits » pour leur utilisation. Bien sûr, notre analyse exclut les achats d’ordinateurs, de serveurs ou de matériel réseautique. Nous avons même pris soin d’exclure des contrats pour des équipements qui comportent des composantes logicielles (comme un microscope Carl Zeiss avec caméra et logiciel ou des systèmes de téléphonie avec leurs logiciels).

On n’est pas en présence d’un oligopole, contrairement au monde des publications scientifiques. En plus de grandes multinationales connues que sont IBM, Microsoft, Apple ou Oracle (bases de données), on retrouve une multitude de plus petites entreprises de production de logiciels et de revendeurs (comme SoftChoice), mais aussi plusieurs distributeurs de licences.

Ce portrait est bien entendu imparfait. Tous les contrats octroyés par les cégeps et universités n’y sont pas, car la loi ne les oblige à rendre publics que les appels d’offres d’un montant supérieur à 25 000 dollars.

Il semble également sous-estimer de façon importante les dépenses réelles des établissements. Dans les plus récentes statistiques générales des bibliothèques universitaires québécoises [pdf] , par exemple, le Bureau de la coopération interuniversitaire rapporte qu’en 2016-17 seulement, les universités québécoises ont consacré 61,2 millions de dollars à des «achats récurrents de documents». Cette somme inclut des dépenses prévues dans des engagements permanents qui n’apparaissent donc pas dans les avis publics des années étudiées.

Ainsi, les montants réels dépensés pour des abonnements à des revues commerciales sont fort probablement beaucoup plus élevés. Mais l’objectif de cet exercice consistait surtout à évaluer la proportion de « non libre » dans les dépenses des établissements d’enseignement supérieur et d’évaluer cette proportion à partir d’un échantillon cohérent de dépenses : les contrats publics qu’elles ont octroyés ces 10 dernières années.»

Il faut également savoir que les données du SÉAO sont notoirement imparfaites. Une analyse publiée en 2017 par La Presse et The Gazette a révélé des milliers d’enregistrements erronés3. Depuis, le SÉAO a publié différentes mises à jour de ses données pour en améliorer la qualité. Mais des imprécisions demeurent, ce qui nous a forcé à exclure certains contrats mal libellés. L’Université McGill, par exemple, a octroyé 24 contrats d’une valeur totale de plus d’un million de dollars à Apple, Microsoft et SoftChoice sans aucune description autre qu’un numéro de contrat. Il n’est pas précisé si ces contrats ont été conclus pour l’achat d’appareils ou de logiciels. Par prudence, ils ont donc été exclus.

Cette analyse a ainsi ses limites, mais nous croyons qu’elle donne une certaine mesure des économies que pourraient réaliser les institutions d’enseignement en se penchant sérieusement sur le libre, pour leurs logiciels, et l’ouvert pour leur accès au savoir.

Méthodologie
Pour compiler ces données, il a d’abord fallu analyser (« to parse ») les fichiers du Système électronique des appels d’offres déposés dans le portail de données ouvertes du gouvernement du Québec (https://www.donneesquebec.ca/recherche/fr/dataset/systeme-electronique-… ).

Pour chaque année depuis 2009, on trouve trois fichiers en format XML :

un fichier d’avis publiés cette année-là; chaque avis public contient le nom du ou des fournisseur(s) qui a(ont) obtenu le contrat et un montant;
un fichier de contrats, qui contient, dans certains cas, le montant d’un contrat qui a été conclu pour un avis public donné;
un fichier de dépenses dans les cas où un contrat nécessite des débours supplémentaires (qu’on appelle aussi des « extras »).
L’année 2018 fait exception puisqu’on y trouve pas moins de 72 fichiers! Il y en a six par mois :

un fichier d’avis public et un fichier d’avis publics révisés;
un fichier de contrats et un fichier de contrats révisés;
un fichier de dépenses et un fichier de dépenses révisées.
L’ensemble de ces 99 fichiers contient plus de 900 Mo de données! Le tout a été analysé à l’aide de plusieurs scripts en langage Python afin de produire un immense tableau dans lequel chaque contrat ne tenait que sur une ligne. La plupart des contrats publics ont été octroyés à un seul fournisseur, ce qui pouvait faciliter l’extraction des données. Mais 40% l’ont été à deux, trois, quatre, jusqu’à 284 fournisseurs différents pour un même appel d’offres, ce qui a rendu la programmation de nos scripts beaucoup plus complexe.

Une fois le tableau réalisé, il a été importé dans une base de données MySQL pour y faciliter la recherche. Ici, différentes requêtes ont été effectuées pour voir laquelle donnait les résultats les plus complets, tout en étant les plus conservateurs. En cherchant des contrats contenant des noms d’entreprises mentionnées précédemment, ainsi que des mots-clés comme « licen[c,s]e », « *giciel », etc., nous avons d’abord filtré un premier sous-ensemble de 2 758 contrats.

Ces derniers ont été examinés un à un afin de retrancher de faux positifs qui ne correspondaient pas à nos critères et on a obtenu, au final, une liste de 2 257 contrats.

Dans un esprit, justement, de science ouverte, scripts et données brutes sont partagées dans un répertoire sur le compte Github de l’auteur .

Références :

Aussi, je remercie tout particulièrement Colette Brin, de l’Université Laval, pour une référence sur les statistiques générales des bibliothèques universitaires québécoises.

Fortier, Marco. 2018. « Les géants de l’édition étouffent les bibliothèques universitaires ». Le Devoir. 28 juin. Récupéré de https://www.ledevoir.com/societe/education/531214/les-geants-de-l-edition-etouffent-les-bibliotheques
Larivière, Vincent, Stéphanie Haustein et Philippe Mongeon. «The Oligopoly of Academic Publishers in the Digital Era». PLOS ONE, 10(6). https://doi.org/10.1371/journal.pone.0127502
Lévesque, Kathleen, Katia Gagnon, Linda Gyulai et al. (2017). « Système électronique d’appel d’offres: des milliers de données erronées ». La Presse, 2 novembre. Récupéré de https://www.lapresse.ca/actualites/enquetes/201711/02/01-5142113-systeme-electronique-dappel-doffres-des-milliers-de-donnees-erronees.php
Lewis, James A. (2010). Government Open Source Policies. 66 p. Center for Strategic and International Studies. Récupéré de https://www.csis.org/analysis/government-open-source-policies-0
Schmitz, Pierre-Emmanuel (2001). Study into the use of Open Source Software in the Public Sector. 79 p. Bruxelles : Commission européenne.