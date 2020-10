Microsoft Excel : comment un dépassement du nombre maximal de lignes a mené à des non signalements de cas positifs de Covid-19 Près de 16 000 en raison du choix d'une ancienne version du tableur 22PARTAGES 9 0 Le gouvernement britannique a manqué d’inclure 16 000 cas confirmés de coronavirus dans ses rapports quotidiens entre le 25 septembre et le 2 octobre. La faute est à mettre sur le compte d’un « problème technique », d’après celui-ci. Si les autorités n’en disent pas plus, des sources bien introduites font état de ce qu’il s’agit d’une erreur de casting. Une question est désormais sur toutes les lèvres : les services de santé anglais en charge du dossier n’auraient-ils pas plutôt dû faire usage d’un SGBD plutôt que du tableur Excel ?



« Un problème technique a été identifié dans la nuit du vendredi 2 octobre dans le processus de chargement des données qui transfère les résultats positifs de laboratoire COVID-19 au sein des tableaux de bord de reporting. Après une enquête rapide, nous avons identifié que 15 841 cas entre le 25 septembre et le 2 octobre n'ont pas été inclus dans les rapports quotidiens. La majorité de ces cas se sont produits au cours des derniers jours. Le problème technique était dû au fait que certains fichiers contenant des résultats de tests positifs dépassaient la taille maximale de fichier qui gère ces données et les charge ensuite dans les systèmes centraux », indiquent les autorités.







Les rapports tirés de sources introduites aux services de santé anglais en charge du dossier font pour leur part état de soucis avec le tableur Microsoft Excel : « Le problème a été causé par la façon dont l'agence a rassemblé les logs produits par les entreprises commerciales payées pour analyser les tests afin de découvrir qui est porteur du virus. Ces dernières ont mis leurs résultats à disposition sous forme de listes textuelles – appelées fichiers CSV – sans problème. Public Health England (PHE) avait mis en place un processus automatique pour rassembler ces données dans des modèles Excel afin qu'elles puissent ensuite être téléchargées vers un système central et mises à la disposition de l'équipe Test and Trace du NHS, ainsi que d'autres tableaux de bord informatiques du gouvernement. Le problème est que les propres développeurs de PHE ont choisi pour cela un ancien format de fichier - connu sous le nom de XLS. En conséquence, chaque modèle ne pouvait traiter qu'environ 65 000 lignes de données au lieu du million et plus de lignes qu'Excel est réellement capable de traiter. »



En effet, les versions les plus récentes du tableur de la suite Microsoft Office prennent un maximum de 1 048 576 lignes et 16 384 colonnes en charge. Même dans le cas du choix de l’une de celles-ci par les autorités britanniques en charge du dossier, le problème serait resté le même. En effet, une fois que le laboratoire a effectué plus d'un million de tests, ce n'est qu'une question de temps avant que ses rapports ne soient pas lus en entier par Public Health England.







Sur son site, le gouvernement britannique indique qu’une solution de contournement est d’ores et déjà en place. Elle consiste à fractionner les fichiers volumineux en unités que la version d’Excel utilisée est capable de prendre en charge. De plus, un examen complet de bout en bout de tous les systèmes a fait l’objet d’instauration pour éviter que des erreurs similaires ne se reproduisent. Les observateurs restent néanmoins d’avis que l’utilisation d’un véritable système de gestion de base de données (SGBD) reste plus indiquée pour des cas de figure de ce type.



Excel est un géant dans le monde des tableurs et est régulièrement utilisé par les scientifiques pour suivre leurs travaux et même mener des essais cliniques. Toutefois, le problème avec le logiciel de la suite Office de Microsoft est que son paramétrage est à gérer avec précaution pour les applications scientifiques. Mal s'y prendre lors de cette étape peut mener à des corruptions des données ou à des erreurs comme celle enregistrée par Public Health England. Une étude parue au cours de l'année 2016 l'illustre : le cinquième de 3597 articles publiés ont été affectés par des erreurs en lien avec l'utilisation du tableur. Le Comité de nomenclature HUGO,



Grosso modo, c’est la question du choix de l’outil adéquat pour effectuer une tâche donnée qui se retrouve sur la table. En effet, un tiers peut décider de faire usage d’un marteau pour enfoncer des vis dans un mur dans le but d’y accrocher des cadres. Seulement, si ces derniers viennent à tomber et à se casser qui de l’outil ou de celui qui le choisit est le plus à blâmer ?



Qu’est-ce qui pourrait justifier l’utilisation d’Excel dans un cas de figure comme celui-ci ?

La nécessité de s’appuyer sur un véritable système de gestion de base de données (SGBD) souffre-t-elle de quelconque contestation dans des cas de figure comme la gestion de données d’une pandémie?



