COMPASS MAGAZINE #14
COMPASS MAGAZINE #14

L’EXPLOSION DES DONNÉES Les scientifiques viennent à bout des pièges et des promesses du Big Data

La capacité à gérer des données extrêmement volumineuses à chaque étape du cycle de la découverte, du développement et de la commercialisation constitue un facteur clé de réussite.

Morten Meldgaard et Kaare Buch Petersen habitent un petit pays mais ont conquis le Big Data. Ils travaillent pour Chr. Hansen, fournisseur danois d’ingrédients en biosciences pour l’industrie alimentaire et la santé. M. Meldgaard est le gestionnaire de programmes chargé d’améliorer la manière dont l’entreprise de 140 ans gère l’explosion de ses données et K. Petersen est spécialiste en informatique.

Ils ont devancé de grandes industries concurrentes en se tournant vers des solutions de traitement de données basées sur le cloud. Coût total mensuel du service infrastructure et logiciel : US$1 000.

DÉCRYPTER LA BACTÉRIE

Auparavant, les scientifiques de Chr. Hansen devaient analyser manuellement une molécule et indiquer les résultats sur papier. Ce système fonctionnait avant l’introduction d’un flot de données continu provenant de nouvelles sources.

D’abord, Chr. Hansen a adopté un système de carnet de laboratoire électronique, collectant et partageant les données parmi ses scientifiques. Ensuite, des outils puissants effectuant 500 analyses simultanées pour un composé sont apparus. Le déploiement des robots en laboratoire ainsi qu’un processus permettant 500 fois plus de tests ont multiplié les volumes de données recueillies.

« Les chercheurs se savaient face à un défi », déclare M. Meldgaard. « Ils produisaient davantage de données plus complexes ».

LE CLOUD COMPUTING À LA RESCOUSSE

L’explosion des données est un enjeu majeur pour la chimie et la biologie. Les données de recherche ne sont qu’un début. D’autres fonctions – dont le développement, les contrôles réglementaires, la fabrication et la distribution – génèrent leur propre déferlement d’informations.

« On est aujourd’hui submergé par les données », déclare Alan S. Louie, directeur de recherche, IDC Health Insights à Framingham, Massachusetts (USA). Le stockage des données est un défi de taille mais « la capacité à traiter et à transformer les données en théories cohérentes est bien plus difficile ». Chaque étape de développement et de commercialisation s’appuie sur des données issues de la phase précédente et chaque phase génère des données qui doivent être transmises en amont pour affiner les activités futures.

Le cloud computing évite l’encombrement des données. Le modèle de cloud simplifie la collaboration car les entreprises de recherche établissent des partenariats avec des organismes de recherche ou de production spécialisés. « Le cloud est tout à fait idéal », déclare Andrew Brosnan, analyste pour l’institut de recherche Ovum, basé au Royaume-Uni. « Il est facilement évolutif et extensible. Si vous travaillez sur un projet de deux ans avec un organisme de recherche suisse, vous pouvez étendre votre environnement informatique à ce cocontractant. C’est vers cette tendance que nous nous orientons. »

SUPPRIMER LES « DARK DATA »

Chez Chr. Hansen, M. Meldgaard et K. Petersen ont constaté que le recours au cloud serait moins onéreux qu’une infrastructure dédiée. « Nous aurions pu débourser US$100 000 ou plus », déclare K. Petersen. « En s’appuyant sur le cloud, nos dépenses se chiffrent à US$1 000 par mois. » L’approche de Chr. Hansen permet aux scientifiques d’identifier rapidement des modèles dans leurs données. « Ils considèrent notre solution comme une baguette magique qui leur offrirait un gain de temps considérable », ajoute K. Petersen.

De nombreuses entreprises souffrent des « dark data » (données cachées), où les données utiles existent mais ne peuvent être retrouvées et réutilisées ou diffusées. Ces nouveaux outils ont modifié l’approche globale de l’entreprise en termes de stockage et d’accès aux données. « Nous souhaitons explorer les données plutôt que d’être uniquement confrontés à des silos de données », explique M. Meldgaard. « Le stockage des Big Data nous semble quasi parfait. Nous pouvons stocker les données puis “jouer” avec celles-ci et les interpréter. Les bases de données traditionnelles exigeaient que l’on prédétermine l’aspect de nos données et comment celles-ci seraient interprétées. » La facilité d’accès procure un certain pouvoir.

UN LIEN VERS LE CONSOMMATEUR

Prochaine étape pour Chr. Hansen : étendre le système à d’autres départements de l’entreprise. Les développeurs de produits veulent accéder aux données de la production et vice versa. Les départements juridiques, ventes et finances souhaitent aussi être connectés.

L’objectif ultime de l’entreprise est d’avoir accès aux commentaires du consommateur final sur Facebook ou Twitter sur l’arôme d’un yaourt par exemple. Les scientifiques qui tentent d’améliorer le produit pourraient alors accéder facilement aux données. ◆

by William J. Holstein Back to top