データ爆発

ビッグ データの落とし穴と将来性を理解し始めた科学者たち

William J. Holstein
17 October 2014

発見、開発、商品化サイクルの各段階で大 量のデータを管理する能力は極めて重要 です。データをナレッジに変換するという 研究員の取り組みを、分析ツールが支援し ています。

Morten Meldgaard氏とKaare Buch Petersen氏は小さな国に住んでは いますが、ビッグ データに取り組 み、活用に成功しています。

両氏は、食品業界と医療業界に向けてバイオ サイエンス材料を提供するデンマーク企業、 Chr.Hansen社に勤務しています。Meldgaard 氏はプログラムマネージャーとして、140年の 歴史を持つ企業で爆発的に増え続けるデー タの管理方法の改善を任され、Petersen氏は ITスペシャリストです。2人はクラウド ベース のデータ高速処理ソリューションを導入して、 業界大手のライバル企業としのぎを削ってい ます。インフラとソフトウェアにかかる1ヵ月あ たりの総コストは、1,000米ドルほどです。

無数のデータの解読

2人のブレークスルーが実現するまで、Chr. Hansen社の研究員は、手作業で化合物を分 析して、結果を紙に記録していました。このや り方は何十年もの間行われてきましたが、新 しい情報源から大量のデータが流れ込んでく るまででした。その端緒となったのが、電子 実験ノート システム(ELN)です。

その後は、最大500件まで同時に分析を行え る強力なツールが利用できるようになり、ロ ボットが実験室に設置され、さらに、新しい プロセスを導入することによって以前の500 倍もの実験が可能になりました。

「研究員たちは、課題を抱えているのを知っ ていました。さらに多くのデータが作り出さ れ、そのデータはもっと複雑なものだったの です」とMeldgaard氏は述べています。

救いの手としての クラウド コンピューティング

データ爆発は、科学界の至る所で大きな課題 となっており、研究データは始まりにしか過ぎ ません。開発、規制上の検査、製造、流通など 他の業務からも、部門特有の情報が大量に 生み出されています。

米国マサチューセッツ州にあるIDC Health Insights社でリサーチ・ディレクターを務める Alan S.Louie氏は、「人は今や大量のデータに 圧倒されているのです。データの保存は課題 ですがそうしたデータを処理し、系統立てて 一貫した理論にまとめる方がはるかに困難で す」と同氏は指摘しています。 

クラウドコンピューティングでは、無秩序に存 在するデータの活用を実現できます。英国に 拠点を置く調査会社Ovum社のアナリスト、 Andrew Brosnan氏は次のように述べていま す。「クラウドはかなり理想的で、簡単に拡張 することができます。スイスの開発業務受託 機関と2年間のプロジェクト契約を結んだ場 合、IT環境をその協力会社まで拡張できます。 我々はこうしたトレンドに向かって進みつつ あります。」

「ダークデータ」の解消

Morten Meldgaard氏とKaare Buch Petersen 氏は、クラウドへの移行は専用インフラよりも 安価であることにも気付きました。「10万米ド ル以上はかかっていたかもしれません。クラ ウドを基盤とすることで、1ヵ月の費用を1,000 米ドルに抑えられています」とPetersen氏は 説明しています。

Chr.Hansen社のアプローチによって、研究員 はデータのパターンを即座に識別することが できます。「このソリューションは、研究員に とって、大幅に時間を節約できる魔法の杖の ようなものでした」とPetersen氏は語っていま す。

企業の多くは「ダークデータ」症候群に悩まさ れています。利用価値のあるデータが存在し ているのに、検索して再利用したり、社内の 関係者が広く利用することができない状態を 指しますが、Chr.Hansen社の新しいツール は、この課題も解決しました。

Meldgaard氏は次のように述べています。「ビッグデータ型ストレージは、我々にとって、 ほぼ申し分ないでしょう。データを保存した 後は、利用法を検討して、データを解釈するこ とができます。従来型データベースでは、 データを参照する方法と解釈する方法を事前 に定義する必要がありました」。

消費者とのつながり

Chr.Hansen社が次に挑戦する課題は、このシ ステムを社内の他部門にまで拡張することで す。製品開発者は製造データへのアクセスが 必要ですが、逆にセールス、財務、法務の各 部門も接続されている必要があります。

Chr.Hansen社の最終的な目標は、最終製品 の消費者がFacebookやTwitterで、たとえば、 ある特定のヨーグルトの味について述べたコ メントなどのデータをうまく活用することで す。そのデータを、製品の改善に取り組む研 究員に利用できるようにするのです

Related resources