データ分析について その②

データマイニングの登場

この頃、「データマイニング」という言葉が広まったように思います。データをいろいろな角度で検証することで、何かビジネスに活かすことができる新しい発見をすることです。一つのトレンドになりましたが、その後最近までの10年ぐらいは聞かなくなりました。

「今、データ分析」の背景

さて、今、「データ分析」に、再度、光が当たっている背景は主にIT技術の進展にあります。サーバー等のハードウェアの価格が大きく下がり、またその安価なサーバーを複数使い一つのシステムとして利用可能とする仮想化技術(※)が大きく進展します。平行して、その環境上で機能するHadoop(※)のような分散処理技術も普及し、以前のような分析専用の大規模システムが不要になって来ました。以前は数千万単位だったシステム構築も、数百万単位で可能となり、機能もより充実した感じです。

また、サーバー側ではなくクライアント側(PC側)の技術も進みました。メモリが安くなったことにより、メモリ上に大容量のデータを蓄積し、それを使い分析するソフトウェア(Qlikview,Tableau等)のベンダーが誕生します。今まで、サーバー/クライアント間で時間をかけて往復していたのが、1000万件を超えるデータをクライアント側に置くことで、一瞬で分析データを表示することができます。一つのグラフ上のバー等を変更することで、関連したグラフが連動して瞬時(本当に!)に更新されます。エクセルやパワーポイントのグラフが互いに連動するイメージです。正直な感想として、データを分析するのが楽しく、本当の意味で「データマイニング」の時代が来た感があります。

f:id:ohtacha:20150105202245j:plain

Qlik はQlikView(Qliktec)の意味

※仮想化技術

※Hadoop

データ分析について その③ – 医療機器業界ブログ

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です