タグ

データマイニングに関するsoh3914のブックマーク (2)

  • RIETI - ビッグデータが迫る研究開発の変革

    最先端の研究開発現場からビジネスまでのありとあらゆる場面で大きな変革―第四のパラダイムと呼称されることが多い―が起きつつある。それは、この一、二年"ビッグデータ"と総称される、質的に極めて多様で膨大な量のデータ群を有効利用することにより、地球から人間にいたるまで様々な対象をモデル化し、目的に応じた、より良い予測情報やサービスを提供する研究開発手段の台頭である。ビッグデータの取扱に必須の基幹的な科学技術は、巨大データベースに関わる工学領域をはじめとして、統計科学、数理工学、機械学習、データマイニングといった、日では人材が量的に不足している研究分野で生まれている。 このBBLセミナーでは、ビッグデータを取りまく日米の現状を概説するとともに、ビッグデータの利活用を阻む日独自の問題点について論じてみたい。 昨今、データを取り巻く環境が激変しています。以前はデータの質・量ともに不足しており、地球

  • 多変量解析

    データの中には、多くのトレンド(傾向)が必ず隠れています。このトレンドをつかむことができるのならば優位に意思決定を進めることができます。 このページでは、データの中からトレンドを見つける多変量解析の手法を紹介します。 ことわざで「木を見て森を見ず(You can't see the forest wood for the trees. )」といわれるように、データマイニングの分野ではマクロ(巨視的)な視点で全体を捉える能力が求められます。 とはいえ、データの要素数が多くなると全体像を捕らえることが困難になるのです。 コンピュータは局所的な数値の集合として全体を把握していますので、意味ある情報として全体を見ることが不得意です。逆に人間には、もともと空間的に全体像を捉える能力が超越しています。 例をあげて解説します。 左図は写真です。写真も「画素」と呼ばれる一つ一つの情報の集まりで全

  • 1