クラスター分析

マーケティングリサーチの講義でクラスター分析の手法を学んだ人もいると思いますが、実際に手を動かしてプロット図を作成した経験はまだないかもしれません。

RやPythonを使うと、クラスタリングの可視化を比較的簡単に行うことができますので、ぜひ調べながらチャレンジしてみてください。

学習用サンプルとしてよく使われるIrisデータセットは、以下のように読み込むことができます。

R

# Rには標準で含まれています
data(iris)
head(iris)

Python

from sklearn.datasets import load_iris
iris = load_iris()
# iris.data: 特徴量
# iris.target: ラベル
# iris.feature_names: 特徴名
# iris.target_names: クラス名

スクリプトは、自分で調べて作成してみてください(うまくいかなかった場合は、リクエストしてくれれば配布します)。ここでは実行結果の画像のみを掲載します。

クラスター分析は、以下のような分野で広く活用されています。

  • マーケティング:顧客セグメンテーション(購買行動や嗜好による顧客の分類)
  • 生物学:種の分類、遺伝子発現パターンの解析
  • 社会科学:アンケートや調査データに基づく回答者のグループ化
  • 画像処理:画像内の領域分割、特徴に基づいた画像分類