データ分析の代表的な4つの手法
データ分析の統計手法は様々ありますが、以下の4つの手法に分けると理解がすすみやすいです。
1.四則演算
2.回帰分析(相関)
3.主成分分析・因子分析
4.クラスタ分析
1 の四則演算は合計や平均、クロス集計、比率計算も含まれます。
2 の回帰分析は、相関関係をベースにする分析カテゴリが含まれます。
3 の主成分分析は合成の分析、因子分析は分解の分析としての違いがあります。
4 のクラスタ分析は、データ間の距離から複数の集団にグルーピングする手法です。
なお、2~4は多変量解析(多くの要因=多変量を用いる統計解析)の代表的な手法でもあります。Tableauではクラスタ分析の計算方法の1種、 k-means法 を手軽に使うことができます。
これまでにいろいろなデータを分析する機会に恵まれましたが、企業などの実務面では1の四則演算の出番が多いことを実感しています。シンプルな手法ほど扱いやすく、説明もしやすく、理解が得られやすいことも影響していると思います。
参考:Tableauによるクラスタ分析
https://help.tableau.com/current/pro/desktop/ja-jp/clustering.htm