データ分析の代表的な4つの手法
データ分析の統計手法は様々ありますが、以下の4つの手法に分けると理解がすすみやすいです。
1.四則演算
2.回帰分析(相関)
3.主成分分析・因子分析
4.クラスタ分析
1 の四則演算は合計や平均、クロス集計、比率計算も含まれます。
2 の回帰分析は、相関関係をベースにする分析カテゴリが含まれます。
3 の主成分分析は合成の分析、因子分析は分解の分析としての違いがあります。
4 のクラスタ分析は、データ間の距離から複数の集団にグルーピングする手法です。
なお、2~4は多変量解析(多くの要因=多変量を用いる統計解析)の代表的な手法でもあります。Tableauではクラスタ分析の計算方法の1種、 k-means法 を手軽に使うことができます。
これまでにいろいろなデータを分析する機会に恵まれましたが、企業などの実務面では1の四則演算の出番が多いことを実感しています。シンプルな手法ほど扱いやすく、説明もしやすく、理解が得られやすいことも影響していると思います。
参考:Tableauによるクラスタ分析
https://help.tableau.com/current/pro/desktop/ja-jp/clustering.htm
BIツールとは?
BIツールには様々な製品があり、私は4つの製品を実際にトライアルした結果、現時点でTableauを主に使用しています。
比較した際に感じた主な特徴をご紹介します。(個人的意見です)
Tableau(タブロー[フランス語で絵画という意味])
〇 ボードを作成しやすい[操作性が高い]
〇 データ準備・加工も簡単
〇 グラフなどの表現力が豊富、きめ細やかに美しく設定できる
〇 統計指標や予測モデルがメニューあり、分析パッケージの R やPython とも連携しやすい
〇 ユーザー数が多く、支援できるベンダーも多数
〇 自分で学習しようとした場合、Webサイトの説明が豊富でコミュニティも活発
〇 他のBIツールと比較して、大規模データにも高速に対応できる
〇 他のソフトにできて、Tableauにできないことが少ない(機能が充実している)
〇 salesforceとの親和性が高い
△ いろいろできる反面、使いこなせるようになるには勉強が大変
△ ライセンス価格が松竹梅の竹クラス(学習費用も含めると最も割安)
➡ マーケティング分析や統計仲間の中で特に評判がよいツールでした。実際に使用すると、細かい要望へのレスポンスがよいです。BIというよりVI(Visual intelligence)ツールで、絵心によって作品の出来が違ってきます。Excelのピボットテーブルに親しみのある方は、操作画面の構成が近く、とっつきやすいと思います。
PowerBI
〇 マイクロソフト製品の1つとして、パッケージ間の親和性が高い
〇 必要最低限の機能がそろっている
〇 ライセンス価格が松竹梅の梅クラス(大人数で使用する場合は割安)
△ ボード作成してゆくとDAX関数が多数必要
△ いろいろ希望を詰めてゆくと、SQLを併用しないとできない表現が多かった
△ テスト当時はコミュニティが少なく、学習のハードルが高い
➡ 自己学習のハードルの高さに苦戦し、あきらめました。分析に必要な試行錯誤を行う際、関数を多用するツールとGUIで直観的に利用できるツールでは、後者の方がはるかに効率的です。固定した内容を外注でボードを作成する利用方法ならよいと思います。
https://powerbi.microsoft.com/ja-jp/
Motion Bord
〇 ボードを作成しやすい[操作性が高い]
〇 地図表現が豊富
〇 サポートが充実
△ 日本企業のため、グローバル対応の点で他との差が大きい
△ ライセンス価格は松竹梅の竹
➡ 地図表現が必要な際に使用していました。よい意味で日本的な気遣いが感じられるパッケージでした。
https://www.wingarc.com/product/motionboard/
CRM Analytics
〇 ボードを作成しやすい[操作性が高く、縦方向にも展開できる]
〇 ボードのレスポンスが他のツールよりもよい
〇 データ準備・加工も簡単
〇 機械学習による自動判別を簡単に使える
△ 表やグラフの細かい設定がしづらく、機能の限界を感じた
△ ライセンス価格は松竹梅の松(大人数で使用しづらい)
➡ Salesforce社のBIツールで一番使っていました。Tableau社買収に伴い、私もTableauに移行しました。
https://www.tableau.com/ja-jp/products/crm-analytics
実際に比較、検討した結果、私はTableauが最もよいという結論でした。特に自己学習を前提とした場合、操作性や DATA Saber を代表とする学習支援(DATA Saber は無償)、ユーザーコミュニティの充実は大きなポイントになります。
目的や状況、今後の変化によって最適なパッケージも違ってくると思います。
以上
Tableauによる時系列予測
なぜ DATA Saber になりたいのか?
DATA Saber に参加し、約1ヶ月が経ちました。
みかん師匠から「Bridgeに参加する前と参加してみた後での自分の中の考えや意見の変化を綴っておくのもおもしろいと思います」とのアドバイスを頂きました。
✓参加の動機
・Tablau を使いこなし、データの可視化や分析を推進したいものの、スキルが伴わず、勉強したい。
✓申込時の心境
・時間を確保できるのか、3ヶ月間やり遂げられるか、SNSが苦手な自分がコミュニケーションをとれるのか、とても心配。(申込まで2週間悩みました)
✓1ヶ月後の心境
・みかん師匠や弟子仲間をはじめとした、Slackでつながる236名の皆様とのつながりがモチベーションになる。(気持ち的に時間を確保しやすい)
・悩んでいる課題を相談できる場所があり、いろいろな方が回答くださるって素晴らしい! 優しさにあふれています。
・研修方法として、動画を見ながらの操作学習の便利さを痛感。(動画再生用の Amazon Fire HD 10 と今回購入したアルミスタンドが大活躍)
KTさんにもお会いでき、学習動画に親近感アップ。ただし、SNSはまだ苦手です。現在は前半最大の難関と呼ばれているord4を通過できました。在宅勤務日の夕食後と休日を学習時間にあてていますが、この後更にレベルが上がり、難しくなるらしいです。
無事卒業できるよう、冬休みもうまく活用したいと思います。
(👆 先をあてにするまずい状況かも)
Tableauのファイル形式の違い
Tabelauはオリジナルのファイル形式があります。
twbx形式という言葉をはじめて聞き、内容をよく理解できていませんでした。
今日の勉強会で参考になるサイトを教えて頂きましたので、共有します。
スプレッドシートではできない 5 つのこと (tableau.com)
➡ 約45分の動画です。
今さら聞けない Tableau の拡張子とパブリッシュ - データ可視化のアイデア帳 (hatenablog.com)
➡ Tabelauのファイル形式がわかりやすくまとめられています。
導入前に知っておくべきTableau Readerの4つの盲点 (data-viz-lab.com)
➡ Tableau Reader の特徴がわかりやすくまとめられています。
障壁をクリアする方法
・創造の障壁となる複数の壁(課題)を明確化する
・壁は横や上に空間があり、超えられることを意識する
・視点を変えれば、壁を超える方法がわかる(横から抜ける、上から乗り超える、より強い力で正面突破する、すり抜ける、他から支援を受ける)
何かに新しく取り組もうとした際、いろいろな課題に直面し、前に進みにくくなる場合のメモです。
ネガティブな思考で状態を否定するのではなく、ありのままを冷静に把握し、受け入れることから解決の糸口を見つけます。