広告/統計/アニメ/映画 等に関するブログ

広告/統計/アニメ/映画 等に関するブログ

広告代理店マンが「R」を学ぶ必要性はなにか

<.殆どのことはExcelでできる>
この数年 統計処理に優れた言語として「R」が注目されています。

*「R」とは何か?と思った人は書店の統計コーナーに行けばわかります。
 学生時代大学の限られたパソコンにしか導入されていなかったSPSSと同じことができるツールです。
 多くの研究者が実際に使っているので、信頼性もあると言ってよいでしょう、)

何冊も本屋に並んでいるために、ただの一時的な流行のように思っている人もいるかもしれません。
実際、一般的なサラリーマンが必要とするレベルであればMicrosoft社のExcelで充分でしょう。
こんな本が「統計学が最強の学問である」流行ったこともありましたが、この書籍に紹介されているようなことであれば、エクセルに機能があります。カイ二乗検定も出来ます。回帰分析も出来ます。その他何ができるかは、公式によるアドインの追加についてご確認下さい。

クラスター分析のために「R」が必要>
では何故「R」が必要なのかというと、クラスター分析が容易にできるからです。

クラスター分析なんて、調査の仕事くらいしか使わないのだから、調査会社に丸投げすれば?」
と言う人もいるでしょう。実際、弊社もSPSSSASを導入するお金がなく、これまではクラスター分析は、調査会社に丸投げするか、人力で近い回答傾向の回答者をまとめていって、クラスター分析的なことをしていました。。。

しかし、クラスター分析というのは、1発ボタンでぽん!という類のものではなく、
・いくつのクラスターに分けるのか?
・分かれ方は納得行くか?ほぼ同じような傾向のクラスターが生まれてしまってないか?
クラスターのサイズは適切か?統計上判断にこまるほど少ない人数のクラスターが出来てしまっていないか?
・各クラスターの解釈はどうするか?今回の調査目的や課題解決に役に立つ分かれ方になったか?

などなど、、、マーケターサイドの調査目的やマーケティング課題に応じて柔軟に何度も繰り返して行わなければなりません
その作業を直接マーケターが行わず、外出しにしてしまっては、余りにもタイムロスですし、ましてや丸投げなどするべきものではありません。

<R を覚えてしまえば、作業自体は極めて簡単>
R によるクラスター分析は極めて簡単です。

1.階層的クラスター分析で分けるべき数を推測する
 CSVファイルからデータを読み込む⇒ユークリッド距離を求める⇒階層的クラスター分析を行う
 ほんの数行打ち込むだけです。階層的クラスター分析のデンドログラムに横棒を入れながら、3つかな?4つかな?と推測していきます。1つのクラスターが余りにも少なくなると、解釈ができなくなるので、自ずと目星はついていきます。

2.「k近傍法」を実行する
 分ける数の候補が決まれば、k近傍法でクラスター分析します。
 k近傍法を実行⇒クラスターの平均値をCSVファイルで出力⇒クラスターの分類を元のデータに1列加える
 これもものの数行です。
 クラスターの回答の平均値を見て、クラスターの解釈をしながら、分ける数を変えてみて何度か実行します

確かに、コマンドを入力していくのは、マウスのクリックに比べて面倒に見えるかもしれませんが、ほんの数行のですし、よく使うものは、テキストファイルで残しておけば、読み込みファイル名だけ都度変更すれば良いので、とても簡単です



R の練習には以下の2冊が良いと思います。
1. R に慣れる&統計学の基礎を思い出す
Rによるやさしい統計学

Rによるやさしい統計学

2. R の使い方を学ぶ

Rによるデータサイエンス-データ解析の基礎から最新手法まで

Rによるデータサイエンス-データ解析の基礎から最新手法まで

また、最初は何度も書き間違いがあると思いますので、いきなり本体に書き始めるよりも
RStudioを使った方がよいでしょう。
丁寧にRStudioを使った入門書もあります

Rで学ぶデータ・プログラミング入門 ―RStudioを活用する―

Rで学ぶデータ・プログラミング入門 ―RStudioを活用する―