読者です 読者をやめる 読者になる 読者になる

広告/統計/アニメ/映画 等に関するブログ

広告/統計/アニメ/映画 等に関するブログ

端末別年齢階層別インターネット利用率_総務省『通信利用動向調査』

以前、広告代理店マンが「R」を学ぶ必要性はなにかという記事を書きました。
今回もその一貫で、何故に「R」を使うべきか。使ったら一体何が素晴らしいのか?の例を紹介します

世代別 カテゴリー別 かつ 時系列でみたい時のグラフ化 に便利
自分がそう思ったのは、博報堂DYメディアパートナーズのメディア定点調査で、メディア接触時間を過去5年分の時系列で、メディア別・年代別でグラフ化しようとした時です。
Excelでやろうとしたら、恐らく「縦に時系列 横にメディア別の積み上げ棒グラフにして、そのグラフを全世代別に何枚か作る」が限界でしょう。
そんな時こそ「R」です。

メディア定点調査は引用転載の許可取りが面倒でしたので、総務省の「通信利用動向調査」を使用しました。
ExcelまたはCSVで提供されているデータが、2012年末、2013年末の2年分でしたので、取り急ぎそちらをグラフ化しました。
f:id:yyhhyy:20151024210610p:plain
こうやって1枚で見ると、他の世代と比べて13_19才、20_29才のスマートフォンシフトは進んでいるなーということが一目瞭然かと思います。

他にも 
13_19才は、PCの利用が減ってスマートフォンで見始めている
6_12才もスマートフォンちょっとずつ増えてる
50代でも徐々にタブレット使っている
などと言ったことが読み取れると思います。

大人になると忙しい人が増えて、文字や図表の羅列だけで理解する余裕がなくなってきます。
グラフによる可視化というのは、理解の促進にとても重要になってくるので、ExcelだけでなくRをおぼえましょう!



以下、Rのコードです

df1 <- read.csv("h24_25_cevice_demo.csv",header=T) 
library("reshape", lib.loc="C:/r/R-3.1.1/library")
library("ggplot2", lib.loc="C:/r/R-3.1.1/library")
df1m <- melt(df1,id.vars=c("世代区分","年度"))
df1g <- ggplot(df1m,aes(x=年度,y=value,fill=世代区分,ymax=120))
df1g <- df1g + geom_bar(stat="identity",posision="dodge")
df1g <- df1g + facet_grid(variable~世代区分)
df1g <- df1g + scale_x_continuous(
  breaks = seq(2012,2013, by = 1),
  labels = c("2012","2013")
)
df1g <- df1g + scale_y_discrete(
  breaks = seq(0,100, by =20),
  labels = seq(0,100, by =20)
)
df1g <- df1g + ylab("利用率%")
df1g <- df1g + ggtitle("主要端末別世代別インターネット利用率(個人)")
df1g <- df1g + coord_flip()
df1g <- df1g + geom_text(aes(y=value,label=value),position=position_dodge(width=0.9),size=6,hjust=-0.1)
df1g <- df1g + theme(axis.text.y=element_text(size=10,color="black"))
df1g <- df1g + theme(axis.text.x=element_text(angle=45,hjust=1,size=10,color="black"))
plot(df1g)
ggsave(file="df1g.png", plot=df1g, dpi=300, width =16, height = 10)

この ggplot2 というパッケージは優れもので、世の中的には、ggplot脳 と呼ばれる位に中毒性が高い高機能グラフィックスです。
グラフを縦横に分割するのは、「facet_grid(縦列変数~横列変数)」の部分です。そのおかげで1枚で確認することが実現されています。