端末別年齢階層別インターネット利用率_総務省『通信利用動向調査』
以前、広告代理店マンが「R」を学ぶ必要性はなにかという記事を書きました。
今回もその一貫で、何故に「R」を使うべきか。使ったら一体何が素晴らしいのか?の例を紹介します
世代別 カテゴリー別 かつ 時系列でみたい時のグラフ化 に便利
自分がそう思ったのは、博報堂DYメディアパートナーズのメディア定点調査で、メディア接触時間を過去5年分の時系列で、メディア別・年代別でグラフ化しようとした時です。
Excelでやろうとしたら、恐らく「縦に時系列 横にメディア別の積み上げ棒グラフにして、そのグラフを全世代別に何枚か作る」が限界でしょう。
そんな時こそ「R」です。
メディア定点調査は引用転載の許可取りが面倒でしたので、総務省の「通信利用動向調査」を使用しました。
ExcelまたはCSVで提供されているデータが、2012年末、2013年末の2年分でしたので、取り急ぎそちらをグラフ化しました。
こうやって1枚で見ると、他の世代と比べて13_19才、20_29才のスマートフォンシフトは進んでいるなーということが一目瞭然かと思います。
他にも
・13_19才は、PCの利用が減ってスマートフォンで見始めている
・6_12才もスマートフォンちょっとずつ増えてる
・50代でも徐々にタブレット使っている
などと言ったことが読み取れると思います。
大人になると忙しい人が増えて、文字や図表の羅列だけで理解する余裕がなくなってきます。
グラフによる可視化というのは、理解の促進にとても重要になってくるので、ExcelだけでなくRをおぼえましょう!
以下、Rのコードです
df1 <- read.csv("h24_25_cevice_demo.csv",header=T) library("reshape", lib.loc="C:/r/R-3.1.1/library") library("ggplot2", lib.loc="C:/r/R-3.1.1/library") df1m <- melt(df1,id.vars=c("世代区分","年度")) df1g <- ggplot(df1m,aes(x=年度,y=value,fill=世代区分,ymax=120)) df1g <- df1g + geom_bar(stat="identity",posision="dodge") df1g <- df1g + facet_grid(variable~世代区分) df1g <- df1g + scale_x_continuous( breaks = seq(2012,2013, by = 1), labels = c("2012","2013") ) df1g <- df1g + scale_y_discrete( breaks = seq(0,100, by =20), labels = seq(0,100, by =20) ) df1g <- df1g + ylab("利用率%") df1g <- df1g + ggtitle("主要端末別世代別インターネット利用率(個人)") df1g <- df1g + coord_flip() df1g <- df1g + geom_text(aes(y=value,label=value),position=position_dodge(width=0.9),size=6,hjust=-0.1) df1g <- df1g + theme(axis.text.y=element_text(size=10,color="black")) df1g <- df1g + theme(axis.text.x=element_text(angle=45,hjust=1,size=10,color="black")) plot(df1g) ggsave(file="df1g.png", plot=df1g, dpi=300, width =16, height = 10)
この ggplot2 というパッケージは優れもので、世の中的には、ggplot脳 と呼ばれる位に中毒性が高い高機能グラフィックスです。
グラフを縦横に分割するのは、「facet_grid(縦列変数~横列変数)」の部分です。そのおかげで1枚で確認することが実現されています。