広告/統計/アニメ/映画 等に関するブログ

広告/統計/アニメ/映画 等に関するブログ

統計

TVCMが昨対比を何%押し上げたか?をGoogle Spread Sheet やEXCELで(敢えて乱暴に)分析する

「テレビCMやったけどさ、どんだけ効果があったのよ?」と質問されたときにどう回答するのが適切だろうか。 データ分析ができる人にとってはデータさえ揃えば難しい話ではない。投下したTVCMのGRPを説明変数として売上なり申込件数を目的変数とした予測モデ…

GPUパソコンにtensorflow-gpuを入れたはなし

最近GeforceのGPUが入ったPC(もはや名前はワークステーションでした)を買って、暫くずっと`tensorflow-gpuが入らない、と苦労していたのですが、 偶然検索したこちらの記事の通り、Anaconda Prompt に任せたら一瞬で適切なものをインストールしてくれまし…

Pythonでアンケート調査のクラスター分析と決定木分析を行う

アンケート調査の分析をするのはマーケティング担当者で、恐らく大学時代は社会学や心理学といった文系出身だと思います。昔ならSPSS、最近ならRだと思います。 一方で、Pythonはどちらかというと情報学系の人やシステムエンジニアが使うツール(言語)でPyt…

機械学習屋と統計屋とデータサイエンティストの違いとは

「統計学は最強の学問である」という本がブームになって既に何年も過ぎましたが、未だに「データサイエンティスト」界隈はポジショントークに溢れているようで、データサイエンスについて本を読もうとすると、データサイエンスブームに乗って我田引水しよう…

Pamdasで特定列が条件を満たすデータをグループ単位で抜き出す

Webサイトのアクセスログを分析していると コンバージョンに至ったユニークブラウザだけ抜き出してアクセス履歴を抜き出したい ということがあると思います。 これが意外と面倒だったので備忘録的にまとめておきたいと思います。 マーケティングオートメーシ…

データ分析で重要なのは「視点」~データサイエンティスト達に本当に必要だったと思われるものについて~

「統計のことがわかっていない自称データサイエンティストが増えて現場は困っている」という”データサイエンティスト”のつぶやきをよく見るようになりました。 これはいったいどういうことなのか?を考えてみたいと思います。 データサイエンティストブーム …

Rで時系列データをクール単位で集計する

過去何度か時系列のエントリーで「xts」が便利だと書いて居たのですが、日足データを月次にすることはできてもクール単位に集計する便利な関数がない、ということに気が付き色々調べました。 事例としてJEITAの「民生用電子機器国内出荷統計」を使ってみます…

【備忘録】_PythonでGoogleトレンドの季節変動を取り除いてみる

自分の備忘録目的ので、そりゃそうだよね?ということがただ確認できる、というもので、特に発見を目的としたエントリーではありません。 Googleトレンドから「ドラえもん」のデータを取得 Googleトレンドでエリアを日本に絞り、過去5年の「ドラえもん」の検…

【データ可視化】誤解を招かないように配慮された最新のカラーマップ(カラーパレット)について

先日読んでいた本 科学技術計算のためのPython入門 開発基礎、必須ライブラリ、高速化 [ 中久喜健司 ]ジャンル: 本・雑誌・コミック > PC・システム開発 > その他ショップ: 楽天ブックス価格: 3,520円 にとても重要なことが記載されていました。 このレイン…

バナー広告の接触回数分布を関数で回帰してみる

広告業界ではある媒体に出稿した時の接触回数の分布(1回当たった人がn人、2回当たった人がn人)をベータ二項分布などで近似しシミュレーションするのが一般的と言われている roi-plus.com なおこのサイトによるとWeb広告の場合は、負の二項分布がグローバル…

アンケートや視聴率の誤差を推測するプログラム(3)-プログラムのスタンドアローンな実行ファイル化-

これは3回中3回めの記事です Pythonがない人の環境でもプログラムを実行できるように実行ファイル化します。色々調べるとPython3ではまだ最新版に対応されていないようで、Python2の環境を手に入れるところから始まります。 先ず、Python2.7の環境を手に入れ…

アンケートや視聴率の誤差を推測するプログラム(2)-プログラムのGUI化-

このエントリーは3回中の2回目です Pythonが入っているPCであれば先般の記事のプログラムで充分なのですが、コマンドプロンプトの画面に数字を打ち込むのは一般の人には抵抗があると思われます。 余談ですがコマンドプロンプトの背景は白の方が心が落ち着く…

アンケートや視聴率の誤差を推測するプログラム(1)-標本誤差の計算まで-

アンケート調査や視聴率の数字を見せた時に、 「これはn数が少ないから信憑性が薄いねぇ」 と言われることがあると思います。しかし実際のところ、 ”では、今のn数だとどれくらいの幅で理解すべきなのですか?” という質問に応えてくれる人は少ないでしょう…

Rの時系列分析で、日別の販売データのトレンドを掴む

Excelではどうしても限界が来るからできるだけRを使うべきだというのが持論です。 Rを使えばこんなことも簡易に出来てしまうという例として、周期性のあるデータの可視化があります。 日別販売データは、土日が急に高くなって見辛い 総務省の「家計調査」か…

当選確率nのくじをn回ひいた時に少なくとも1回は当る確率の計算について

先日このツイートを見て、念のためそれを確かめてみた。 ガチャの予算計算をするときに考える覚えることは3個だけあればいいと考えてる。ひとつはさっき言った・n分の1のガチャをn回引いて当たりが出る確率は63%で、それに追加して・3n回引くと95%で当たりが…

日本の労働者の低い生産性_再現可能なものへの転換

年末年始最初に読んだ本は、 デービッド・アトキンソン 新・所得倍増論 潜在能力を活かせない「日本病」の正体と処方箋 [ デービッド・アトキンソン ]ジャンル: 本・雑誌・コミック > ビジネス・経済・就職 > 経済・財政 > 日本経済ショップ: 楽天ブックス価…

【備忘録】Rで矢印のグラフを描く

グラフにこんな矢印を入れたい時ってありますよね? これは、因子分析をした時のプロットをイメージしています。 色々と調べた結果をデータの準備からプロットまで手順を追ってメモをしておきます。 データの準備 それっぽいデータを乱数で用意 取り敢えず正…

【備忘録】交互作用プロットをggplot2で描く

今読んでいる本に「交互作用プロット」というものが出てきました。 マーケティング・データ分析の基礎 (シリーズ Useful R 3) 標準で入っている関数を使っていたので、せっかくならggplot2で描いてみようと思いました。 今回は、そのメモになります。 交互作…

箱ひげ図とバイオリンプロットの印象の違い

データの可視化に於いて重宝されるグラフの一つに「箱ひげ図」というものがあります。 箱ひげ図 - Wikipedia データの四分位点、中央値、最大値、最小値を記載するのでデータの分布が一覧できるというものです。 しかし箱ひげ図には重大な問題があります。 …

RでGoogleAdWordsのCSVを読み込む時_文字コード_区切り文字_を指定してファイル読込

近年は誰でも安価にデータ分析ができるツールを手にする時代となりましたが、実務に使ってみようと思っても教科書通りにいかない、、ということはよくある現象かと思います。 リテラシーが高い人にとっては呼吸をするように無意識的に対応できるところが、私…

【備忘録】Python(x,y)からAnacondaに変えてみた

自分用のメモ。Pythonはプロキシの関係でpipが使えないので、一通り最初から入っているPython(x,y)を使っていました。しかし最近、Anacondaが話題なのと、Jupyterも使ってみたかったので、入れてみました。これは、次に自分が入れるべき時に注意する点を整理…

【備忘録】pythonで逆行列を使いながらニュートン法を試してみる

最近sympyライブラリにはまっています。とても便利です。ただ単に如何にsympyが便利か、ということのために練習の記録をアップしました。 今回のお題 ガーデン家具の製造業者が木枠とアルミ枠のガーデンチェアを製造しています。木枠は1つ18ドルの製造経費、…

【備忘録】Rを使いながらバナー広告のA/Bテストについて考えてみる

恥ずかしながら普段はバナー広告のA/Bテストをほぼ行っていないのですが、そろそろ真面目に勉強しようと思って色々と調べてみました。色んな方のブログがありましたが、僕の中では、この方の考えが合点がいったところがあります。 abrahamcow.hatenablog.com…

【備忘録】Pyhtonで数式計算_常微分方程式

この記事の続きです yyhhyy.hatenablog.com このsympyというライブラリの便利さは異常で、微分方程式も解けます。 例題*1 豚の体重wの成長率は豚の体重に比例すると仮定し、初日(t=0)での豚の体重を200ポンド、初日(t=0)での豚の体重の成長率は、5ポンド…

【備忘録】Pyhtonで数式計算

昨日、Rを使って単純な数値計算のやり方をメモしたのですが、 yyhhyy.hatenablog.com そもそも、Pythonを使ったら普通に数式計算できるんじゃないの??という疑問が湧いて来まして、確認したらその通りでした、、、ということでそのメモです。 方法 python…

【備忘録】Rで最適化する(シンプルなパターン)

Rは実用では様々な分野で活用されていると思うのですが、こと参考書となると統計ベースのものが多いため、例えば以下のような単純な話の計算手法であっても記載が少ないものです。 例題) あるテレビメーカーが2つのサイズで新商品を計画しているとする。 ・…

【備忘録】Rでテキストマイニングする時に必要なテクニック

※2016/2/21時点での自分の最適解。勉強中ゆえまだまだ未解決事項が残ってはいるものの、先ずはある程度のことまでできれば良しとしています。 テキストマイニングの為のツールは沢山あります。商用ツールでも幾つかあるでしょうし、大学で導入されているSPSS…

【備忘録】Rstudioでrjagsする時の小技

岩波データサイエンス Vol.1 の「JAGSを使って」の章で、RStudioでrjagsを使用していてハマったので自分用メモ textConnectionを使おう rjagsでは、 model <- jags.model( file=model.file, data=list.data, init=list.inits, n.chain=n.chain) といった形で…

Rで時系列データを月別で扱うとき(自分メモ)

pre:not([class]) { background-color: white; } >// if (window.hljs && document.readyState && document.readyState === "complete") { window.setTimeout(function() { hljs.initHighlighting(); }, 0); } // ]]>広告代理店の業務で意外に多いのが、日別…

LaTeXの良さとXeLaTeXの日本語環境について

先日ある理由からLaTeXが必要になり、この程素人ながら勉強をしたのですが、自分が思っていた以上にLaTeXが素晴らしいものでしたので、・LaTeXが何故必要になったのか?・LaTeXの良さとは?・LaTeXで日本語の資料を作るための環境などについて、せっかく学習…