統計
「テレビCMやったけどさ、どんだけ効果があったのよ?」と質問されたときにどう回答するのが適切だろうか。 データ分析ができる人にとってはデータさえ揃えば難しい話ではない。投下したTVCMのGRPを説明変数として売上なり申込件数を目的変数とした予測モデ…
最近GeforceのGPUが入ったPC(もはや名前はワークステーションでした)を買って、暫くずっと`tensorflow-gpuが入らない、と苦労していたのですが、 偶然検索したこちらの記事の通り、Anaconda Prompt に任せたら一瞬で適切なものをインストールしてくれまし…
アンケート調査の分析をするのはマーケティング担当者で、恐らく大学時代は社会学や心理学といった文系出身だと思います。昔ならSPSS、最近ならRだと思います。 一方で、Pythonはどちらかというと情報学系の人やシステムエンジニアが使うツール(言語)でPyt…
「統計学は最強の学問である」という本がブームになって既に何年も過ぎましたが、未だに「データサイエンティスト」界隈はポジショントークに溢れているようで、データサイエンスについて本を読もうとすると、データサイエンスブームに乗って我田引水しよう…
Webサイトのアクセスログを分析していると コンバージョンに至ったユニークブラウザだけ抜き出してアクセス履歴を抜き出したい ということがあると思います。 これが意外と面倒だったので備忘録的にまとめておきたいと思います。 マーケティングオートメーシ…
「統計のことがわかっていない自称データサイエンティストが増えて現場は困っている」という”データサイエンティスト”のつぶやきをよく見るようになりました。 これはいったいどういうことなのか?を考えてみたいと思います。 データサイエンティストブーム …
過去何度か時系列のエントリーで「xts」が便利だと書いて居たのですが、日足データを月次にすることはできてもクール単位に集計する便利な関数がない、ということに気が付き色々調べました。 事例としてJEITAの「民生用電子機器国内出荷統計」を使ってみます…
自分の備忘録目的ので、そりゃそうだよね?ということがただ確認できる、というもので、特に発見を目的としたエントリーではありません。 Googleトレンドから「ドラえもん」のデータを取得 Googleトレンドでエリアを日本に絞り、過去5年の「ドラえもん」の検…
先日読んでいた本 科学技術計算のためのPython入門 開発基礎、必須ライブラリ、高速化 [ 中久喜健司 ]ジャンル: 本・雑誌・コミック > PC・システム開発 > その他ショップ: 楽天ブックス価格: 3,520円 にとても重要なことが記載されていました。 このレイン…
広告業界ではある媒体に出稿した時の接触回数の分布(1回当たった人がn人、2回当たった人がn人)をベータ二項分布などで近似しシミュレーションするのが一般的と言われている roi-plus.com なおこのサイトによるとWeb広告の場合は、負の二項分布がグローバル…
これは3回中3回めの記事です Pythonがない人の環境でもプログラムを実行できるように実行ファイル化します。色々調べるとPython3ではまだ最新版に対応されていないようで、Python2の環境を手に入れるところから始まります。 先ず、Python2.7の環境を手に入れ…
このエントリーは3回中の2回目です Pythonが入っているPCであれば先般の記事のプログラムで充分なのですが、コマンドプロンプトの画面に数字を打ち込むのは一般の人には抵抗があると思われます。 余談ですがコマンドプロンプトの背景は白の方が心が落ち着く…
アンケート調査や視聴率の数字を見せた時に、 「これはn数が少ないから信憑性が薄いねぇ」 と言われることがあると思います。しかし実際のところ、 ”では、今のn数だとどれくらいの幅で理解すべきなのですか?” という質問に応えてくれる人は少ないでしょう…
Excelではどうしても限界が来るからできるだけRを使うべきだというのが持論です。 Rを使えばこんなことも簡易に出来てしまうという例として、周期性のあるデータの可視化があります。 日別販売データは、土日が急に高くなって見辛い 総務省の「家計調査」か…
先日このツイートを見て、念のためそれを確かめてみた。 ガチャの予算計算をするときに考える覚えることは3個だけあればいいと考えてる。ひとつはさっき言った・n分の1のガチャをn回引いて当たりが出る確率は63%で、それに追加して・3n回引くと95%で当たりが…
年末年始最初に読んだ本は、 デービッド・アトキンソン 新・所得倍増論 潜在能力を活かせない「日本病」の正体と処方箋 [ デービッド・アトキンソン ]ジャンル: 本・雑誌・コミック > ビジネス・経済・就職 > 経済・財政 > 日本経済ショップ: 楽天ブックス価…
グラフにこんな矢印を入れたい時ってありますよね? これは、因子分析をした時のプロットをイメージしています。 色々と調べた結果をデータの準備からプロットまで手順を追ってメモをしておきます。 データの準備 それっぽいデータを乱数で用意 取り敢えず正…
今読んでいる本に「交互作用プロット」というものが出てきました。 マーケティング・データ分析の基礎 (シリーズ Useful R 3) 標準で入っている関数を使っていたので、せっかくならggplot2で描いてみようと思いました。 今回は、そのメモになります。 交互作…
データの可視化に於いて重宝されるグラフの一つに「箱ひげ図」というものがあります。 箱ひげ図 - Wikipedia データの四分位点、中央値、最大値、最小値を記載するのでデータの分布が一覧できるというものです。 しかし箱ひげ図には重大な問題があります。 …
近年は誰でも安価にデータ分析ができるツールを手にする時代となりましたが、実務に使ってみようと思っても教科書通りにいかない、、ということはよくある現象かと思います。 リテラシーが高い人にとっては呼吸をするように無意識的に対応できるところが、私…
自分用のメモ。Pythonはプロキシの関係でpipが使えないので、一通り最初から入っているPython(x,y)を使っていました。しかし最近、Anacondaが話題なのと、Jupyterも使ってみたかったので、入れてみました。これは、次に自分が入れるべき時に注意する点を整理…
最近sympyライブラリにはまっています。とても便利です。ただ単に如何にsympyが便利か、ということのために練習の記録をアップしました。 今回のお題 ガーデン家具の製造業者が木枠とアルミ枠のガーデンチェアを製造しています。木枠は1つ18ドルの製造経費、…
恥ずかしながら普段はバナー広告のA/Bテストをほぼ行っていないのですが、そろそろ真面目に勉強しようと思って色々と調べてみました。色んな方のブログがありましたが、僕の中では、この方の考えが合点がいったところがあります。 abrahamcow.hatenablog.com…
この記事の続きです yyhhyy.hatenablog.com このsympyというライブラリの便利さは異常で、微分方程式も解けます。 例題*1 豚の体重wの成長率は豚の体重に比例すると仮定し、初日(t=0)での豚の体重を200ポンド、初日(t=0)での豚の体重の成長率は、5ポンド…
昨日、Rを使って単純な数値計算のやり方をメモしたのですが、 yyhhyy.hatenablog.com そもそも、Pythonを使ったら普通に数式計算できるんじゃないの??という疑問が湧いて来まして、確認したらその通りでした、、、ということでそのメモです。 方法 python…
Rは実用では様々な分野で活用されていると思うのですが、こと参考書となると統計ベースのものが多いため、例えば以下のような単純な話の計算手法であっても記載が少ないものです。 例題) あるテレビメーカーが2つのサイズで新商品を計画しているとする。 ・…
※2016/2/21時点での自分の最適解。勉強中ゆえまだまだ未解決事項が残ってはいるものの、先ずはある程度のことまでできれば良しとしています。 テキストマイニングの為のツールは沢山あります。商用ツールでも幾つかあるでしょうし、大学で導入されているSPSS…
岩波データサイエンス Vol.1 の「JAGSを使って」の章で、RStudioでrjagsを使用していてハマったので自分用メモ textConnectionを使おう rjagsでは、 model <- jags.model( file=model.file, data=list.data, init=list.inits, n.chain=n.chain) といった形で…
pre:not([class]) { background-color: white; } >// if (window.hljs && document.readyState && document.readyState === "complete") { window.setTimeout(function() { hljs.initHighlighting(); }, 0); } // ]]>広告代理店の業務で意外に多いのが、日別…
先日ある理由からLaTeXが必要になり、この程素人ながら勉強をしたのですが、自分が思っていた以上にLaTeXが素晴らしいものでしたので、・LaTeXが何故必要になったのか?・LaTeXの良さとは?・LaTeXで日本語の資料を作るための環境などについて、せっかく学習…