R のダウンロード

The Comprehensive R Archive Network

Rのインストールの仕方【Windows版】 | 全人類がわかる統計学 

RStudio のダウンロード(R を先にインストールしてください)

※ 無くても問題ありません。

Download RStudio – RStudio

 

サブテキスト

統計学テキスト 公開ページ

上記リンク先の”「統計学入門」ダウンロード ”からPDFファイルをダウンロードできます。(この他の統計学講座でも利用させていただいているテキストです。)

 

演習用ファイル(2.5MB)

[ZIP] data-analysis-from-scratch-v3

 

R演習用コード

 

R 利用前の注意

R や多くのプログラミング言語には、「ワーキングディレクトリ」があり、ソフトウェア上で別のファイルを開く場合などには、そのソフトウェアが現在どこを作業領域にしているかを確認しなければなりません。

現在の作業領域は

  • getwd()

で確認できます。

 

第6章

2グループ間での⽐率の差の検定:

  • prop.test( 成功回数ベクトル, 試行回数ベクトル )

bannerA_click= c(307, 279, 264, 299, 290, 317, 264, 308, 267, 312, 304, 295, 281, 292)

bannerA_imp = c(10305, 9474, 9393, 10152, 9851, 10792, 9300, 10803, 8976, 10515, 10545, 9890, 10069, 9784)

bannerB_click = c(289, 282, 311, 342, 326, 319, 325, 303, 312, 318, 305, 299, 311, 281)

bannerB_imp = c(9568, 9427, 9849, 10771, 10492, 10445, 10249, 9935, 10001, 10043, 10516, 9763, 10299, 9067)

prop.test(c(sum(bannerA_click),sum(bannerB_click)),c(sum(bannerA_imp),sum(bannerB_imp)))

分割表(カテゴリ間の関連性)のχ2 検定

  • chisq.test( 行列データ )

以下は演習用データを作成しているだけなので中身は気にしない

実際の分析部分は以下のみ

 

第7章

ロジスティック回帰分析

モデル式推定

  • glm(目的変数 ~ 説明変数, 既知データ, family = binomial(link=”logit”))

モデル式による確率予測

  • predict(モデル, 未知データ, type=”response”)

予測

 

第8章

 

1元配置分散分析

  • aov(分析対象 ~ 要因, データ)

帰無仮説は「ワカメの消費金額は地域による差がない」。region の Pr(>F) がP 値にあたる。

因子分析

因子分析では、結果を図にプロットすることが効果的な場合があるが、そこに到るまでにはいくつかライブラリをインストールしておく必要がある。

なお、この分析は参考程度に示すもので、コードの詳細には基本的に触れない予定である。