【無料で統計学が学べる動画】統計研究研修所「統計データのできるまで」

この記事を読むのにかかる時間:058

 総務省統計局が公開している、統計学の統計的推測の基礎が学べる動画です。この量を無料で、体系的に学習できるのはありがたいです。

第1章 標本と母集団

第1章 標本と母集団-第1回:標本データの意味

第1章 標本と母集団-第2回:相対度数から確率へ

第1章 標本と母集団-第3回:標本と母集団の代表値

第1章 標本と母集団-第4回:不確実性の表現(確率変数)

第1章 標本と母集団-第5回:確率分布

第2章 正規分布とは

第2章 正規分布とは-第1回:正規分布の意味

第2章 正規分布とは-第2回:正規分布の実例

第2章 正規分布とは-第3回:多峰分布の区分

第2章 正規分布とは-第4回:標準正規分布

第2章 正規分布とは-第5回:中心極限定理

第3章 様々な分布とその応用

第3章 様々な分布とその応用-第1回:一様分布

第3章 様々な分布とその応用-第2回:二項分布

第3章 様々な分布とその応用-第3回:ポアソン分布

第3章 様々な分布とその応用-第4回:指数分布

第3章 様々な分布とその応用-第5回:t分布

第4章 標本調査と母集団推定

第4章 標本調査と母集団推定-第1回:標本誤差と非標本誤差

第4章 標本調査と母集団推定-第2回:標本抽出

第4章 標本調査と母集団推定-第3回:標本データから母集団の特徴を探る

第4章 標本調査と母集団推定-第4回:母集団の値を含む区間を推定する

第4章 標本調査と母集団推定-第5回:標本の大きさの決め方

第5章 公的統計の実際

第5章 公的統計の実際-第1回:母集団の作り方

第5章 公的統計の実際-第2回:標本抽出の実務

第5章 公的統計の実際-第3回:調査の実際

第5章 公的統計の実際-第4回:データの整理

第5章 公的統計の実際-第5回:結果の推定

【無料で統計学が学べる動画】青山学院大学「統計入門」

この記事を読むのにかかる時間:045

 youtubeにアップされている青山学院大学社会情報学部(3年生)、寺尾敦先生の解説です。入門ですが、テキストはありませんので、初めての人には難しいと思います。一通り学習した後に見ると、復習になります。

2015年度「統計入門」

第2回(1) 第2章1節

内容:連続型変数と離散型変数の違いなど

第2回(2) 第2章2-3節

内容:代表値や階級値、度数分布表など

第3回(1) 代表値

第3回(2) 分散と標準偏差

第3回(3) 範囲・四分位範囲

第4回(1) 標本空間

第4回(2) 加法定理

第4回(3) 条件つき確率,乗法定理

第5回(1) ベイズの定理

第5回(2) ベイズの定理の演習

第5回(2) ベイズの定理の演習

第6回(1)確率変数と確率分布

第6回(2)期待値

第7回(1)2項分布

第7回(2)2項分布の性質

第12回(1) t 分布

第12回(2) t 分布を用いた母平均の区間推定

Rによるやさしい統計学 第1章4節:Rをさわってみよう

Rによるやさしい統計学 第1章5節:Rをもっとさわってみよう

Rによるやさしい統計学 第1章6節:Rの使い方のコツ(1)1.6.1~1.6.2節

Rによるやさしい統計学 第1章6節:Rの使い方のコツ(2)1.6.3~1.6.4節

Rによるやさしい統計学 第1章6節:Rの使い方のコツ(3)1.6.5節

【無料で統計学が学べる動画】統計数理研究所「回帰分析」

この記事を読むのにかかる時間:011

統計数理研究所「回帰分析」

統計学を学び始めてから約6ヵ月程度の私の実力では難しいレベル。おそらく中級者向けの動画です。

回帰分析(馬場康維) 1(全4回) 改訂版

回帰分析(馬場康維) 2(全4回) 改訂版

回帰分析(馬場康維) 3(全4回) 改訂版

回帰分析(馬場康維) 4(全4回) 改訂版

【無料で統計学が学べる動画】青山学院大学「社会統計」

この記事を読むのにかかる時間:031

2016年度「社会統計」

第4回:分割表の分析(1)クロス集計表(分割表)

第4回:分割表の分析(2)独立性のカイ二乗検定

第4回:分割表の分析(3)適合度検定

第5回:分割表の分析(4)名義尺度での連関

第5回:分割表の分析(5)順序尺度での連関関

第5回:分割表の分析(6)グッドマンとクラスカルのガンマ

第6回:分割表の分析(7)ケンドールの順位相関係数タウb

第6回:分割表の分析(8)スチュアートの順位相関係数タウc

第6回:分割表の分析(9)ソマーズのd

第6回:分割表の分析(10)順位データの連関

統計入門を学習した後に学ぶ内容です。ここでは「分散分析」についてまとめておきます。

第7回:1要因の分散分析(1)分散分析を行う状況

第7回:1要因の分散分析(2)ANOVAモデル

第7回:1要因の分散分析(3)平方和の分解

第7回:1要因の分散分析(4)平均平方

第7回:1要因の分散分析(5)F分布

FP✕統計データ[標準生命表/日本アクチュアリー会]

この記事を読むのにかかる時間:157

『標準生命表』概要

種類 死亡保険用・第三分野用
利用目的 責任準備金の計算の基礎
※予定死亡率の計算の基礎ではない
出典 日本アクチュアリー会
『標準生命表2018』(詳細)
『標準生命表2018』(概要)

『標準生命表』詳細

作成過程

基礎データをもとに標準生命表を作成するが、その間、様々な補整が行われる。
(1) 基礎データ ⇒ 粗死亡率
  :若年齢部分の補整
(2) 粗死亡率 ⇒ 補正前死亡率
  :死亡率改善の反映
(3) 補整前死亡率 ⇒ 標準生命表
  :第1次補整 数学的危機論による補整
  :第2次補整 Grevilleによる補整
  :第3次補整 Gompertz-Makehamによる補整

「截断年数」は選択効果の除くための期間

基礎データは生命保険会社29社からの実績に基づくもので、実績データをもとに粗死亡率を作成する。作成過程を読むと、知らない用語がちらほらあるため、できる限り調べた。

観察年度は、2008、2009、2011年とある。調査の対象となる年度のことだろう。截断年数は、”選択効果を排除し、死亡率の安全性を確保するため、基礎データの截断を行った。截断年数は、截断後の契約件数が50%以上となるように、男女別・年齢群団別に1年截断~10年截断とした。”とあるが、截断年数の意味が分からなかった。

ニッセイ基礎研究所の基礎研レターが参考になる。ふつう、保険加入前に診査があるため、健康状態が基準に満たなければ加入できない(危険選択)。この危険選択の効果(日本アクチュアリー会では選択の効果と呼んでいる)がはたらくため、契約当初から数年間は保険事故は発生しにくい。そこで選択効果がある期間の経験データは截断し、截断期間後のデータを使用することで真の死亡率に近づけようとしている。
参考:ニッセイ基礎研究所「基礎研レター

截断の期間が長すぎるとすでに死亡していたり、解約していたりするため、截断後の契約件数が50%以上となるようにという基準がある模様。ただ「〔表2〕截断年数の設定 保険年度別粗死亡率 死亡指数」の見方が分からないため、もう少し調べる必要がある。〔表2〕のうち「截断年数別 截断後契約残存数」は理解できる。20~24歳の場合、截断なしなら契約数100%とあり、初年度を截断すると残存数は77%、2年度まで截断すると58%、3年度までなら42%と読み取れる。男女別・年齢群団別に設定するので、男性で20~24歳の場合は、3年度まで截断すると50%を切ってしまうため、截断期間は2年となる。またこの截断期間の上限を標準生命表2018では10年としている。

観測量は膨大で、母数に近いと考えられる

経過件数は男性4,068万件、女性3,0002万件、死亡件数は男性26.3万件、女性9.5万件とサンプルサイズから母数を推測するには十分な観測量と考えられる。ちなみに契約年数は30年以下、基本は有診査だが、17歳以下(男性)・27歳以下(女性)は観測量が他の年齢と比べて少なくなるため、無診査も含まれている。

95%信頼区間の上限

95%信頼区間は、「母集団から標本を取り出し、その平均から95%信頼区間を求める、という作業を100回行うと、95回はその区間の中に母平均が含まれる」という意味で、95%の確率で正しいという意味ではない。有意水準95%で両側検定を行っていることがわかる。「95%信頼区間の上限」は上限検定、下限検定の上限のことだろうか。また信頼上限死亡率の算出方法が不明である。ただ、粗死亡率の95%信頼区間の上限」が「粗死亡率の130%」を上回る場合は第21回生命表に置き換えている、という作業自体は理解できた。

【統計学・データ分析】に役立つ書籍

この記事を読むのにかかる時間:130

【統計学・データ分析】役立つ書籍

「今日から役立つ統計学の教科書」

数式など数学の知識を意識することなく、事例中心で読みやすかった。ちょっと統計学に興味がわいてきた人にはいいかもしれません。

今日から役立つ統計学の教科書

新品価格
¥1,404から
(2017/12/30 20:35時点)

「統計学が最強の学問である」

「今日から役立つ統計学の教科書」よりも先に読みました。こちらも事例が用いられていて読みやすかったですが、少しレベルが高いかもしれません。統計学の本は、事例があると理解するのが早い。

統計学が最強の学問である

新品価格
¥1,728から
(2017/12/30 20:38時点)

「できるビジネスパーソンのためのExcel統計解析入門 (Excel for BIZ)」

 こちらは実際にエクセルで統計分析をし、自分なりに経験値が上がったら読む予定の書籍。この手の本を今までは最初に買っていましたが、力が付いたあとに読むといい、と最近は思っています。

できるビジネスパーソンのためのExcel統計解析入門 (Excel for BIZ)

新品価格
¥2,160から
(2017/12/30 20:41時点)

「恋する統計学[ベイズ統計入門]」

入門ですが、本格的に統計学を身に付けたい向け。高校数学の知識が必要なので、少しずつ読み進める。

恋する統計学[ベイズ統計入門]

新品価格
¥1,620から
(2017/12/30 20:46時点)

「恋する統計学 [推測統計入門]」

入門ですが、本格的に統計学を身に付けたい向け。高校数学の知識が必要なので、少しずつ読み進める。

恋する統計学 [推測統計入門]

新品価格
¥1,620から
(2017/12/30 20:46時点)

「恋する統計学[記述統計入門]」

入門ですが、本格的に統計学を身に付けたい向け。高校数学の知識が必要なので、少しずつ読み進める。

恋する統計学[記述統計入門]

新品価格
¥1,620から
(2017/12/30 20:46時点)

「恋する統計学[回帰分析入門(多変量解析1)] (多変量解析 1)」

入門ですが、本格的に統計学を身に付けたい向け。高校数学の知識が必要なので、少しずつ読み進める。

恋する統計学[回帰分析入門(多変量解析1)] (多変量解析 1)

新品価格
¥1,620から
(2017/12/30 20:47時点)

「恋する統計学[因子分析入門(多変量解析2)] (多変量解析 2)」

入門ですが、本格的に統計学を身に付けたい向け。高校数学の知識が必要なので、少しずつ読み進める。

恋する統計学[因子分析入門(多変量解析2)] (多変量解析 2)

新品価格
¥1,620から
(2017/12/30 20:47時点)

【統計学・データ分析】に役立つサイト

この記事を読むのにかかる時間:010

5-5.等分散の検定

この記事を読むのにかかる時間:035

等分散の検定

等分散の検定

両側検定
\begin{align*}
&u_1^2 > u_2^2\\
&F=\frac{U_1^2}{U_2^2}・・・検定統計量\\
&f ≧ F_{n_1-1,n_2-1} (\frac{α}{2})・・・棄却域\\
\end{align*}
\begin{align*}
&u_2^2 > u_1^2\\
&F=\frac{U_2^2}{U_1^2}・・・検定統計量\\
&f ≧ F_{n_2-1,n_1-1} (\frac{α}{2})・・・棄却域\\
\end{align*}
片側検定の棄却域は、
\begin{align*}
&f ≧ F_{n_1-1,n_2-1} (α)\\
&f ≧ F_{n_2-1,n_1-1} (α)\\
\end{align*}
不偏分散
\begin{align*}
&u^2=\frac{n}{n-1}・S^2\\
\end{align*}