Probability
はじめに
ここでは、確率論の基礎となる定義を確認していきます。より具体例を増やそうと思っているので、お待ちください。
——
確率の定義
定義に入る前に具体的な確率を見てみます。 例えばコイントスで表裏がでる確率って同様に確からしいとするとです。他にもサイコロの1の目が出る確率はです。このような確率が生じる集合を標本空間(sample space)とよみ、で表します。次に標本空間内の事象(events)の集合をとして、関数]を定めてみます。 このときに以下の性質を満たすとします。
このとき、を確率空間(probability space)とします。具体例を通して確認してみましょう。
サイコロの具体例
6面ダイスを想像してみます。このとき、標本空間が表されます。そして、出る目が2の倍数であるときの事象はです。 そのため、2の倍数である確率はとなります。
この確率空間は以下の定理を満たすから確認してみます。
確率の命題
条件付き確率
Bという事象が起きたうえで、Aという事象起きるとき、その確率をと表して、
とかきます。また、次のような定理があります。
この定理はベイズの定理といい、ベイズ学習の基礎となる定理です。 条件付き確率とベイズの定理も具体例を通して確認してみます。
条件付き確率の具体例
図のような2つの箱があるとします。
と定義してみると、条件付き確率は次のようになります。
確率変数(probability variables)
さっき説明した確率空間だと数値的に確率は扱いにくいと思います。そのために、次は確率分布、確率変数という概念を導入していきます。 確率空間内には、標本空間が存在しています。そのに対して関数を定めます。このを確率変数といいます。集合だったときに対して、実数で表されるからより扱いやすくなります。
今までの確率はサイコロのように離散的な確率でした。 ここからは連続的な確率も出てくるので紹介していきます。
離散確率変数
離散確率変数では、]と定められた確率質量関数が存在します。このとき、は以下の式を満たします。
連続確率変数
連続確率変数では、]と定められた確率密度関数が存在します。または確率分布と呼ばれます。そしては以下の式を満たします。
確率密度関数で有名なものに、ガウス分布の確率密度関数があり、以下の式で表されます。
独立
ここで、新たな概念を紹介します。が次のように表されるとき、は独立であるとよばれます。 は標本空間内の集合であるとしています。
先ほど導入した確率変数を使って書き直してみます。このとき、は同時確率分布とよばれます。確率変数が互いに独立であるときは、次のように表されます。
この式は、二つ以上の確率変数が存在するときにも、成り立ちます。実際にの確率変数が互いに独立であるときは、同時確率分布は次のように表されます
同時確率分布が存在しているとき、一つの確率変数について和をとる(もしくは積分する)ともう一方の確率分布を得ることができます。
確率の平均・分散共分散
この章では、確率分布の特徴を表す要素となる概念について紹介していきます。確率分布の平均などの計算結果を覚えておく必要はありませんが、覚えておくと後々楽になります。
期待値・平均
まずは、期待値・平均の定義を確認していきます。
確率変数のベクトルが存在して、その写像に対して期待値は次のように定義されます。
自身の期待値をとるとき、を確率の平均とします。(以下、と表現します。)
平均はデータの中心となる値を数値化したものであるということができます。
分散共分散
分散共分散の定義を確認していきます。
確率変数に対して、分散(variance)は次のように表されます。
定義のように確率変数の平均と確率変数の差を二乗していることから、分散は平均を基準としたデータの広がり具合を数値化したものであるといえます。
共分散(covariance)は、二つの確率変数の関係を計るときに用いられる数値です。 二つの独立な確率変数に対して、次のように定義されます。
ここからは多次元での分散共分散の表現方法を確かめていきます。 確率変数のベクトルに対して、その平均ベクトルが存在するとします。 このとき、以下の計算により分散共分散行列を表現することができます。
この式は、行列となって次のように表されます。
対角に分散、それ以外の成分に共分散が表れていることが確認できます。
終わりに
今回は、確率論の基礎となる概念をまとめました。概念をまとめた後は実際に計算してみるとより確率のイメージが湧くと思います。ぜひ計算してみてください。 次回は、いろいろな確率分布を紹介しながら平均、分散を計算していこうと思います。ついでに確率分布の図も紹介しようと思っています。 いずれにしても重要なことは、ド葛本社をみることです、必ずみましょう 最後に参考とした文献をまとめておきます。
機械学習スタートアップシリーズ ベイズ推論による機械学習入門 (KS情報科学専門書)
- 作者: 須山敦志,杉山将
- 出版社/メーカー: 講談社
- 発売日: 2017/10/21
- メディア: 単行本(ソフトカバー)
- この商品を含むブログ (1件) を見る
- 作者: 渡辺澄夫
- 出版社/メーカー: コロナ社
- 発売日: 2012/03/01
- メディア: 単行本
- 購入: 1人 クリック: 4回
- この商品を含むブログ (8件) を見る
- 作者: 藤澤洋徳
- 出版社/メーカー: 朝倉書店
- 発売日: 2006/12/01
- メディア: 単行本
- クリック: 2回
- この商品を含むブログ (7件) を見る