眠れない。昼間は友人とドライブをして帰りの電車ではウトウトしていたはずなのに。
開き直って夜更かしします。
ところで今回のドライブの目的地は関西国際空港+りんくうアウトレットモール。ドライブの相方は大学時代の友人で、彼の専門は統計学です。そんな友人とのドライブ中の会話からスタートです。(ちなみに私の専門は箙の表現論です。)
「十分統計量」という考えが理解できていない件について。
僕「あのさ、十分統計量って概念あるやん。あれ何?統計量が母数(シータ)の・・・」
友人「"情報を十分持っている”やろ」
僕「だからそれがわからんねん!!」
女の子とのデートだったら絶対にしないドライブ中の会話です。大事なことだからもう一回書きますが❝デートしてるときは絶対こんな会話しません❞。なんか普段からこんな会話してると思われるのがちょっと嫌なので・・・荒れました。すみません。
話がそれたので元に戻り、まず十分統計量の定義を確認します。
十分統計量の定義
定義
をある確率分布に従う確率変数とし、をその確率分布のひとつの母数する。統計量が母数に関して十分統計量(じゅうぶんとうけいりょう、sufficient statistics)であるとは、をみたすとに対してを与えた時のの条件付き確率がに依存しないことをいう。
久保川達也著 現代数理統計学の基礎 6章1節より引用
感想(心の声)
「へ?えっと、、、まずこれって統計量に対して定義された概念やんな?」
「うん」
「サンプルで統計量を計算した結果がやんな?」
「そうやな」
「で?普通に考えたたらを満たすサンプルって以外にもたくさんありそうやんな?」
「たぶんな」
「もう一度確認するとという情報を持っているときのの条件付き確率が母数に依存しないってことやんな」
「うん」
「これがなんで母数の情報を失ってないことにつながるの?」
「わからん」
どこに違和感を覚えているのか
統計量が十分統計量の条件をみたすとき、なぜは母数の情報を失っていないといえるのか。そもそも母数の情報を失っていないというのはどういうことなのか。ここが理解できていない部分です。
とりあえず一旦寝て明日再チャレンジ。