ベイズ 統計 の 理論 と 方法 - ベイズ統計の方法

ベイズ 統計 の 理論 と 方法 - ベイズ統計の理論と方法【初心者向け】

ベイズ 統計 の 理論 と 方法 - ベイズ統計の理論と方法 輪読会@沖縄 第54回

この記事の目的と対象者 この記事は、統計をほとんど勉強したことがない人が、立派に「ベイズ統計」というナウでヤングな統計学について語れるようになるまでの道標を示します。 ドヤ顔でベイズ統計について 正しいことを語れるようになる、統計に詳しい人とがガッツリ議論できるようになるぐらいまでがこの記事のゴールです。 この記事の勉強をしたところでベイズ統計を使いこなせるようになるわけではないことに注意してください。 現場で使いこなせるようになるには、プログラミングがある程度できる必要もありますし、対象となる実データも必要です。 本当に統計的処理をする前には、前処理なんかも必要ですよね…… 統計を使ったデータ分析には、統計学の理論だけではなく、様々な道具を身につける必要があるのです……涙 (よみがえる眠れぬ夜のおもひでたち……) 基本的には書籍を使った勉強法を紹介していきます。 ある程度、統計学のことが分かっているよという人は、途中の本は読み飛ばしていただいても問題ありません! ベイズ統計学とは ベイズ統計学概要 この記事ではベイズ統計学とは?ということについては、あえて詳しく触れません。 統計学には、頻度主義とベイズ主義(細かく言うと他にも)があるということをなんとなく知っていて、それらが根本的に立場の違うものだということが分かっていれば読める記事になっています。 詳しくは下のような記事を参考にしてください!• 一応言っておくと、筆者の方々ももぼやかして書いていたり、テキトーなところがあります。 とはいえ、これらの記事を悪く言っているわけではありません。 私が今書いているこの記事のゴールは、こういった記事を読んだ時にどこをどうぼやかしているのか、あるいは本当にわからずに書いているのか分かるようになろうということなのです。 ベイズ統計学について、とても重要なことだけ言っておくと、 ベイズ統計学はベイズ以外の統計学よりも絶対的にいいものでも、上位互換でもなんでもありません。 ただの思想です。 宗教です。 絶対的に正しい統計学なんてものは、ただの幻想です。 ベイズだからそれ以外の統計学の問題点をすべて解決できるなんて夢物語は、この美しくも非情な世界には存在しません。 ただ、「主義」には時代ごとに流行り廃りというものがあります。 分かりやすい例でいうと、民主主義がその最たる例ですね。 現代の先進国の人々は、民主主義を最も優れた政治的手法のように思っていますが、いつだって絶対に優れているとは限りませんよね。 民主主義以外の主義がそれなりにワークしてきた時代もあったはず?です。 もしかしたら、1000年後には民主主義なんてものはバカにされているかもしれませんよね。 統計学の世界では、近年、頻度主義が批判にさらされています。 この記事を読む方は、「有意な違い」があるなんてフレーズを聞いたことがあるはずです。 20世紀の統計学の主流は頻度主義でした。 この主流たる頻度主義統計の最も便利なツールである「統計学的仮説検定」の「p値」「有意性」が批判にさらされているということです。 そこで、ベイズ統計学が頻度主義のアンチテーゼとして徐々に広がっているのです。 また、ベイズ統計を扱うためには非常に大きな計算能力が必要であり、ここ10年、20年でやっとベイズをみんなが扱えるようになったという背景もあります。 私が大学院にいた2年前には、私が専門としていた農学(生物統計)をはじめ、医療統計、心理統計などなどで、p値に頼りすぎないようにしよう主張する研究者が増えてきているように感じました。 私は、今後、イケている風(笑)を醸し出したいならベイズについて語れたほうがいいとは思っています。 統計初心者のためのベイズ入門 頻度主義入門 ベイズ主義をきちんと理解するためには、まずは頻度主義をきちんと勉強しましょう 笑 ベイズ主義と頻度主義は立場が違うから、ベイズ主義を理解するためには頻度主義を勉強しないでいいかというと、そうは問屋がおろしません。 頻度主義を勉強したくなくてベイズに逃げようとしていた人は、こっそり心を入れ替えててください 笑 その腐りきった根性を叩き直す気のない人は、そっとこの記事を閉じましょう 笑 頻度主義を勉強したほうがいいのは、 ベイズ主義を深く理解するためには、頻度主義との違いを意識しながら勉強していくのがオススメだからです。 多くのベイズについて書かれた入門書や初心者向け記事が、頻度主義との違いについて書いています。 そういったものを読む時に頻度主義の知識が必ず役に立ちます。 これは、先ほど説明したような統計学の歴史上、仕方がないことなのです。 ですので、まずは、 - - - といった、実際に手を動かしながら統計学を学べる系の本で基礎を学ぶのがいいでしょう。 頻度主義の統計学について詳しく書かれた専門書は腐るほどあります。 ですが、急に小難しい座学に取り組んでも心が折れてしまうだけです。 上記の本は、プログラミンの初心者でも取り組める内容なので、気楽に楽しく統計学をイメージすることができます。 そして次は、少し理論的な勉強に進みましょう。 個人的には、 - この本にお世話になりました。 心理学徒でなくとも非常に参考になります。 実は、心理学は、統計が進歩する土台を作った一大学問なのです。 その操作をしたことが本当に効果があるのかが一目瞭然ではなく、実験的に確かめるしかないからでしょうか。 逆言うと、心理学は、「科学」として認められるために、「統計」という客観的に見えるツールに助けてもらうしかなかったのでしょう。 これは、例えば、薬の効果を確かめたい医学でも同じです。 上記の本では、実際に心理学で統計がどのように使われているかということも踏まえて解説されており、楽しく読めると思います。 ベイズ主義入門 ここまでくれば、頻度主義のことはある程度分かっていただけたはずです。 次に、頻度主義とベイズ主義の橋渡し的な本を読みましょう。 頻度主義とベイズ主義の橋渡しというポジショニングではこの本(通称ミドリ本)以外にはありえません。 この本はこの記事以外の多くの記事でも絶賛されています。 平易に楽しく統計学の世界の広がりを感じることができるでしょう。 私もこの本を読んで統計学がもっと好きになりました。 ただ数式ばかりで、堅苦しく、楽しくないと思っていた統計学が、ミドリ本に出会って一気に色付いて見えました。 人生を変えてくれた名著と言っても過言ではありません。 ミドリ本の素晴らしいところは、 1. ベイズ主義にはなくてはならないツールのMCMC(マルコフ連鎖モンテカルロ法) の説明の分かりやすさにあります。 ベイズの理解には、MCMCの理解が欠かせません。 マルコフ連鎖モンテカルロ法といういかにも難しそうな名前のこいつが、ベイズを実用化するためにはどうしても必要だったのです。 同時にこいつが、計算機の能力が高まる近年まで、ベイズの貞操をかたく守っていた張本人でもあるのです 笑 この本の後は、• といった、もうちょっとベイズベイズ(笑)した本を読みましょう。 どちらも難易度はそんなに高くありませんし、テクニカルに難しい話に入りすぎるのではなく、「ベイズを使う意味」みたいなものがきちんと分かるように書かれている点がオススメです。 ミドリ本とこれらを読むと、ベイズの深い世界の入り口に立つことができるでしょう! ベイズ入門後の勉強法 上記のような勉強過程を経た後には、やはり実際に手を動かしながら勉強してみるのがいいでしょう!• などが実際にベイズを使えるようになるための1歩ですね。 なによりも、これらの本では、手を動かしながらMCMCがきちんと理解できるようになっています。 実際にベイズを使うような人で、プログラミングができない人はいないでしょう。 なぜなら、冒頭にも説明したように、ベイズでデータを扱うためには、その他にもやらなければならないことがあるたくさんあるからです。 データを集めてきたり、くっつけたり、きれいにしたり、あんなことやこんなことをしたり。 これらの本はそれなりにプログラミングができることを前提には書かれていますが、ここまでたどり着いたあなたならきっと、本を片手に楽しいベイズライフを送ることができるでしょう。 まとめ 個人的な感想にはなりますが、ベイズは非常に面白いです。 統計という一見かたそうな学問が、ベイズを学ぶとどこか柔らかく愛らしい側面を見せてくれます。 でも、その笑顔にはどこか深い闇が見えて……… そんな不思議で魅惑的なベイズ統計学の世界を覗いてみませんか?.


第4章。

More

データとの距離(適合度)は、絶対的な定数ではなく、相対的な比較による•。

More

統計的推測において、多くの人が感じる 心配は「なぜ人間が定めた確率モデルや事前分布を正しいと信じることができるのだろう」 ということでしょう。

More

最尤推測は多くの統計的推測の方法の中のひとつであり、 ベイズ推測も多くの統計的推測の方法の中のひとつであり、「一番良い推測」というものはありません。

More

そこでどうするかといえば、事後分布を上の式ではなくてモンテカルロシミュレーションで推定しましょう、ということになったわけです。

More

マルコフ連鎖モンテカルロ法といういかにも難しそうな名前のこいつが、ベイズを実用化するためにはどうしても必要だったのです。

More

回答3.尤度関数は「パラメータが与えられたときサンプルが現れる確率(密度)」を 表していますが「サンプルが与えられたときのパラメータの確からしさ」を 表していません。

More

一方、 A は「原因」であるから、従来のでは、確率分布 P A は既に決定しているものであり、従って X を条件とする確率 P A X A は意味がない。

More

comの人工知能部門で世界的トップセラーとなり、たちまち4刷となった英語版原著Pattern Recognition and Machine Learning、待望の日本語版。

More