「直感を裏切る数学」(ブルーバックス)で陽性率を考える

毎日まいにち、新型コロナの報道が延々と…… ハァ、気が滅入ります。

関連する数字もややこしいです。陽性率、感染率、実効再生産数に基本再生産数……。いろいろ言われてもね??

そういえば、神永正博「直感を裏切る数学」(ブルーバックス)に、陽性率に関連する記述があったことを思い出しました。

 

 

.................................................. 引用 ................................................................

やはり、不摂生は良くない。健康で長生きするためには、身体の変化に敏感になるべきだ。善は急げで、さっそく健康診断を受診した。

届いた結果を見てみると、 胃X線検査が「要精密検査」と書かれている。インターネットで調べてみると、実際にがんの人が要精密検査とされる率は約90%だという。これはつまり、「胃がんの可能性が非常に高い」 という意味ではないだろうか。心配である。

「要精密検査」 と言われると、心配になるのは自然なことですね。実際にがんの人が要精密検査となる率が約90% だとすると、検査に引っかかったということは、 かなりの確率でがんに罹患しているように感じられます。 重要なことなので、これを機会に検証してみましょう。

割合を把握するためには計算が必須であり、なんとな くの直感だけでは掴み切れないものなのです。
こうしたややこしい割合を、さらにややこしくしたものが確率です。「要精密検査と判定された人が、実際にがんである確率」は、私たちとしては、ぜひとも理解しておきたい重要な数字です。ところが、これが猛烈に分かりにくいのです。数学者でも、計算してみないと分かりません。

たとえば、次のような仮定だとしたらどうでしょう。
【仮定1】検診を受ける人の1000人に1人は、 実際にがんにかかっている。
【仮定2】がんの人が要精密検査となる率は90%。
【仮定3】本当はがんにかかっていないのに、陽性反応が出て精密検査に回される確率は10%。

このように、 ある条件を仮定 したときの確率を 「条件付き確率」 といいます。この場合は、「要精密検査と判定されたという条件のもとで、 その人が実際にがんである」 という条件付き確率を求める問題になります。
こうした仮定のもとで、 冒頭の男性がんである確率はどのくらいでしょう。50%よりも上でしょうか、それとも下でしょうか。

ごく感覚的には、50%よりは上のように思えるのではないでしょうか。
なぜなら、 がんの人が要精密検査となる率は90%で、がんではないのに陽性反応が出て精密検査に回される確率が10%なのです。 要精密検査になった時点で9割ががんなのでは……と。

少し冷静になって、「いや、精密検査に回されても何ともなかった人が、意外といたかもしれない」  と自分の経験と照らしあわせ、落ち着こうとするもののやっぱり落ち着かない、という感じではないでしょうか。

この間、 約1分。 理屈が分かっているのですからさっさと計算すればよいのですが、 数学者でも話を聞いたそばから計算するとは限らないわけで……。何とか落ち着いて考えてみましょう。

■陽性反応が出てもがんでない確率
仮定1、  2、  3を、それぞれ分解して考えます。
【仮定1】「がんにかかっている人」が1000人に1人ということは、つまり0.1%です。そもそもがんにかかっている人は、とても稀だということです。
【仮定2】「要精密検査とされる率 (陽性反応が出る確率) が90%」と言われると、がんの人を非常に高い確率で検出するように思えます。しかし、よく読むと(仮定2) は、「実際にがんにかかつている人が一次検査の結果、要精密検査になる確率は90%」という意味です。
【仮定3】は、がんではないのに間違って陽性になってしまう確率が10%だということですね。

次に、 これら3つの仮定を樹形図に整理してみましょう(図9)。

 

f:id:eisuumanabu:20200508103041j:plain

 実際にがんであって、かつ陽性反応が出る確率を計算すると、
0.1%×90%=0.09%です。

そして、実際はがんではないが陽性反応が出てしまう確率は、
99.9%(がんでない確率)×10%(がんではないのに陽性反応が出る確率) =9.99%となります。

陽性反応が出る確率は、この2つの確率を合計したものですから、0.09%+9.99%=10.08%です。

このうちがんにかかっている確率は、
0.09/10.08=0.008928571……
となります。約0.9%です。

この男性がんである確率は、じつは1%にも満たないのです。嬉しいことに、予想よりもずいぶん小さいですね。

なお参考までに、 現実のデータがどうなっているのかを付記しておきます。 胃がん検診で胃がんが見つかる割合は、(年代や地域、性別によっても違いますが)ほぼ1000人に1人くらい。X線による検査では、精密検査に回される率は11%前後です。実際のデータも、今回の例とほぼ同じになっています。

............................................ 引用終 ........................................................

理解できますでしょうか? 

図9は%で表示されていますが、もっと具体的な人数(たとえば10000人)で考えてみると、分かりやすいのでは?

f:id:eisuumanabu:20200508103112j:plain

 

ほんとうにガン(10000人×0.1%=10人)であって、かつ正しく陽性反応が出る人数は、
10×90%=9人です。

そして、実際はガンではない(10000人×99.9%=9990人)のに、誤って陽性反応が出てしまう人数は、
9990人×10%=999人です。多いですね。

ですから、ガンの陽性反応が出た人数は、この2つの人数を合計したもので、
9+999=1008人ということになります。

このうちほんとうにガンにかかっている割合は、1008人中9人ですから
9人/1008人=0.008928571……
つまり、約0.9%です。

こんなふうに、具体的な数字で考えた方がイメージしやすいのではないでしょうか?

<確率の比として確率を考えるより個数の比で条件付き確率を考えやすく>
と、月刊誌「大学への数学」で伊香匡史さんも書いておられました。