3.検査結果が完全に正確で無いならば、確率を知りたい!
1897年のハーバード・ロー・レビュー誌に載った論文で、オリバー・ウェンデル・ホームズ・ジュニアは、完全に正しいと確信できるまで判決を下すことを拒否した有名な裁判官のことを記していました。ホームズ・ジュニアは、その裁判官の行動は理解できるものであるし、人は誰もが確実性を担保したいという欲求を持っていると述べていました。しかし、ホームズ・ジュニアは、完全な確実性などというものは幻想であり、存在しないと述べていました。
ホームズ・ジュニアが誰しもが確実性を求めると考えたことは、間違いではなく真実であると言えるでしょう。様々な研究で明らかになっていますが、人間は肉体的な痛みに耐えることができても、不確実性には耐えられないのです。心理学者のジェローム・ケーガンは、不確実性を解消したいという衝動が人間の行動の主な源であると主張していました。世界は解消できそうもない不確実性に満ち溢れています。特に自分の躰について不確実性があると認識すると、とても不安な気持ちに襲われるものです。ですので、検査を十分に行って調べつくしたいという欲求は非常に強くなります。2001年~2002年にかけて、米国人500人に対して調査を行いました。その際の質問は、現金1千ドルを貰うか、無料で全身CTスキャン検査をするか、どちらかを選べというものでした。全ての被調査者に既往症などが無いにもかかわらず、73%が全身スキャンを選択しました。緊急救命室で医師の私がX線検査などは必要ないと示唆しても、患者がX線検査やスキャン検査をして欲しがるということは良くあることです。
様々な研究で明らかになっているのですが、多くの患者が医療検査の結果の正確性を実際よりも確定的なものであると見なしています。2006年にドイツで実施された調査によると、回答者のほぼ半数が、マンモグラムの検査結果は「100%正確」であると考えていました。しかし、実際にはマンモグラムの検査結果の正確性はせいぜい80%しかないのです。最近、私は、あるご夫人が双極性障害の徴候を示している甥のことを話題にしているのを耳にしました。話によれば、その甥は検査を受けることを拒んでおり、そのことがご婦人にとっては不満のようでした。どうやら、そのご婦人は1度検査をしたら甥の病相が全て把握できると考えているようでした。検査を受けたら、何でも明らかになると考えている人は少なくないのです。新型コロナウイルスの検査の現場を見ていても、検査すれば全て正確に把握できると考えている人は実に多いのです。先月、熱があり咳をする者がいるというので新型コロナの検査を受けに来た家族(3人)がいたのですが、検査結果はいずれも陰性でした。検査結果を見て家族の1人が「全員陰性のようだ。」と言って安心しきっていました。実際には、たくさんの医療検査がありますが、完全に正確な検査というのは非常に稀です。誤った結果が出ない検査はまず無いと考えるべきです。新型コロナの検査も同様で完全に正確ではないのです。どんな医療検査でも誤った判定が示されることがあるということです。したがって、医師は医療検査の結果を判断材料に使いますが、検査結果は必ずしも正確ではないということを認識しなければなりません。また、検査が正確であるかを常に検証し続ける必要もあります。
各種の医療検査が正確か否かをチェックする必要があると最初に考えたのは、ジェイコブ・イェルシャルミーです。彼は1904年にエルサレムの近くで生まれました。イェルシャルミーは、ジョンズホプキンス大学で数学を学ぶために米国に渡り、そこでまだ出来たばかりの分野であった生物統計学に興味を持つようになり、公衆衛生の向上に多大な貢献をした後、1940年代後半にカリフォルニア大学バークレー校に移りました。そこで生物統計学の確立と発展を支援しました。1947年に非常に影響力のある論文を発表しました。イェルシャルミーは、結核を診断するためのX線検査手法はいくつか有ったのですが、それを比較していました。実験の中で、各患者を4つの異なるタイプの胸部X線で撮影しました。次に、5人の熟練の放射線科医に撮影したフィルムを見させて、肺に結核があると疑われる患者を特定させました。イェルシャルミーは、実験をする前から、どのタイプで撮影しても完全に正確ではないことを認識していました。論文中に彼は記していました、「最高の技術を用いても、診断結果を完全に正確なレベルまで引き上げることは不可能なのです。」と。実験結果は驚くべきものでした。4つのタイプの胸部X線撮影方法がありましたが、いずれかが他よりも大幅に勝っているということはなく、正確さは似たり寄ったりでした。どのX線撮影方法も見る放射線科医が変わると正確さが変わりました。同じX線撮影方法でも放射線科医が違うと正確さに最大で30%の差が出ました。X線撮影方法ごとに正確さに差があるわけですが、放射線科医の正確さにもバラツキがあったので少しややこしく見えました。イェルシャルミーは、放射線科医に既に見させたフィルムを再度見させました。その際に既に見させたものであるということは分からないようにしていました。その結果、同じ放射線科医が同じフィルムを見て別の結果を出す例が散見されました。1人は特に不一致が多く20%もありました。
イェルシャルミーは、X線撮影で結核を検査する手法は完全には正確ではないと結論付けました。また、放射線科医がフィルムを見るという作業ではエラーが避けられないと結論付けました。そうしたエラーを回避する術はありませんでした。彼が天才と言われる所以は、不確実性を数値化することができることに気付いたことです。数値で検査の不確実性が示されていれば、現場の医師は検査結果をどれくらい信頼して良いかを正確に把握できるようになります。イェルシャルミーは、2つの重要な指標を考案しました。2つの指標は、似ていて非常に紛らわしいのですが、いずれも医療検査の正確さを評価する際の基準として現在でも使われています。2つは、”感度(sensitivity)”と”特異度(specificity)”です。病気がある群での検査の陽性率(真陽性率)が検査の感度です。検査対象の病気を患っている者100人を検査して95人を検出できた場合の感度は95%となります。病気が無い群での検査の陰性率(真陰性率)が検査の特異度です。検査対象の疾病を患っていない者100人を検査して93人が陰性となった場合の特異度は93%となります。感度の数値が低い検査では、偽陰性が発生する可能性が高くなります。逆に特異度の数値の低い検査では、偽陽性が発生する可能性が高くなります。感度と特異性の両方を考慮して、医師はどの程度その検査の結果を信用してよいか判断しています。
感度と特異度は検査ごとに異なります。感度と特異度はさまざまな要因の影響を受けます。ヒューマンエラーが発生すれば影響を受けます。医師が画像の解釈を誤ってしまうことがありますし、試料の採取時のミスなども影響します。また、検査自体に感度と特異度に影響を及ぼす要因が有る場合もあります。化学的な分析検査では稀にエラーが発生してしまうことは避けられません。また、MRI(磁気共鳴映像法)やCTスキャナーでは、どうしても画像に小さな傷が出てしまうことがあります。新型コロナウイルスの検査では、PCR検査が広く行われていますが、ウイルスの遺伝物質を検出するポリメラーゼ連鎖反応(PCR)と呼ばれる技術が使われています。ウイルスの遺伝子を検出するという手法ゆえに、PCR検査の特異度は非常に高いのですが、感度はそれほど高くありません。ですので、PCR検査で陽性となったということは、ウイルスに感染している可能性が非常に高いということを意味します。一方で、PCR検査で陰性となった場合には、間違っている可能性は十分にあるのです。新型コロナのPCR検査の精度については様々な見解があるようですが、最新の推定によれば、偽陰性率は30%ほどと思われます。推測ですが、現場レベルではPCR検査で使う綿棒の使用や保管が不適切であるために、各サンプルの中のウイルス量が減ってしまって陽性が偽陰性となっている場合もあると推測されます。また、感染して日が浅い時にPCR検査をすると、偽陰性となることが多いと推測されています。まだウイルス量が少なく、検出できる閾値を下回っているのが原因のようです。このように検査の精度に影響する要因はいろいろとあります。除去可能なものもありますが、不可能なものもあります。
イェルシャルミーが検査の精度を数量化する方法を検討していた時、厄介な問題が有ることに気付きました。検査の精度を調べるためには、陽性の患者を確保しなければなりませんが、そもそもどうやって本当に陽性であると特定するかということが問題になりました。評価対象となっている検査方法で陽性と特定するわけにはいかないからです。別の検査方法で陽性と特定しなければなりません。イェルシャルミーは論文中に記していましたが、無限ループ状態だったようです。ある検査の精度を調べるためには、その検査の対象となる疾病の陽性者を別の方法で特定しなければならない。さらに、その検査方法についても精度に問題がないかを証明するために、別の検査方法で陽性者を特定しなければならない。さらに・・・という無限ループに陥ってしまうのです。イェルシャルミーは、X線検査の精度の研究では、複数の放射線科医が一致して陽性とした場合を陽性とすることにより、この問題を回避しようとしました。放射線科医の見解が一致した場合が正確であると証明する手立ては彼にはありませんでした。しかし、それ以上彼に出来ることはありません。現在、新型コロナウイルスの検査の精度を評価する際に同様のアプローチが採用されています。最近BMJ(British medical Journal :1840年から英国で発行され続けている医学誌)に載った記事によると、医療検査の精度を評価する際には、検査結果のデータと他の多種多様な情報を突き合わせています。陽性か陰性かとか症状とか血液検査の結果とか撮像データなどです。出来るだけ突き合わせるデータは多い方が良いのです。ですので、完全に正確では無い検査の結果も参考に使われます。医療検査の精度を調べる際には、概ねこの方法で行われているのです。こうしたことも、医療検査が完全に正確ではないことの原因の1つとなってしまっています。