「”学者や医者の一意見”の信頼性は、統計科学より低い」のはナゼか。知っておきたい「エビデンスレベル」と「認知バイアス」

統計学
スポンサーリンク

「学者や医者の一意見」の信頼性は低い。知っておきたい「エビデンスレベル」

 

「エビデンス」って何ですの?

ここ最近、巷で「エビデンス」という言葉をよく聞く。

「エビデンスに基づく医療」「エビデンスに即した政策論議」「精神論ではなく、エビデンスベーストな教育を行なおうよ!」「お前の発言にはエビデンスが無い。居酒屋談義だな」etc…。さまざまな場面で耳にすることが多くなった言葉、まるで魔法のフレーズ”エビデンス”だが、はて、一体これは何なんだろうか。

 

中学生向けの単語集よろしく、文字通り訳せばエビデンスとは「証拠」という意味合いだ。実際会社など社会人生活においては、この意味合いで使われることも多い。例えば、個人情報を扱うサービス業や金融業などの場合、顧客の情報や身分証明のことを「エビデンス」と呼んだりする。

一方で「医療」や「教育」、または「政策」といった分野では「その主張の科学的根拠」といった意味合いで使われる。「エビデンスに基づいた医療」の場合、「治療法が選択されることの科学的根拠」といった感じで用いるように。

 

さてここで疑問がわく。すなわち、「教育」や「政策」など、あいまいで複雑な「社会事象」において、「科学的根拠」など求められるのだろうか。

ところがどっこい、統計科学が進んだ現代においては、これがそこそこできてしまうのだ(もちろん問題が無いわけではない、詳しくは後述)。

 

知っておきたい「エビデンスレベル」。信頼できるエビデンスと、あまり信頼できないエビデンスがある

そして「エビデンス」について詳しく知る上で知っておきたいのが、「エビデンスレベル」だ。

すなわち、エビデンスには「階層」や「レベル」があって、その中には信頼できるエビデンスと、あまり信頼できないエビデンスがある。元々は医学分野で発展したものだが、現在は幅広く様々な分野においての指標となっている。

 

・エビデンスレベル(数値が小さいほど信頼性が高い)

1 システマティック・レビュー/RCTのメタアナリシス、患者数の多いRCT
2 1つ以上のランダム化比較試験
3 非ランダム化比較試験
4a 分析疫学的研究(コホート研究)
4b 分析疫学的研究(症例対照研究、横断研究)
5 記述研究(症例報告やケース・シリーズ)
6 データに基づかない専門委員会や専門家個人の意見、体験談(1例の報告)、マスコミ記事

(アメリカ臨床腫瘍学会ガイドラインをもとに作成)

 

実のところ「体験談」や「医者・学者・研究者の一意見」の信頼性は低い。

すなわち基本的に、「統計的手法によるデータに基づいていないものは、結局その専門家の考えでしかない。客観的でない」ということが了解されているのだ。

 

愚かなる人類が、より誠実を物事を見るために

なぜか。

なぜなら、人間には「認知バイアス」が存在するからだ。

例えばただの偶然に因果関係を見出す「確証バイアス」、身近で思い出しやすい情報から強引に結論を下す「可用性ヒューリスティック」、めったに起こらないがショッキングな出来事を頻発する事案だと錯覚する「代表制バイアス」、論理よりイデオロギーを優先させる「信念バイアス」、自分にとって都合の悪い情報を無視する「正常性バイアス」といったものが存在する。

 

実際のところ、認知バイアスは数え上げればきりがない。仏教においては108もの煩悩があり、それが「智慧を妨げる心の働き」になっているというが、同じく認知バイアスも多々存在することが知られており、「人間が正しく物事を理解することがいかに難しいか」ことを知らしめてくれる。

社会科学において実証科学を取り入れる泰斗となったエミール・デュルケムは、「事実をありのままに見る」ことの重要性を主張した。しかし人間がそのままで、物事を”ありのまま”に見ることなど土台無理な話だ。

つまるところ人間は愚かな存在であり、もしそれができるという人物がいるとすれば、その人物は詐欺師か神か、或いはドン・キホーテでしかない。

 

神ではない我らが取りうる消極的な方法論として、近似することで正確に捉えることができる「数理的手法」を用いている。もちろん、これとて近似であり真理ではない。

話を元に戻せば、数え上げればきりがないほどの”偏見”が人間には備わっているため、その専門家の一意見や考えは、正確性や厳密さにおいてどうしても「統計的手法」に劣る。

 

もちろん統計的手法に関しても、これはこれで異なった類のバイアス、具体的には「情報バイアス」「セレクションバイアス」「交絡バイアス」といったものが存在するから、適切な実験デザインと適切な統計的手法が求められるのは言うまでもない。インチキニセ科学、例えば「ワクチンを接種すると自閉症になる」とか「ガンは放置すれば治る」といった類の話は、非適切な統計的手法を用いてアピールすることが多い。

 

RCT(ランダム化比較試験)の欠点

もちろん人間による所業だから、「最も知的に誠実な手法」=RCT(ランダム化比較試験)といえど問題がないわけではない。例えば母集団の傾向が異なって観察されてしまう「シンプソンのパラドックス」や先程も出てきた「選択バイアス」の問題が生じることがある。

結局、RCTの信頼性が高いといってもそれは「相対的」な範囲にとどまる。だがそれでも、ほかのものよりは優れていることに疑う余地は無い。

 

 

 

コメント