「エビデンス1のある心理療法」というような言葉が流行しています。
「エビデンスがある」と言われると、効果が保証されているように聞こえます。「エビデンスがない」と言われると、アヤシイ感じに聞こえます。ですが、これらは「よくある誤解」です。
「エビデンスのない手法を撲滅しよう」なんて言うエビデンス警察もいるようです。
エビデンス・ベースト・アプローチのメリットとして「効果のない手法を淘汰できる」を挙げる人もいます。
これらもエビデンス・ベースト・アプローチのよくある誤解と呼ばれています。
「効果のエビデンスがない」と「効果がないというエビデンスがある」とは同じでしょうか?
「エビデンスがある」と「効果がある」は同じでしょうか?
「エビデンスがある手法とやらを試したけど、効果がなかった」というお悩み当事者の話は珍しくありません。
なぜそんなことが起きるのか考えてみましょう。
なぜこんな話をするのか?
なぜこの話題に拘るかというと、「○○(疾患や悩み)はエビデンスのある△△法でなおる」と言われて、効果を得なかった人たちが、「私の○○はなおらないんだ」と諦めたり、「私の〇〇は仮病みたいなものだ」と自身を責めてる人を見てきたからです。
また、エビデンスというのは、足元を照らしてくれる灯りのようなものであるべきですが、残念ながら臨床心理の世界では他学派を攻撃するための喧嘩の道具として使われてきました。ですから歪んだエビデンスも多かったですし、「エビデンスのないことを言うな/するな」みたいな非科学的な態度を流行らせたりもしました。
他人の喧嘩に巻き込まれないために、そろそろ「科学的と言われるとなんでも信じる」みたいなのも卒業した方がよいと思います。
*この文献では理解と発展をエビデンスの意義と関係づけています。
また、多元的アプローチでも、実証データのみから手法を選ぶことに異を唱えられています。
「多くの人に効果がある」と「私に効果がある」は異なる
「エビデンスのある心理療法」を受けて、効果がぜんぜんなかったという話は珍しくありません。
最初に言ってしまうと、エビデンスとはたいてい統計のことを指していて、それは個ではなく「母集団についての事実」を推定しているものです。
たとえば「60%の人に効果があった」などと言う場合、残り40%の人には効果がないわけです。全ての人に効果があると言っているわけではありません。
あなたが効果ない40%側の一人だった場合、あなたが次に探すべき療法は「70%、80%の人に効果がある療法」でしょうか?
あなたに必要なのは、「多くの人に効果がある療法」ではなくて、「自分に効果のある療法」です。
たとえ10%の人にしか効果がない方法でも、それが自分に効果があるのであれば、それがあなたが探しているものです。
私はこの世に多様な療法や支援が必要なのだと思います。
たとえば、家畜の牛を太らせる餌なら、一部の牛に効果がなくても、他の多くの牛が太るなら、その餌を全ての牛に与えれば、収穫量は増えるから良いでしょう。欲しいのは牛肉の総量なので、個体差に関心を払う必要はありません。ここで関心の対象は各牛ではなく牛の母集団です。
各クライアントに関心のある心理セラピーなどでは、エビデンスの低い手法を撲滅してはいけません。
むしろ、療法の多様性を守ることも専門家の役割であると思います。
※生物医学と心理支援では、このあたりの加減がいくらか違うかもしれません。
研究者、行政、治療者は「より多くの人に効果のある療法」を採用すると仕事の成果になります(母集団にも関心を持ちやすい)が、当事者が探すべきは「自分に効果のある療法」です。
治療者や行政にとって素晴らしい療法と、当事者にとって素晴らしい療法は同じではないのです。
エビデンスのあるものを候補の最初に挙げて検討するのは一理あると思います。その後は、だんだんと自分に必要なものが分かってくるのがよいと思います。
※ですので、エビデンスではなく第一選択のような言葉も使われます。
「自分にとって効果があるか」(外部妥当性)は自分(または自分にとてもよく似た人たち)で検証するしかありません。ですので、自分だけの克服日誌を書くこともお勧めしています。
確証ないから「エビデンス」
クライアントにとってエビデンスが
「エビデンスがある」と「あなたに効果がある」はイコールではありません。
「効果がある」と言いきれないから、「エビデンスがある」と言うのです。
携帯電話は「通話が出来るエビデンスがあります」とは言いません。通話が出来なければ交換してもらえるでしょう。エビデンスではなく、保証されているのです。
エビデンスがあるというのは、確証はないよという意味です。
「統計的に有意な結果が得られた」って何だろ
実際のエビデンス研究は改善率を示すだけでなく、統計的検定もされますが、それでも「確実に効果がある」とか「効果がない」ことが証明されることはありません。
心理学の「証明された」はせいぜい母集団について語っているのであって、自然科学ほどの再現性はありません。物理学や化学のデータバラツキは測定誤差が主ですが、心理学のデータバラツキは個人差(個性や個別性)です。
「効果があることが実証されている」という表現は、ほぼ政治的な/宣伝的な/思考停止な発言だろうと思います。
たいていは実施したグループと実施しなかった比較対照グループの結果(平均値)の差が「有意」(誤差では説明しにくい差がある)と言っているのですが、ちょっぴりの小さな効果であっても有意にはなります。追試したら覆されることもあります。
自然科学者なら安易に「実証された」とは言いません。
言うとすれば「個々のケースに効果が出る可能性が実証された」でしょう。
実は統計的に「検証された」は「多くの人にあてはまる」ですらないです。
すごく小さな効果であっても、効果に個人差が大きくても、サンプルデータを増やせば平均値の再現性は高くなるので有意(「検証された」)になります。
たとえば、51%の人に効果あり、49%の人に効果がない場合も、サンプルデータが非常に多ければ再現性が高いので「検証された」となります。「多くの人に効果あり」ということが検証されたわけではありません。
寛解率が従来手法より1%良くなっただけでもサンプルデータが非常に多ければ「検証された」になります。
たったそれだけの差ならコストの安い方から試してもよいですね。平均値においてたったそれだけの差なら、各ケースについては個人的な勘のほうが良い選択をするかもしれません。
*自然科学ではなく統計研究
「科学的」というと「再現率が100%に近い」という印象を与えますが、それは物理化学などの自然科学法則に限った場合です。その印象を流用して「科学的」という言葉が販促に使われます。
心理学の「科学的に証明された」というのは、ほとんどの場合「統計的に有意差が検定された」ことを指しています。
「5%の有意水準で検定された」というのは、「再現率が95%」という意味ではありません。
仮に再現率95%だったとしても自然科学や工学の再現性(99.99999%など)よりはかなり低いです。5%の確率で墜落する飛行機には誰も乗らないでしょう。
「科学的に証明された」心理学の再現性はかなり低い
1億年経ても変わらない物理化学法則と、個人要因や時代背景によって簡単に崩れる「研究により証明された」心理学の確かさは雲泥の差です。
心理学で「実証された」「エビデンスがある」「科学的」という話は、自然科学の「化学反応の法則」とか「重力の法則」ほどの再現性はありません。
自然科学の法則は再現性が100%。工学の再現性は99%以上がざらですが、心理療法の再現性はよくて70%くらいだったりします。
工学では5つの部品が直列しても99% × 99% × 99% × 99% × 99% = 95%くらい成功します。さらに、工学では複数のバックアップを並列することができます。それが「科学技術」という言葉の信頼を作っています。
心理療法の場合、「見立て」と「手法」の2項目が直列するだけで、70% × 70% = 49%というように、当てはまらない可能性がどんどん増えてゆきます。
※数字は例です。
ちなみに、心理療法の「効果があることが証明された」は、再現率ではなくて、「やった場合」と「やらなかった(または、従来の方法をやった)場合」に有意差があるとの証明であることが多いです。「意味なくはないよ」くらいの意味です。それも母集団的に見てです。
自然科学のイメージがあるので、「科学的」と言われると「再現性100%に近い」との印象を与えますが、そうではありません。
理学部出身の私からすると、心理の世界で「科学的に証明された」という言葉を聞くと、似非科学っぽさを感じることがあります。理系出身のカウンセラーの先人たちからの似た意見を聞きますが、今後は臨床心理学部で「これが科学だ」と教えられた人しか受験できない資格制度なども導入されたので、どんどん閉鎖的になってゆくでしょう。
私が若いときに仕事をしたIT分野にいたっては再現性はほぼ100%くらいあります。それでもエラーが起きることを前提にエラーのための処理コードはプログラムの半分くらいを占めます。そして、再現性があるからといって「科学的に証明された」とか「科学的に否定された」などとは言いません。それを言いたくなるあたりも、似非科学っぽさかと思います。比較的健全な臨床心理の文章では「研究によって支持された」などのように書かれています。
「科学的」といってもメカニズムは主観に満ちた推測でしかない
とくに「科学的なエビデンスがある」と言われるときは注意が必要です。自然科学は再現性実験だけでなく、要素分解的なメカニズムが具体的に解明されていることが多いです。また再現性についても億に一つも例外がなきものを法則と呼んでいます。「科学的」という言葉はそのような確かさを連想させます。しかし、心理学のエビデンスはそのようなものではありません。そこを錯覚させることを狙って「科学」という言葉を使うのは似非科学と同じです。
メカニズム(機序)の解明を捨てることによって科学になろうとしてきた心理学、そこでいうエビデンスはたいてい統計的に確認された経験則に過ぎません。
それは顕微鏡、解剖、天体望遠鏡などによって確かめた事実とはかなり意味が違います。
「電子レンジで食品が温まる」というのは、実験検証で食品が温まっただけではなく、そのメカニズムまで解明されています。
「電子レンジで食品が温まる」のは、億に一つも例外なくH2Oの分子には電荷の偏りがあり、電磁波によって揺さぶることができるため、水分を含む食品は電子レンジで温めることができるわけです。電磁場が電荷を動かすこというようなメカニズムの要素も実験実証されています。「骨折」はレントゲン写真で確認できますし、「(ある種の)貧血」は鉄分が不足していることが血液検査で判ります。
心理の世界の「科学的」はメカニズムが解明されていないものが多いです。理論モデルはあっても構成要素に分解できないので、経験則を大規模に調査したに過ぎません。そういうのを「経験科学」と言うそうです。
お薬については、物理化学的なメカニズム(機序)が(最近は)解明されていて、さらに統計的な試験していれば、わりと科学的だと思います。ただ、機序が解明されていない薬もあるそうです。また、たとえ機序が解明されているのは脳への作用であって、心への作用ではないでしょう。
たとえば認知の歪みを修正する認知行動療法はウツ病に効果があると統計研究されています(エビデンスがある)が、その手順の中には「自分の感情を振返る」部分が含まれています。じつは「自分の感情を振返る」ことがウツ病に効果があるのであって、認知の歪みの修正は効果とあまり関係ないかもしれません。
※これはKojunの持論でしたが、後に「自分の感情を振返る」メンタライゼーションが大流行りになりました。
療法の「科学に基づく」という売り文句は、たいていメカニズムが解明されたという意味ではなくて、統計的に有意差を確認したという意味です。
統計ではマイノリティが排除される
統計的な研究は何がマジョリティかを示しているにすぎないこともあるでしょう。
自然科学の統計処理で消されているバラツキは測定誤差ですが、心理学の統計処理で消されているバラツキは個性です。
マクロな目的の場合は、統計的に扱うことに意味があるでしょう。つまり、統計が示しているのは一人ひとりではなく母集団の性質です。たとえば、コロナ発症の人数を減らすことで医療負担を防ぐことが目的なら「少数ではなく多くの人に効果のあるワクチン」を選択することに意味があります。生活保護者の数が経済を圧迫しないためにトラウマの治療をするのであれば、「多くの人に効果のある治療法」に予算を投入することに意味があるでしょう。地球環境の保護などもそうです。目的が個人の救済というよりも社会の負担、合計としての成果だからです。
しかし、一人ひとりの個々の支援というミクロな目的の場合、統計に従って判断することは、「帰納して一般化した知識を、演繹で個々に戻す」ということになります。マイノリティを無視するマジョリティ指向のアプローチとなります。「多くの人がこうなんだから、あなたもこうでしょう」というように個別性をつぶす作業になります。
「エビデンスのある心理療法」というのは、マクロな目的の心理療法ですよという意味になります。マイノリティを見捨てて効率よく感謝されるにはよいでしょう。
臨床家の先人達も個別性こそが心理支援の本質というようにおっしゃっています。
エビデンシャリズムは白黒思考、べき思考、完璧主義などの認知の歪みが含まれるように思います。
物理化学の統計誤差は無視するべきノイズによるものですが、心理に関する統計的誤差は注目すべき個性であり、お悩みの本質です。
※「信頼区間」という言葉も使われますが、「95%信頼区間」は95%の人がこの範囲に入るという意味ではありません。
※「標準偏差で標準化された平均差」や「治療必要数」などは個人差のバラツキの程度を考慮していると言えるかもしれません。
*「エビデンスがない」≠「効果がない」
「エビデンスがない」というのは「効果が証明されていない」という意味ですが「効果がないことが証明されている」という意味ではありません。
そもそも「効果がない」ということを証明するのは科学的ではありません。
科学者たちの講演をいくつか観てください。科学的に証明されていない物事を否定している科学者はいないでしょう。本物の科学者は科学的証拠がないものを否定するために科学を使う人たちではありません。
一時期「精神分析はエビデンスがない(だからダメだ)」ということを言う専門家がいたようですが、その時点でエビデンスがなかったからといって「効果がない/効果がある人が少ない」と証明されたわけではありません。「〇〇療法はエビデンスがないことが研究で証明された」という不思議なコメントをしている専門家もいます。
ある手法が「効果がないと証明された」とテレビで報道されていたそうです。それは愛着不安定(愛着障害)のためのロールプレイなのですが、男性セラピストが母親役をしていたそうです。その手法はKojunもやったことありますが、母親役が女性である必要があり、しかも子供を産んだことがあり、愛着安定している人でなきと効果は出にくいと言われています。実際にそのような手法で救われた人たちはたくさんいます。つまり人選を間違えているわけです。「効果がない」というのは「まだ工夫が足りない」「検証者が習熟していなかった」という可能性が残ります。
薬物療法に関しては「投与しても効果がなかった」という研究結果は意味があるでしょう。薬物療法はそもそも「量産」してマジョリティを救うという戦略だからです。薬物という物質は、実験段階でも完璧に再現され、配布段階で現場で進化することもないからです。(他の薬や療法との組み合わせで効果がでる可能性はあるかもしれませんが)
*「エビデンスがある」というのは「検証しやすい」という意味でもある
エビデンスがあるというのは、「検証しやすい」という意味でもあるかと思います。エビデンスがないというのは、効果がないというよりも、検証しにくいという意味であったりします。
そして、検証しやすさは研究者や開発者にとっては価値がありますが、悩みを克服しようとする当事者にとってはどれほどの価値があるでしょうか?
「人」に依存するものは検証しにくい
また、ゲシュタルト療法、精神分析(精神力動)、ファミリーコンステレーションのように、「手順」よりも支援者の「在り方」や「場づくり」や「相性」に大きく依存するものもあります。それらは実験から客観データをとるエビデンス検証が難しでしょう。
たとえば、ドラマセラピー的な手法の一種では、虐め被害トラウマの方のイメージワークで、セラピストが被害者を守るように「やめろ!」と叫ぶことでトラウマ解消が起きることがあります。実際に起きます。このような手法の場合、セラピストが実際の生活の中で自身の危険をかえりみず痴漢や暴力者を怒鳴りつけて追い払った経験がある人物である場合と、講習会で習った通りその台詞を読み上げるのとでは効果はかなり違います。
つまり「あり方」に大きく依存する手法を「エビデンスがない」という理由で撲滅してしまうと、「あり方」や「場をつくり」の優れたセラピストを撲滅してしまう危険があります。私の知る限りでも「あり方」や「場をつくり」に優れたセラピストが辞めていったケースはあります。これは学術界の教育者の商売にとっては都合がよいかもしれません。
また、ひきこもりの支援では、支援者が会うことすら拒絶されるため、元ひきこもりの人たちが支援者として活躍しているようです。そこには一定の技術や手法があるのですが、これは「誰がやるかが効果に大きく影響している」ことを示唆しますが、「専門知識」よりも「誰がやるか」によって効果が変わることの検証はあまり行われません。
このようにセラピストの実体験、生き様、人柄に成果が大きく依存するような手法や支援は、エビデンスを検証することが難しいです。
だとすると、エビデンス重視の手法というのは、「誰がやっても同じ成果がでる」ということといえるかもしれません。
たとえば、演劇指導を通して効果的に人の心に変容を起すセッショニストもいるかもしれません。というか、いるそうです。ですが、それできるの人は稀です。稀であれば、統計的エビデンスは出ません。行政は心理支援者の量産を目指しているので、行政が「誰がやっても同じ成果がでる」手法を重視するのはわかります。ですが、どの手法も最初は誰かの神業だったのではないでしょうか。悩みの当事者としては、「自分にあった」手法か人に出会えるまで、いろいろ探せる多様性がほしいです。
自分が必要としているのは、技法(手法)か、人か、ということも支援者探しのヒントになりそうです。
「手順」は評価されやすく、「人間への理解」は評価されにくい
また、手法には、「手順」ではなく「考え方」を示すものもあります。
その視点をもって対話することで成果が出ます。ですが、手順が標準化されないので、検証されずエビデンスのある方法とは認められません。
つまり、「考え方・枠組み・理論」⇒「人間への理解」⇒「臨機応変な対応」というようになっているので、「なにをするか」という手順に相当する部分はケースバイケースとなります。
これは再現性が低い(マニュアル化しにくい)ということであって、有用ではないという意味ではありません。
一方で、筋肉の弛緩や眼球運動など身体にアクセスする手法は「手順」中心なのでエビデンス検証がしやすいです。認知行動療法も「手順」が毎回同じなのでエビデンス検証がしやすいです。
上述の「人に依存する手法」というのは、「関係性」中心なのでエビデンス検証がしにくいという言い方もできるでしょう。
*クライアントのモチベーションに依存する手法は統計的に評価されにくい
たとえば、「飲めば痩せるサプリメント」は、100人の痩せたい人に飲んでもらって、何%の人が痩せたかを調べれば効果が評価できるでしょう。
では、食事制限や運動はどうでしょうか?
100人の人が挑戦。そのうち続かな人が70%、やりきった人は30%。やりきった人のうち90%に効果があった。
この場合、その効果は 90% でしょうか、それとも 30% × 90% = 27% でしょうか?
それは、多くの人にとっては上手くいかない方法(効果がない)ですが、一部のモチベーションの高い人(モデル業とか、合併症が差し迫っている人とか)にとっては90%の効果でしょう。
葛藤を伴う心理療法の場合は、プロセスの途中で心理的抵抗があります。軽く悩んでいる人にとっては効果が得にくい手法ですが、一部のモチベーションが高い人(とても苦しい、このまま人生を終えたくない、大切な人をこれ以上傷つけたくない、などなど)にとっては、とても挑戦しがいのある手法である場合があります。
そのようなハードル高い心理療法などは、エビデンス研究がとても難しくなるでしょう。
となると、安易なエビデンシャリズムによる手法の淘汰をすることは、統計上の成果(件数としての成果)のために、本当に苦しんでいる人や大きな試練を背負っている人のための支援をつぶしてゆくことになります。
エビデンスが低いセラピーを撲滅することよりも、誰に向いているのかを分かり易くすることが有益なのではないでしょうか。それを分かり易くするのは統計エビデンスとは限らないです。たった一件の事例でも、「あ、これだ」と試す価値があることが分かることがあります。
他にも、「エビデンスがある」≒「誰かが儲かる/得する」やという傾向が生じる可能性もあります。また、「専門教育を受けた専門家と、短期間の講習で学んだ者のカウンセリングの効果は差がない」というようなことを専門家は証明したがらないかもしれません。
最近は、研究者がデータを見てから都合よいように分析するバイアスを防ぐために、データを見る前に分析法や判断基準を公表しておくということが行われるようになってきているそうです。それだけ利害や思想のバイアスは手ごわいということかと思います。
*エビデンスの安定性
エビデンスのなかった/エビデンスの低かった手法が、後にデータが増えて「エビデンスあり」に変わることはよくあるようです。
データが少ないとエビデンスが出ないからです。(効果がないのではなくて、データがない)
逆にエビデンスがあったものが後に覆ることは少ないのでしょうか? 半数以上が追試で再現されなかったという論文も参考文献に挙げておきます。
過去の研究成果をもれなく収集して分析する系統的レビューでエビデンスありとされているものは、覆りにくいとされています。
単一の研究の場合は、他項目に書いたようなバイアスのため、後に覆ることはあるようです。
バイアスに対策(研究方法)も進化しているので、古い研究は覆りやすい傾向があるかもです。
系統的レビューでは各研究のバイアス対策も吟味してまとめているので、新しい系統的レビューでの「エビデンスあり」は覆りにくそうです。
参考リンク
- EBMについて~医療従事者のために~「EBMに対する誤解」 | The SPELL
- 「医療の多様性と“価値に基づく医療”」尾藤 誠司(日本内科学会雑誌第103巻第11号
- 『精神科診断に代わるアプローチ PTMF』メアリー・ボイル/ルーシー・ジョンストン
- 100分de名著 中井久夫スペシャル (3)多層的な文化が「病」を包む | NHKオンデマンド
- #44 始動!「哲学に基づく教育構想」プロジェクト 苫野 一徳 | Voicy
統計について
- Estimating the reproducibility of psychological science. Science349, aac4716(2015)
- いまさら聞けない?疫学の基礎ーその13「因果関係の判定とエビデンスピラミッド」 | real-world-evidence.org
- 実臨床に役立てるメタアナリシスの読み方まとめ | 脳内ライブラリアン
- 『科学としての心理学』ゾルタン・ディエネス
- 『疑似科学と科学の哲学』伊勢田哲治
- 『統計学が最強の学問である』西内啓
- 『ダメな統計学 悲惨なほど完全なる手引書』アレックス・ラインハート
- ダメな統計学を防ぐための書籍11冊|Colorless Green Ideas