国立感染症研究所(感染研)は、4月27日、「新型コロナウイルスSARS-CoV-2のゲノム分子疫学調査」と題した資料を公開した(本文・概要)。この資料のなかで感染研は、国内でサンプリングされた新型コロナウイルスの遺伝子データの解析を根拠として、国内で拡がっている新型コロナウイルスは、1月に中国からもたらされたものでも、2月にダイヤモンドプリンセス号からもたらされたものでもなく、3月に海外から帰国した人によってもたらされたものである、と結論づけている。「1月と2月のクラスター感染の封じ込めはうまく機能していたのであり、そこで過失はなかった」、「当時の水際対策やクラスター対策が原因でウイルスが広まったという言説は間違っている」と暗に主張しているようにみえる。恐らく感染研は人々にそう考えて欲しいのだろう。
そして実際に、テレビなどを見ていると、「厚労省の対応が間違っていたせいで、当時から水面下で市中感染が拡がっている」と強く主張してきたコメンテイターたちのトーンが明らかに下がっているように感じられる。影響力のあるコメンテイターであっても必ずしも充分な科学的リテラシーを持つわけではないので、これはある程度やむを得ない。ただこの状況はちょっとバランスが悪くなってるように思われるので、少し書いておこうと思う。
この資料は、好意的に見ても、信頼できるものではない。分析内容は正しいかもしれないし、正しくないかもしれない。少なくともその分析は非常に偏ったものである可能性が極めて高い。意地悪な見かたをすれば、感染研が過去の過失を隠蔽し、反対論を封じ込めることを狙って意図的に情報操作をした、いかがわしいレポートである可能性も否定できない(もしこれが本当なら相当なスキャンダルということになるはずだ)。
研究者であれば誰でも知っているように、サンプルを操作すれば思い通りの結論を導くことができる。従って、研究報告が信頼を得るためには、公正な方法でサンプルが選ばれていることを説明できなければならない。感染研の資料によると、どこからどのようにサンプルを選んだかについての説明が何ひとつなされていない。この報告が何かしらの影響力を持つのであれば、サンプルの選び方についてしっかり開示するよう要求されて然るべきだ。
都合のよいサンプルばかりが集められている可能性
現在のコンテキストのなかで感染研が発表した報告である以上、クラスター調査の延長で実施されたものである可能性がある。つまり感染研がこれまで実施してきたクラスター調査のなかであぶり出された感染確認者が主なサンプルになっているかもしれないということだ。それも全てのクラスターから満遍なくサンプルが抽出されているかすら分からない。例えば、海外から帰国した人から拡がった感染クラスターから集められたサンプルばかりを選べば、海外で拡がったウイルスの遺伝子型から派生したものばかりが集まることになるはずだ。たとえ今回の遺伝子解析のためのサンプル抽出の際にわざわざそんな操作をしなかったとしても、既にそうした経過で感染が拡がったクラスターばかりがあぶり出されていたのなら、概ね同じような偏りが生じることになる。
いっぽう、既に確認されている感染クラスターと濃厚接触のない市中感染者は、本人やかかりつけ医から要求があってもPCR検査を断られてきたことは周知の通りだ。彼らの多くは放置されてきた。PCR検査が受けられないのだから、感染者としては認定されず、調査対象の母集団からはそもそも除外されているということだ。1月から拡がっている新型コロナウイルスが攻撃性の低いタイプであったとすれば、その多くは重症化することなく市中に放置されている可能性がなおさら高い。従って、仮に国内で確認されている全ての「感染者」が母集団になっていたとしても、サンプルは非常に偏ったものであったとみるべきだ。また、重症化したごく一部の症例がPCR検査にかけられていたとしても、そうした症例が遺伝子解析の対象に含まれているかどうかは定かでない。
以上のことを考慮すると、1月に中国からもたらされた新型コロナウイルスと、2月にクルーズ船からもたらされた新型コロナウイルスが水面下で相当拡がっているという前提に立ったとしても、感染研が今回公表した資料のレポートは何ひとつ矛盾するものではない。ただ単に「そういう結果が導かれるサンプルが選ばれてるだけでしょ」という話にしかならない。通常、信頼できる学術論文では、調査方法そのものの限界に言及したうえで仮説を披露し(その限界が自明である場合はわざわざ書かないが)、最終的な評価は読者に委ねられる。利害関係者による報告であったりスポンサーが入っている場合にもその旨明記することが期待される。そのうえで多くの研究者が妥当性を感じたら、その仮説はコミュニティのなかで「正しいと考えてよいもの」として受け入れられる。今回公表された資料のように、サンプルの選び方や調査の限界に一切言及せず、一方的に自分たちに都合のよい仮説を提示して終わりという厚かましい報告は、普通の研究者にはなかなか書けないものではなかろうか。
正確に実態把握したいならどうするべきか
国内で拡がっている新型コロナウイルスの分布について、正確な実情把握にアプローチするための方法はさほど難しいものではない。全国で新たに確認される市中感染者のみに焦点を当て、彼らに感染したウイルスの遺伝子型を調べることだ。クラスター調査であぶり出されたサンプルは著しく偏ったものであるが、市中感染者は、その定義上どこでどう感染したか分からない人たちなので、国内で拡がっている感染の実態を反映する意味において、ランダムサンプリングと同程度の意義を持つ。
これは必ずしも「可能な限り正確な実情把握」といえるものではない。病院で市中感染が確認された人が母集団となるからだ。病院に来ない大多数の軽傷者や無症状者が除外されているところで重要なバイアスが発生している可能性がある。それでもクラスター調査であぶり出された感染者を中心とした分析よりも、はるかに正確な実態把握が可能となる。現時点ではこのくらいが現実的かもしれない。
本当に正確なところを調べたければ、全ての国内在住者のなかからランダムサンプリングで母集団を選び、既に感染が確認され、経過が分かっている人を除く全ての人にPCR検査を実施し(もちろんLAMP法や、精度にさえ問題がなければ簡易抗原検査キットでも構わない)、そこで陽性が確認された感染者から採取されたウイルスの遺伝子型を調べればいい。これで国内に現存する感染者の割合とそれがどこからどのようにもたらされたものであるかについての実情をかなり正確に把握できる。これは他の方法よりも幾らかコストがかかるが、決して非現実的な方法ではない。ただ何よりも非現実的なのは、厚労省が最初から公表を前提とした正確な実態把握調査を実施する意欲を持つことかもしれない。
もし感染研が先般発表した報告の信頼性について正しい評価を受けたければ、どこからどのようにサンプルを選んだのか、大体の属性(プライバシーを損ねない程度)を含むローデータを公表すればいい。そうすれば、全国の研究者はこの報告の信頼性を適正に評価することができる。それが公表できないのであれば、私たちは何か理由があるのだろうと考えざるを得ない。サンプル抽出が適正に行われていない可能性を考える人は少なくないはずだ。