既存のデータベースを使って研究することに関して

日本救急医学会(JAAM)と米国救急医学会(ACEP)の抄録締め切りが5月末なので、この一週間いくつもの研究の抄録作成の相談が一気に舞い込んで来ました。早めに作るようお願いしてはいますが、だいたいみんな締め切り直前になります。締め切り前に共著者に出して「これでいいですか?」というのは共著者の時間に対する配慮に欠けているので要注意です(その仕事を優先せざるを得ない)。僕もこの点はかなり注意されました。

研究を行うというと理想的には
1. 自分の臨床経験から臨床的疑問を発見し形にする
2. 研究デザインを考えて、どのようにしたら研究できるか検討し、研究計画書を書く
3. 上記をもとに必要なデータを集める
4. 解析して形にして発表する
5. 次の研究に繋げる、あるいは臨床応用する
というのが大まかな流れですが、実際にはなかなかそうはうまくいきません。特にデータを集めるステップで挫折することが多いと思います。

一方色々なデータベースがある現在では、それを用いて臨床的疑問が解決できるかどうか検討するのが現実的で、多くの人がこの方法で臨床研究論文を書いていると思います。救急だと蘇生領域のウツタインデータや外傷データバンク、DPCなどがメジャーでしょうか。

データベースを用いた研究に関して様々な研究テーマの相談を受けますが、共通する問題点はだいたい同じです。

1. 本当にclinically-relevantな臨床的疑問なのか
2. 新規性はあるのか
3. データベースの特徴を把握し、その強みを生かしているか
4. 妥当な解析方法なのか
5. 一般化できる内容なのか

まず往々にして自分の臨床的疑問とデータベースはフィットしませんし、自分の興味があることがみんなの興味をひくものであり、かつ臨床的に役立つかどうかは別の話です。そしてビッグデータを使うと僅かな差も有意になることがあり、それが本当に臨床的に意味のある差なのか考えないといけません。日本でもDPCを使った研究が盛んですが、米国・台湾などからはこの辺のadministrative dataを使った研究はもう下火になっているのではというぐらい一時期論文が出ていました。そのような中で、自分の研究アイデアは新規性があるのか、そして自分が使っているデータはどのような強みがあって、欠点をどう補うのか、はじっくり考える必要があります。

また統計学的な手法はこういったデータ解析には必要不可欠ですが、変数が多くnも多いため誤った解析をすると簡単に間違った方向に結果が出ます。変数選択がおかしい、重要な因子が欠けている、データの信頼性が乏しい変数を用いている、間違った因果推論を行っている、解析方法が不適切(例えばPS matchingで施設因子を考慮していない)など多くのところで引っかかります。

それから日本のデータは外国の雑誌には一般化の点ではねられる可能性が高いです(そういう目で見てくる査読者もたくさんいます)。臨床的な疑問は受け入れられますが、プラクティスに関する研究やhealthcare utilizationなどに関する研究はかなりその辺の影響を受けるように思います。

上記のようにデータベースありきの研究は研究で考えることが非常に多いです。ただ、ここに時間をかけて良いものを作らないと、論文化して発表するときに本当に困ります。自分はいいと思ったけど、どこの雑誌にも蹴られる…ということにつながります。そして自分一人で論文化するならいいですが、普通は共著の先生の時間という大きなリソースを費やしています。同時にデータを管理している人や研究責任者からすれば、質の低い論文を出すことは避けたいところです。

これらの理由から指導者に研究案を持っていくとボツになったり大幅な変更を要求されたりすることが多々あります。そこでお互い納得できるならいいですが、納得がいかないこともあると思います。残念ながらそこで納得がいかないと「言われたまま書いた」論文になってしまい、自分のモチベーションも下がる上に不思議なことに論文にもそれが出てきます。

研究案がなんどもボツになったり変更を余儀なくされることは辛いですが、後々のことを考えるとそこは十分に話し合う価値のあるところです。ここで蹴られて凹んでいては論文のリジェクトでもっと凹むことになります笑

偉そうに書きましたが、僕自身もあまり得意ではありません。この辺は本質をつかんでいる人は割とさっくり通っていい論文を書くので、いかに普段から臨床に真摯に向き合っているかが大事なのかなと思ったりします。。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です