2009年9月4日金曜日

あの試験は、今・・・PROactive試験

あの人は今、ではなく、あの試験の評価はその後どうなったか、チェックしてみましょう。


PROactive試験は、心筋梗塞や脳梗塞、下肢の閉塞性動脈疾患などの大血管性疾患を持つ二型糖尿病患者5238人を組入れた、pioglitazoneの大規模試験です。05年にEASDで結果が発表され、06年にはLancetに論文が掲載されました。主評価項目は惜しくも有意差が出ませんでしたが、「主要な二次的評価項目」の全死亡・非致死的心筋梗塞・脳卒中の複合評価項目は、ハザードレシオが0.84、95%信頼区間0.72-0.98、p値が0.027と大変良い結果が出ました。心筋梗塞リスク削減効果が示されたのは、血糖降下剤では史上初めてです。


良さそうに見えたのですが、世間の風は冷たく、Lancetには治験のデザインなどに疑問を呈する書簡が寄せられました。また、欧米の医薬品審査機関はpioglitazoneの効能追加を認めませんでした。何故でしょうか?


FDAは通常、承認しなかった理由を明らかにしません。承認申請の内容に関する守秘義務があることや、単に証拠不十分というだけで効くとも効かないとも言えないケースがあることなどが原因なのでしょうが、新薬ならともかく、広く使われている薬の効能や新用途に関する情報が公開されないのは困ります。FDAの審査官、Karen Mahoneyは、08年のADAで、PROactive試験の論文は11頁だがFDAが審査した書類はデータセットを除いても6万頁あったと言っていました。莫大な量の情報が埋もれているのです。


その後、FDAが二型糖尿病用薬の安全性に関する諮問委員会を招集した際に、代表的な心血管アウトカム試験の一つであるPROactive試験についても言及されました。以下、幾つかのテーマについて審査機関の証言・見解を見てみましょう。


PROactive試験の謎の第一は、「主要な二次的評価項目」がポストホック分析なのではないか、という疑惑です。第二は、主評価項目が失敗した場合の二次的評価項目の意義です。Lancet誌の書簡に答えて、治験論文の著者は、この評価項目はprespecifiedであり盲検解除前にFDAに報告した、と書いています。また、二次的評価項目の個々のイベントは主評価項目のイベントと共通であり、主評価項目でもリスクを削減するトレンドがあったことを強調しました。





PROactive study - Authors' reply



J. Dormandy

The Lancet, Volume 367, Issue 9504



FDAのKaren Mahoneyが作成した諮問委員会用ブリーフィング資料には、このように記されています。


PROactive試験は05年1月31日に完了した。05年5月12日に武田薬品が、「主要な二次的評価項目」として新しい評価項目の解析計画を提出した。武田は非盲検化したのは05年5月23日と言っている。追加された時期や主評価項目が失敗したことを踏まえれば、この評価項目は前向きで決定された(prospectively defined)評価項目というよりは、探索的ポスト・ホック分析に該当するように見える。

(中略)

ポスト・ホックで複合評価項目の個々の項目から抜き出すすることは潜在的にバイアスを伴うので、この評価項目はベスト・ケース・シナリオの選択である懸念を生む。

(07年7月30日に開催された内分泌代謝学薬諮問委員会のFDAブリーフィング資料より pdfファイルの通算199頁目)


大規模な試験では複数の解析を行なったり数多くのサブスタディを行なうのが通例で、二型糖尿病のランドマーク的な試験であるUKPDSは、異なった解析の論文が何十本も刊行されています。問題は、評価項目が増えれば増えるほど、偶然に有意差が出てしまうリスクが高まることです。


主評価項目が複数存在したり、中間解析が実施される場合は、多重性補正を行なって治験成功を認定するハードルを高めるのが厳格な方法です(有意水準をp<0.048や<0.025に設定するなど)。二次的評価項目の場合はこの方法は無理ですので、治験結果が出た後でシーケンシャル法を当てはめるしかありません。主評価項目の解析が失敗したら、二次的評価項目は仮説探索的解析に過ぎないと見なすのです。FDAも、様々な機会に、主評価項目の解析でアルファを使い切っているので、二次的評価項目が成功しても参考程度にしかならないという考え方を示しています。


第三の謎は、有意ではなかったものの数値上は心筋梗塞などが少なかったのは何故か?スタチンと比べて、血糖治療薬の長期大規模試験は数が少ないのですが、それにしても、心筋梗塞のような大血管疾患で有意差が出たのはActosが初めてです。UKPDSのmetformin試験はあと一歩でしたが、あんなに長期間治療して有意差が出なかったのですから、効果自体があと一歩なのでしょう。薬を問わずにHbA1cを集中的に治療する試験も複数実施されましたが、何れも釈然としない結果になり、突然死などが増加した試験もありました。


07年の諮問委員会のブリーフィング資料には、以下の記述があります。


(PROactive試験に参加した)臨床研究者は国際糖尿病連合の欧州地域1999年ガイドラインに則って血糖値や心血管リスク因子を治療するよう指示されていたが、pioglitazone群のHbA1cや血漿トリグリセライド、HDLコレステロール、血圧は偽薬群よりも良好に管理されていた。このため、PROactive試験の好ましい結果が全てpioglitazoneの寄与なのか、心血管リスク因子の管理が良かったことも寄与したのか、区別するのは困難という主張もある。

(08年7月1-2日 内分泌代謝学薬諮問委員会と医薬品安全性リスク管理諮問委員会の共同会議 FDAブリーフィング資料
pdfファイル全体の5-6頁目)


この試験のHbA1cの群間差は0.5%でしたが、病歴が長く既に色々な薬を服用している患者にpioglitzoneを追加投与した時の効果もこんなものでしょう。このため、私は、差が出たのは予定通りなのだろうと誤解していました。UKPDSやADVANCE、ACCORD試験などのイメージです。しかし、実際には、偶然だったのです。こうなると、PROBE法の試験は困ります。心血管イベントの判定は第三者が盲検方式で行なうのですが、医師は患者が何を服用しているのか知っているので、治験を成功させるために偽薬群の血糖管理に手加減したのではないか、と痛くもない腹を探られてしまいます。
勿論、私自身が疑っているわけではありません。長期試験で血糖値管理目標が達成されないことは珍しくないからです。ガイドラインも患者の特性に応じて匙加減するよう注意しています。


この謎に関連して問題提起したいのは、PROactive試験だけではなく大規模アウトカム試験全体に、同時服用薬に関する情報が十分ではないことです。医療が向上した結果、一つの薬を追加投与することによる限界的な治療効果は小さくなっています。その分、検出力が高く設定されているので、ノイズを拾ってしまうリスクが高まっているはずです。中でも曲者はスタチンで、心筋梗塞を削減する大きな効果を持っていることや、製品や用量によって効果が異なることを考えれば、期中に患者が何をどれくらい服用したのか良く調べる必要があります。PROactive治験論文はベースライン時点と期中の変化に言及しているので情報が充実しているほうですが、しかし、銘柄や用量までは言及していません。大規模な試験は偏りが生じにくいことが長所ですが、現実には、意外な偏りが出た事例は少なくありません。pioglitazoneはLDL-C値が若干上昇するので、スタチンを増量した患者が多かったかもしれません。ここでも、二重盲検でないばかりに余計な心配をしなければなりません。


pioglitazoneは多彩な作用を持っているので、HDL-Cや血圧の群間差がpioglitazoneの寄与である可能性も十分ありますが、結論を出すにはデータ不足です。


第4の謎は、心筋梗塞削減効果の兆しと心不全リスクの兆しをどのように天秤に掛けたら良いのか?
審査機関がPROactive試験の効能を承認しなかった最大の理由は、心不全リスクも確認されたことであるようです。EASDでもLancetでも論評者が指摘しましたが、心筋梗塞を減らすことが出来ても心不全と交換では嬉しさも半減です。
07年7月のブリーフィング資料にも記されています。


薬効評価項目に深刻な心不全を追加すると、pioglitazone群と偽薬群の全般的な心血管リスクの差はごくわずか(negligible)になる。

代謝内分泌学的製品部門はpioglitazoneの心血管ベネフィットを武田が販売促進に用いることを承認できるほど明確に薬効が示されたとは認定していないが、心不全を除けば大血管リスクに関して長期的に中立であったことは重要な情報と感じた。

武田はポスト・ホック二次的評価項目も含めて薬効に関する情報の追加を申請していたが、当部門は同意しなかった。安全性に関するデータは重要なので、主評価項目の個々のイベントに関する情報は有害事象セクションに、心不全に関する情報は警告セクションに、記載された。

次はEMEAです。武田はEMEAの販売承認を得る時に大規模な大血管アウトカム試験の実施をコミットしたようです。PROactive試験がその回答なのでしょう。


PROactive試験は事前に設定された主評価項目に関して失敗した。(中略)心不全も増加した。これらは新たな安全性問題ではないが、体重増加、浮腫、心不全に関する安全性懸念が確認された。

PROactive試験はpioglitazoneの投与が心血管リスクを高めないことを示唆したが、明確なベネフィットを示すことには失敗し、安全性懸念は解消されなかった。


��Actos: Procedural steps taken and scientific information after the authorisation
Changes made after 01/10/2003(pdfファイル)



謎は沢山ありますが、PROacitive試験が思ったほど評価されなかった最大の理由は主評価項目の解析が失敗したことと心不全が多かったことで、PROBE法を採用したために十分な抗弁ができなかったのでしょう。


最後に、PROactive試験の主評価項目で有意差が出なかった犯人は、脚部の血管再建術や大きな切除が偽薬群より大きかったことのように見えます。このようなリスクを減らすことのできる薬など効いたことがないので、学会発表当時は気にしませんでしたが、pioglitazoneの浮腫リスクが原因などということはありませんよね。この点に関しては誰も何も言っていないので、5年経っても謎のままです。



0 件のコメント:

コメントを投稿

Valsartanは名古屋では引き分けに

次は、同じくACCのLate-breakerで発表されたNagoya Heart Study(NHS)です。試験の内容や結果は納得できるものですが、分からないのは、Kyoto Heart StudyやJikei Heart Studyとの関係です。この二本の試験ではvalsart...