PAGE TOP

Quantitative Imaging Biomarker

FDG-PET

— Japan-QIBAの活動の一環として、

 QIBA Profile. FDG-PET/CT as an Imaging Biomarker Measuring Response to Cancer Therapy Version 1.13, Technically Confirmed Version, November 18, 2016 (Copyright © 2016: RSNA)http://qibawiki.rsna.org/images/1/1f/QIBA_FDG-PET_Profile_v113.pdfの一部を翻訳したものです。

 QIBA Profile(プロファイル)とは、QIBAメンバーによる共同作業の結果を整理・記録するために使用される文書のことを指します。プロファイルには、それに従うことによってどのような定量的結果が達成されるかをユーザーに伝える、1つまたは複数のパフォーマンス・クレームが含まれています。本稿では、7ページ前半のClaim: Measure Change in SUVまでを翻訳しています。

1.要旨

 このQIBAプロファイルは、腫瘍領域において、スキャナを問わず定量的FDG-PETに比較可能性と一貫性を提供するための仕様と要件を文書化しています。 これは、臨床試験と個々の患者管理の双方に適用することができます。 この文書は、データを情報、知識へと変換するパイプラインのステップとして、データ取得、再構成、後処理、解析、解釈を組織化しています。

 QIBA FDG-PETバイオマーカー委員会の努力により作成されたこの文書は、FDG-PET UPICTプロトコールと内容を共有しており、FDG-PETデータの取得および解析に使用される装置に焦点を当てた追加資料も共有しています。

図1 プロファイル構成要素の説明

 プロファイルパート3は、主に、臨床試験におけるFDG-PETイメージングのためのFDG-PET UPICTプロトコールに由来しています。UPICTプロトコールでは、階層化されたレベルのプロトコール・コンプライアンスから成る慎重に作成された階層があります。これは、同じ疾患/介入の組み合わせに対しても、異ったレベルの厳しさを用いて臨床試験を行う正当な理由があることの認識を反映しています。例えば、小規模の初期段階の試験で高レベルの画像測定精度が必要とされる場合がありますが、一方で、同じ疾患、同じ薬剤の大規模な後期試験で、精度はあまり厳しくなくても許容される場合もあります。

 UPICTプロトコールの3段階の準拠レベルは、次のように定義されています。
ACCEPTABLE:この仕様を満たさないと、プロトコールの意図された使用に対して許容されない可能性のあるデータが生じます。
TARGET:この仕様は合理的な努力と装置があれば達成可能であると考えられ、ACCEPTABLE仕様よりも良い結果をもたらすと期待されます。
IDEAL:この仕様の達成には特別な努力や装置を必要とするかも知れませんが、TARGET仕様よりも良い結果をもたらすと期待されます。

 ACCEPTABLE値は、UPICTプロトコールの各パラメータに常に与えられています。より良い結果を期待する理由がない場合には(例えば、より高い画質、より高い均一性、低い放射線量等に関して)、TARGETおよびIDEAL値は与えられません。
このプロファイルは、UPICTプロトコールのACCEPTABLE部分を利用しています。このプロファイルの後の改訂版では、TARGET、次いでIDEALカテゴリーを利用することが期待されています。 TARGETとIDEALカテゴリーは、領域における進歩と進化を続ける最先端FDG PET/CTイメージングを反映するように意図されています。
これらの概念を以下の図2に示します。

図2 UPICTプロトコールとプロファイルとの関係

臨床試験における使用のまとめ

 QIBA FDG-PET/CTプロファイルは、腫瘍治療に関する単施設および多施設臨床試験に使用される全身FDG-PET/CTスキャンのための、行動のパフォーマンス・レベルと品質管理の仕様を規定しています。臨床試験に重点が置かれていますが、プロセスは臨床診療にも応用されることを意図しています。精度に関する特定のクレームは、以下の「クレーム」に詳しく記載されています。

 このプロファイルに対する適合を達成するために満たさなければならない仕様は、FDG-PET UPICTプロトコールで指定されたACCEPTABLEレベルに対応しています。QIBAプロファイル仕様の目的は、調査中の介入以外の要因による定量的スキャンデータの被験者内・間、プラットフォーム内・間、施設間の変動を最小限にすることです。臨床試験においてこのQIBAプロファイルの技術仕様に従って行われたFDG-PET/CTの研究は、単一時点の評価(例えば、診断、病期分類、適格性評価、予測および/または予後のバイオマーカーの調査)のための定性的および/または定量的データを提供することができます。また/あるいは、複数時点での比較評価(例えば、治療効果評価、治療有効性に対する予測および/または予後のバイオマーカーの調査)においても同様です。

 このプロファイルの作成の動機は、典型的なPET/CTスキャナ測定システム(すべての周辺装置を含む)は数日または数週間にわたって安定している可能性はありますが、臨床試験を完了するのに要する時間にわたってこの安定性が期待できないことによります。さらに、スキャナ間および/または異なる画像施設における同じタイプのスキャナの動作間に差異があることも広く知られています。

 この文書の対象読者は次のとおりです。

  • この目的のための製品を作るソフトウェアやデバイスのメーカーの技術スタッフ
  • 画像エンドポイントで試験を計画しているバイオ医薬品企業、腫瘍専門医、および臨床試験研究者
  • 臨床研究の専門家
  • 新しいPET / CT装置の調達に際して仕様を検討している放射線科医、核医学科医、放射線技術者、医用物理士、医療機関の管理者。
  • PET / CT撮像プロトコールを設計している放射線科医、核医学科医、放射線技術者、医用物理士
  • PET / CT画像から定量的測定を行う放射線科医、核医学科医、他科の医師
  • 定量的画像測定に基づいて決定を下す規制当局、核医学科医、腫瘍専門医など

 この文書で「要件」と記載されている仕様は、クレームを達成するための要件にすぎず、「標準治療に関する要件」ではないことに注意してください。 つまり、このプロファイルの目標を達成することは、患者を適切にケアすることの次に位置するものです。

 クレームを達成するために必要でチェックリストとしてフォーマットされた仕様の要約は、付録Iとして与えられています。対応する仕様は、付録Cに記載されている規範の表に太字で示されています。このチェックリストは、QIBA FDG PET/CTプロファイルに準拠した定量的イメージングが行われているPETイメージングサイトの認証に使用できます。

2.臨床の状況とクレーム

 FDGはグルコース類似体です。腫瘍領域におけるその使用の理論的根拠は、典型的には正常組織と比較して腫瘍では解糖系が亢進していることに基づいています。FDGは、腫瘍細胞において通常アップレギュレートされている、グルコース輸送タンパク質を介して腫瘍細胞内に輸送されます。内在化されたFDGがFDG-6-リン酸にリン酸化されると、解糖系に沿ってさらに進まず、代謝的にトラップされた状態が顕著となります。FDG取り込みは腫瘍細胞に特異的ではなく、ブドウ糖代謝の上昇した正常組織や他のプロセス(例えば、感染症や炎症)でも、FDGの取り込みまたは蓄積は増加します。

臨床試験での応用とエンドポイント

 FDG-PET/CTイメージングは、様々な臨床的適応目的や研究課題に利用できます。これらは、FDG-PET/CT UPICTプロトコール(UPICTセクション1.1)でより完全に対処されています。このQIBAプロファイルは、治療効果を評価するためのバイオマーカーとして、PET/CTを用いて腫瘍におけるFDG取り込みを測定するための要件を具体的に取り上げています。

 患者層別化または治療効果評価のための臨床研究に有用なバイオマーカーは、FDG PET/CTによって定量化された治療効果の範囲および程度に基づいて行われる、治療の初期選択、その後の治療レジメンの個別化といった同様の目的の臨床診療においても有用です。

 このプロファイルに記載された技術仕様は、腫瘍におけるFDG取り込みの定量化および被験者内の経時的な測定に適しています。しかし、プロファイル詳細の多くは、他の用途における定量的FDG-PET/CTイメージングにも概して適用できます。

 FDG-PETスキャンはほとんどの悪性腫瘍の検出に感受性が高く、特異性も高いです [Fletcher 2008]。メディケアおよびメディケイドサービスのセンターによる米国における腫瘍イメージングの適用範囲は、National Coverage Determination (NCD) for Positron Emission Tomography (PET) Scans (220.6) に明示されています。

 FDG-PETスキャンは、癌のグルコース代謝活性を信頼性高く反映し、この代謝活性は、何度も高い再現性で測定することができます。治療中の腫瘍における18F-FDG蓄積の経時的変化は、標準的な解剖学的な測定の変化よりも早期に臨床転帰を予測することができます [Weber 2009]。従って、腫瘍FDG取り込みによって決定される腫瘍の代謝的な治療効果または進行は、十分に管理された第I, IIA相試験における薬力学的エンドポイント、また、第II, III相試験における有効性エンドポイントの役割を果たします。先の第II試験でFDG-PETにおける治療効果と予後との間に統計学的に有意な関係が示された腫瘍/薬剤の設定においては、腫瘍FDG活性の変化が登録試験における規制薬物承認の主要な有効性エンドポイントとして機能する可能性があります。

クレーム:SUV変化の測定 

 すべての関連スタッフおよび機器によってこのプロファイルに準拠すれば、以下のクレームが達成されます。
クレーム1:SUVmaxとして反映される腫瘍における解糖活性は、FDG-PET/CTから、10-12%の被験者内変動係数で測定可能です。
クレーム2:SUVmax値の39%もしくはそれ以上の増加、または28%もしくはそれ以上の減少は、真の変化が95%の信頼度で生じていることを示しています。

 次にあげる重要な考慮事項に注意が必要です。

  1. このクレームは、PETで評価可能と考えられる腫瘍にのみ適用されます。診療では、これは最小でも2cmで、ベースラインSUVmax 4g/mlの腫瘍を意味します(例えば、[Wahl 2009、de Langen 2012])。評価できる腫瘍の詳細は、セクション3.6.5.3に記載されています。
  2. クレームの詳細は文献のレビューから得られ、付録Bに要約されています。
  3. 公表された再現性の非対称限界は、テスト・リテストSUVmaxの差は正規分布に従わず、テスト・リテストSUVmaxの対数の差(d)が標準偏差を持って正規分布に従っているという観察に基づいています[Velasquez 2009、Weberら2015]。対数正規分布(すなわち、±1.96SD(d))における95%反復係数(RC)は、平均に関して対称です。これは、これらの限界が、RC = 100(exp(±1.96SD(d))-1)を用いて累乗によってSUVに戻される場合に、SUV のRC限界は必然的に非対称となることを示唆しています。さらに、標準偏差が測定のレベルと比較して大きくない場合、100(exp(SD(d)/ sqrt(2)) - 1)は、パーセントで表される被験者の変動係数とほぼ等しくなります [Bland and Altman 1996、Velasquez 2009]。 SUVmaxのwCVを12%と仮定すると、反復係数は(-28%、+ 39%)となり、これはVelasquezらによる進行消化器悪性腫瘍やWeberらによる非小細胞肺癌における知見と一致します。非対称な限界が予想されるということを、おそらくより直観的に理解するために、我々は2つの測定値SUVmax1 = 7.0およびSUVmax2 = 9.75を考えます。その場合、
    (SUVmax2-SUVmax1)/ SUVmax1 = + 39%
    (SUVmax1-SUVmax2)/ SUVmax2 = - 28%
    となります。言い換えれば、いずれの方向にもSUVmax に2.75の変化があれば、増大として+ 39%、または減少として-28%の変化があれば、2つの病状に生理学的差異があることになります。
  4. このクレームは、同じスキャナを使用した単一施設の研究に適用できます。多施設の研究では、FDG PET/CTイメージングが各時点(プロファイルに記載されている)で各患者のために同じスキャナおよびプロトコールを用いて行われる場合、このクレームは達成されていると予想されます。
  5. このクレームは、科学文献で示されたエビデンスによるSUVmaxに基づいています。しかし、再現性の向上のためには、より大きな関心領域(例えば、SUVpeak)から導かれたSUV指標の使用が推奨されます。さらに、自動および/または中央集中解析の利用により、SUV再現性はさらに向上します。相対リミットはSUVmax測定には適切であるようですが、容積ROIの平均値に基づいたSUVの測定には絶対リミットがより適している可能性があるということに注意してください[Nahmias and Wahl 2008]。
  6. クレームは文献の広範なレビューから得られたものですが、現時点では、ここで与えられた仕様に厳密に従った研究によってまだ実証されていない合意的なクレームです。さらに、このクレームは、PSF(point spread function)ベースの再構成やTOF(time of flight)イメージングなど、出版されたテスト・リテスト研究では利用されなかった技術変化に応じて再評価する必要があります。十分な数の研究によって利用されている標準は現在までには存在していません。今後の研究や現場テストからデータが収集され、それに従ってこのクレームまたはプロファイルの仕様に変更が加えられる予定です。
研究担当者:
大阪大学 担当:巽 光朗
東京医科歯科大学 立石 宇貴秀