nQuery
nQueryチュートリアル

  

nQueryによるグループ逐次デザイン

グループ逐次デザインは、第III相臨床試験で広く使用されているアダプティブデザインです。グループ逐次デザインでは、事前に決定した時点における中間の効果サイズから、エビデンスが治療の効果を強く支持するかあるいは支持しないかを判断します。エビデンスが十分に強固であれば、試験を早期に中止するという選択肢があります。

柔軟な消費関数アプローチを用いることによって、既定の中間解析で中止する可能性をうまく制御することができます。もし治療が有効であれば、試験を早期に中止し、より早く市場に出す機会があり、もし治療が有効でなければ、試験を早期に中止し、試験全体のコストを削減し、効果のない治療への患者の曝露を減らします。

チュートリアルでは、 The New England Journal of Medicineに掲載された論文:Anticholinergic Therapy vs. OnabotulinumtoxinA for Urgency Urinary Incontinence(尿失禁治療に対するボツリヌス療法と抗コリン作用療法の比較)におけるグループ逐次デザインの事例を再現し、 2つの平均を比較するグループ逐次デザインのサンプルサイズ計算する方法を解説します。

Ref.
November 8, 2012, The New England Journal of Medicine (NEJM)
2012; 367:1803-1813 DOI: 10.1056/NEJMoa1208872

グループ逐次デザイン

臨床試験で用いられた統計に関する情報

The New England Journal of Medicine:Anticholinergic Therapy vs. Onabotulinumtoxin A for Urgency Urinary Incontinence

"A sample size of 242 subjects (121 per treatment group) provides at least 80% power to detect a relative difference of 53% between botulinum toxin A and standardized anticholinergic therapy, assuming a treatment difference of -0.80 and a common SD of 2.1 (effect size = 0.381), and a two-sided type I error rate of 5%. Sample size has been adjusted to allow for a 10% loss to follow-up over the 6- months of treatment as well one intrim analysis to stop early for benefit."
Parameter | パラメーター Value | 値
Significance Level (Two-Sided) | 両側有意水準 0.05
OnabotulinumtoxinA Mean| オナボツリナムトキシンA -2.3
Anticholinergic Mean | 抗コリン作用薬 -1.5
Standard Deviation (Both) | 標準偏差(両側) 21
Power (%) | 検出力 (%) 80%
# Interim Analyses | 中間解析回数 1
α Spending Function | α消費関数 O'Brien-Fleming
Expected Dropout | 脱落(ドロップアウト) 10%

分析方法を選ぶ

Homeウィンドウで Create a New Table をクリックすると、Select Testダイアログが開きます。Select Testダイアログから、MTT12-2/Group Sequential Test of Two Means(2つの平均のグループ逐次デザイン)を選択します。

データの入力

グループ逐次デザインのサンプルサイズでは固定期間入力とグループ逐次入力を行う必要があります。

固定期間は左上のテーブルに入力します。これらは、固定期間解析に必要となる入力と同じになり、この場合は平均を比較するのでZ検定です。列ラベル示されている各行の定義に基づいて値を入力し、どのようにグループ逐次デザインを行うか指定します。

この事例の設定は、研究者は両側有意水準0.05、各群の平均は-1.5と-2.3、共通の標準偏差は2.1、のサンプルサイズ比は1となります。

  1
Test Significance Level 0.05
1 or 2 sided Test? 2
Group 1 Mean -1.50
Group 2 Mean -2.30
Difference in Means 0.80
Group 1 standard deviation 2.1 2.10
Group 2 standard deviation 2.1 2.10
Group 1 Size  
Group 2 Size  
Ratio 1.00
Power (%)  

検出力を入力する前に、グループ逐次デザインのパラメータを入力しましょう。 グループ逐次デザインのパラメータを入力するテーブルは、メインテーブルの左下にあるLooksウィンドウにあります。

Looksウィンドウ

Looksウィンドウは2つのテーブルで構成されています。左側のテーブルには、グループ逐次デザインを定義するパラメータを入力します。

右側のテーブルは計算結果を出力するテーブルで、既定の中間解析で早期に中止できる境界、および帰無仮説または対立仮説が真であることに基づいて早期に中止する可能性を示します。

グループ逐次デザインのパラメータ入力

論文で述べられている記述に従い、Looksウィンドウのテーブルにパラメータを入力します。

中間解析が1回あるので全体で2回の解析が行われることになります。これは等間隔、つまりデータの50%が収集された後に中間解析を行うことを意味します。

利用する過誤消費アプローチの選択ですが、この事例では無益性の境界が使用されていないので、Futility Boundariesは、デフォルトの計算しない(Don't Calculate)にしておきます。

有効性の境界には消費関数が設定され、α消費関数にはnQueryのデフォルトであるO’Brien-Flemingの消費関数を設定します。なお、α消費関数の設定に関しては、独自のカスタム境界の設定など、消費関数を実行するための他の選択肢をドロップダウンメニューから選ぶことができます。

GST Parameters
 
Number of Looks 2
Information Times Equally Spaced
Max Times 1
Efficacy Bounds Spending Function
Alpha Spending Function O'Brien-Fleming
Power/HSD Parameter  
Truncate Bounds No
Truncate At  
Futility Boundaries Don't Calculate
Beta Spending Function O'Brien-Fleming
Power/HSD Parameter  

検出力について

グループ逐次デザインのパラメータ入力した後、メインテーブルの検出力に値を入力します。

ここで検出力を80%に設定するとサンプルサイズは109となります。これは当臨床試験で研究者らが計算したサンプルサイズと同じ値です。

Looksウィンドウ:解析結果テーブル

検定力を入力すると、Looksウィンドウの右側のテーブルに結果が出力されます。テーブルを見ると、有効性境界の下限と上限は2.963となることが分かります。

  1 2
Lower Efficacy Bound -2.963 -1.969
Upper Efficacy Bound 2.963 1.969
Futility bound    
Nominal alpha 0.003 0.047

中間解析での統計量を標準化すると-2.963と2.963の間であった場合、次の解析に向けて試験の継続を選択することを意味します。 ただし、それが-2.963以下または2.963を超えた場合、この解析で有効性のために早期中止します。

この結果は中間解析で両側Z検定を実行して、0.003以下のP値を達成した場合に相当します。つまり、中間解析データのZ検定に基づいてP値が0.003以下の場合は試験を早期中止します。

無益性解析

この事例を拡張して、無益性解析を行ってみましょう。

メインテーブルの両側検定を片側検定、有意水準を0.05を0.025に変更して解析を実行してみましょう。 他のパラメータは同じとします。

  2
Test Significance Level 0.025
1 or 2 sided Test? 1
Group 1 Mean -1.5
Group 2 Mean -2.3
Group 1 standard deviation 2.1 2.1
Group 2 standard deviation 2.1 2.1
Ratio 1

次にLooksウィンドウで、2回の解析とO’Brien-Flemingの消費関数を使用する同じグループ逐次デザインを再現します。

ここで、Futility Boundaries(無益性の境界)の設定をNon-Bindingにします。これによって、無益性の境界を超えた場合でも、全体の第1種の過誤確率に影響を与えることなく、次の解析に向けて試験を続ける機会を有することになります。

無益性の評価には、Hwang-Shih DeCaniアプローチを用います。Beta Spending FunctionからHwang-Shih-DeCaniを選択し、Power/HSD Parameterのガンマ値を-1.5にします。

GST Parameters
 
Number of Looks 2
Information Times Equally Spaced
Max Times 1
Efficacy Bounds Spending Function
Alpha Spending Function O'Brien-Fleming
Power/HSD Parameter  
Truncate Bounds No
Truncate At  
Futility Boundaries Non-Binding
Beta Spending Function Hwang-Shih-DeCani
Power/HSD Parameter -1.5

Looksウィンドウ:解析結果テーブル

ここでも同様に検出力を80%に設定すると、各群114のサンプルサイズが得られます。わずかに大きくなりますが、無益性のために試験を中止する選択肢が加わります。

  2
Group 1 Size 114
Group 2 Size 114
Ratio 1
Power (%) 80%

Looksウィンドウの結果テーブルを見ると、有効性の境界は2.963であることがわかります。 これは中間解析での標準化統計量が2.963を超えた場合は有効性のために中止、0.508以下の場合は無益性のために早期に中止するという選択肢があることを意味します。

  1 2
Lower Efficacy Bound -8.00 -8.00
Upper Efficacy Bound 2.963 1.969
Futility bound 0.508 1.969
Nominal alpha 0.002 0.024

最終解析ではUpper Efficacy Boundと Futility boundの値が1.969となっており、2つの境界が同じであることがわかります。有効または無益の判断は、統計量が1.969を上回っているか下回っているかに応じて、つまりP値が0.024を上回っているか下回っているかに基づきます。

 

・・・

ユーザーページの「グループ逐次デザインと非盲検下サンプルサイズ再推定」では、中間解析での効果サイズが有望な場合、Chen-DeMets-Lanアプローチを用いてサンプルサイズの再推定を行う方法を紹介しています。

グループ逐次デザインと非盲検下サンプルサイズ再推定

動画によるチュートリアルでは、Chen-DeMets-Lanアプローチによるサンプルサイズの再推定を紹介しています(7'15"〜)。


動画で紹介されている機能は以下のパッケージでご利用頂けます
Pro | Expert