
取消
清空記錄
歷史記錄
清空記錄
歷史記錄



?本期分享國jia藥品監(jiān)督管理局藥品審評(píng)中心5月13日發(fā)布的《藥物臨床試驗(yàn)適應(yīng)性設(shè)計(jì)指導(dǎo)原則(征求意見稿)》 ,讓我們共同解讀一下吧!
? ? ? ? ? ? ? ? ? ? ?

目 錄
一、 引言
二、 適應(yīng)性設(shè)計(jì)中需要考慮的因素
(一)合理性
(二)完整性
(三)可行性
三、 常用的適應(yīng)性設(shè)計(jì)
(一)成組序貫設(shè)計(jì)
(二)樣本量重新估計(jì)
(三)兩階段無縫適應(yīng)性設(shè)計(jì)
(四)適應(yīng)性富集設(shè)計(jì)
(五)適應(yīng)性主方案試驗(yàn)設(shè)計(jì)
(六)多重適應(yīng)性設(shè)計(jì)
四、 適應(yīng)性設(shè)計(jì)的其他考慮
(一)貝葉斯方法的應(yīng)用
(二)模擬方法的應(yīng)用
五、 監(jiān)管的考慮
(一)與監(jiān)管部門的溝通
(二)對(duì)申報(bào)資料的要求
(三)其他的考慮
參考文獻(xiàn)
附錄1、詞匯表(本文略)
附錄2、適應(yīng)性設(shè)計(jì)案例(本文略)
? ? ? ? ? ? ? ? ? ? 藥物臨床試驗(yàn)適應(yīng)性設(shè)計(jì)指導(dǎo)原則
?一、引言
?本指導(dǎo)原則側(cè)重于討論臨床試驗(yàn)中采用適應(yīng)性設(shè)計(jì)的重要概念和原則,主要從監(jiān)管角度來討論一些常用的適應(yīng)性設(shè)計(jì),提出建議供申辦方在計(jì)劃使用適應(yīng)性設(shè)計(jì)時(shí)予以考慮,同時(shí)也提出了一些具體要求,目的是幫助申辦方評(píng)估是否采用以及如何進(jìn)行適應(yīng)性設(shè)計(jì),以支持新藥臨床試驗(yàn)申請(qǐng)和新藥上市申請(qǐng)。對(duì)于申辦方提交的適應(yīng)性設(shè)計(jì)方案,監(jiān)管部門會(huì)依據(jù)提交的材料及臨床試驗(yàn)中所涉及的各種因素,在綜合評(píng)估后給出具體的咨詢意見。
?適應(yīng)性設(shè)計(jì)可能會(huì)涉及多種統(tǒng)計(jì)方法,因此,在具體設(shè)計(jì)適應(yīng)性臨床試驗(yàn)方案時(shí),申辦方應(yīng)同時(shí)參考其它相關(guān)的ICH指導(dǎo)原則和國內(nèi)指導(dǎo)原則。
?臨床試驗(yàn)zui為常用的設(shè)計(jì)是固定樣本量的設(shè)計(jì),也常被稱為傳統(tǒng)設(shè)計(jì),被廣fan地用于確證性試驗(yàn),它是指對(duì)試驗(yàn)的數(shù)據(jù)僅在試驗(yàn)終止時(shí)做一次有效性分析并在試驗(yàn)進(jìn)行中沒有對(duì)試驗(yàn)進(jìn)行任何的分析和修改。很多確證性試驗(yàn)是基于前期有限的數(shù)據(jù)而設(shè)計(jì),有可能存在較大的偏差。如何根據(jù)試驗(yàn)期間累積的數(shù)據(jù)對(duì)試驗(yàn)做出相應(yīng)的修改從而修正設(shè)計(jì)的偏差就成為試驗(yàn)設(shè)計(jì)時(shí)需要考慮的一個(gè)重要問題。適應(yīng)性設(shè)計(jì)是對(duì)固定樣本量的設(shè)計(jì)進(jìn)行某些調(diào)整的設(shè)計(jì),本指導(dǎo)原則中適應(yīng)性設(shè)計(jì)被定義為:按照預(yù)先設(shè)定的計(jì)劃,在期中分析時(shí)根據(jù)試驗(yàn)期間累積的數(shù)據(jù)對(duì)試驗(yàn)做出相應(yīng)修改的臨床試驗(yàn)設(shè)計(jì),這種修改又稱為適應(yīng)性修改。適應(yīng)性修改計(jì)劃必須在臨床試驗(yàn)開始前的試驗(yàn)方案和統(tǒng)計(jì)分析計(jì)劃中預(yù)先設(shè)定。
?成組序貫設(shè)計(jì)是zui早應(yīng)用于臨床試驗(yàn)的適應(yīng)性設(shè)計(jì),其后,適應(yīng)性設(shè)計(jì)較廣范地用于樣本量的重新估計(jì)。在2007年歐盟EMA和 2010年美國FDA發(fā)布適應(yīng)性設(shè)計(jì)監(jiān)管指南后,適應(yīng)性設(shè)計(jì)的研究逐步推廣和發(fā)展到了多種類型的試驗(yàn)設(shè)計(jì),例如從多個(gè)劑量中篩選出具有潛在獲益劑量的設(shè)計(jì),到目前的多個(gè)目標(biāo)人群、多個(gè)假設(shè)、多個(gè)終點(diǎn)和多重檢驗(yàn)等更為復(fù)雜的設(shè)計(jì)。隨著更多新的理論方法不斷地推出以及應(yīng)用經(jīng)驗(yàn)不斷地增多,越來越多的適應(yīng)性設(shè)計(jì)在臨床試驗(yàn)中得以應(yīng)用,幾乎涵蓋了藥物研發(fā)的各個(gè)階段和所有的疾病領(lǐng)域。
?許多臨床試驗(yàn)的失敗源于前期信息有限導(dǎo)致的設(shè)計(jì)偏差,而適應(yīng)性設(shè)計(jì)因?yàn)樵谠囼?yàn)期間可以根據(jù)試驗(yàn)期間累積的數(shù)據(jù)對(duì)方案進(jìn)行修改,以修正初始設(shè)計(jì)的偏差,從而顯zhu增加了試驗(yàn)的成功率。適應(yīng)性設(shè)計(jì)還可以提高試驗(yàn)的效率,如減少試驗(yàn)所需要的樣本量、縮短不同研究階段之間的時(shí)間間隔、選擇更合適的終點(diǎn)、選擇更合適的目標(biāo)人群、利用相同數(shù)量的受試者獲得更多的數(shù)據(jù)等。此外,復(fù)雜的適應(yīng)性設(shè)計(jì)還可以在一個(gè)試驗(yàn)中同時(shí)處理多個(gè)試驗(yàn)?zāi)繕?biāo)、多種試驗(yàn)藥物和多種疾病。
?盡管適應(yīng)性設(shè)計(jì)具有上述諸多優(yōu)勢,但由于其復(fù)雜性,同時(shí)也給試驗(yàn)設(shè)計(jì)、數(shù)據(jù)分析和結(jié)果解釋,特別是試驗(yàn)的實(shí)施,帶來了諸多挑戰(zhàn)和問題,例如,怎樣控制整體I類錯(cuò)誤率、怎樣選擇分析模型和怎樣估計(jì)療效,以及因試驗(yàn)實(shí)施困難可能導(dǎo)致的操作偏倚等,這些都限制了適應(yīng)性設(shè)計(jì)的應(yīng)用。
?本指導(dǎo)原則主要適用于化學(xué)藥、生物制品和中藥的確證性臨床試驗(yàn),對(duì)于探索性研究也具有參考意義。
?二、適應(yīng)性設(shè)計(jì)中需要考慮的因素
?在決定是否采用適應(yīng)性設(shè)計(jì)之前,應(yīng)全面深入地權(quán)衡適應(yīng)性設(shè)計(jì)和傳統(tǒng)設(shè)計(jì)之間的優(yōu)劣,尤其是適應(yīng)性設(shè)計(jì)在設(shè)計(jì)、實(shí)施和統(tǒng)計(jì)分析方面的復(fù)雜性,以及由此而帶來的在試驗(yàn)實(shí)施中可能會(huì)引入的、不可避免的操作偏倚以及其他各種挑戰(zhàn)。是否采用適應(yīng)性設(shè)計(jì)需綜合考慮諸多因素,特別是合理性(validity)、完整性(integrity)和可行性(feasibility)。
(一)合理性
?適應(yīng)性設(shè)計(jì)的合理性是指所采用的統(tǒng)計(jì)分析方法不會(huì)導(dǎo)致療效的估計(jì)產(chǎn)生偏倚。試驗(yàn)的合理性是關(guān)于試驗(yàn)結(jié)果的可信度、可解釋性和說服力的綜合描述。保持試驗(yàn)的合理性意味著應(yīng)該有正確的統(tǒng)計(jì)推斷方法,例如怎樣計(jì)算調(diào)整后的p值、怎樣估計(jì)效應(yīng)量及置信區(qū)間,以及怎樣衡量不同階段治療效果的一致性。
?由于本指導(dǎo)原則的關(guān)注重點(diǎn)是能夠支持注冊的確證性試驗(yàn),因此要求試驗(yàn)的整體I類錯(cuò)誤率嚴(yán)格控制在雙側(cè)0.05(或單側(cè)0.025)的水平。判斷適應(yīng)性設(shè)計(jì)是否合理,zui重要的標(biāo)準(zhǔn)是所使用的統(tǒng)計(jì)方法能否控制整體I類錯(cuò)誤率。對(duì)有些適應(yīng)性設(shè)計(jì)來說,如采用雙側(cè)檢驗(yàn),由于不同階段的p值不能反映組間比較的方向,有可能使得zui終的整體p值難以解釋。為避免這種情況,可在試驗(yàn)方案中選擇單側(cè)檢驗(yàn)。但對(duì)另一些適應(yīng)性設(shè)計(jì),例如不對(duì)稱的雙邊假設(shè),雙側(cè)檢驗(yàn)會(huì)是更合適的選擇。除了某些特殊情形外,適應(yīng)性修改都需調(diào)整試驗(yàn)的I類錯(cuò)誤率。
?適應(yīng)性設(shè)計(jì)可能同時(shí)涉及多個(gè)目標(biāo)人群、多個(gè)假設(shè)、多個(gè)終點(diǎn)或多重檢驗(yàn),故對(duì)統(tǒng)計(jì)分析方法的合理性有著很高的要求。如果對(duì)適應(yīng)性修改沒有相應(yīng)的合理有效的統(tǒng)計(jì)方法,則不宜采用該設(shè)計(jì)。此外,由于適應(yīng)性設(shè)計(jì)的復(fù)雜性,在某些情況下沒有適用的統(tǒng)計(jì)推斷的理論公式,統(tǒng)計(jì)方法的合理性在一定程度上需要基于模擬方法進(jìn)行驗(yàn)證,這有可能又增加了額外的不確定性。
?適應(yīng)性設(shè)計(jì)的分析需要結(jié)合來自多個(gè)階段的數(shù)據(jù),各個(gè)階段療效估計(jì)的不一致性不僅會(huì)使基于合并數(shù)據(jù)的統(tǒng)計(jì)推斷變得困難,還會(huì)導(dǎo)致試驗(yàn)結(jié)果難以解釋。另外許多適應(yīng)性修改是以達(dá)到統(tǒng)計(jì)學(xué)陽性結(jié)果為目的,如果zui終統(tǒng)計(jì)檢驗(yàn)結(jié)果雖為陽性但臨床獲益太小,也不足以支持所驗(yàn)證的藥物療效。
(二)完整性
?適應(yīng)性設(shè)計(jì)的完整性是指對(duì)試驗(yàn)操作所引入偏倚的良好控制。保持試驗(yàn)的完整性意味著按照預(yù)先設(shè)定的方案進(jìn)行修改和保持期中分析結(jié)果的盲態(tài),以求zui大限度地減少操作偏倚。
?避免引入操作偏倚是所有臨床試驗(yàn)的zui基本要求。適應(yīng)性設(shè)計(jì)由于涉及臨床試驗(yàn)許多方面的修改,有可能影響后續(xù)試驗(yàn)的執(zhí)行,對(duì)保持試驗(yàn)的完整性增加了額外的難度。因此,適應(yīng)性設(shè)計(jì)的所有期中分析都應(yīng)該由獨(dú)立于申辦方的適應(yīng)性設(shè)計(jì)委員會(huì)或第三方專家及其獨(dú)立統(tǒng)計(jì)支持團(tuán)隊(duì)完成,并保證期中分析的結(jié)果不為申辦方、研究者和受試者所知悉,以免影響后續(xù)試驗(yàn)的執(zhí)行和引入操作偏倚。在大多數(shù)情形下,如果適應(yīng)性設(shè)計(jì)不是特別復(fù)雜,可由獨(dú)立數(shù)據(jù)監(jiān)查委員會(huì)同時(shí)負(fù)責(zé)適應(yīng)性調(diào)整的操作和執(zhí)行;如果適應(yīng)性設(shè)計(jì)較為復(fù)雜,申辦方可以考慮選擇具備適應(yīng)性修改專業(yè)知識(shí)的專家組成獨(dú)立數(shù)據(jù)監(jiān)查委員會(huì);如果適應(yīng)性設(shè)計(jì)極為復(fù)雜,而數(shù)據(jù)監(jiān)查委員又無足夠的相關(guān)經(jīng)驗(yàn),則有必要設(shè)置一個(gè)獨(dú)立的適應(yīng)性設(shè)計(jì)委員會(huì)。根據(jù)復(fù)雜的程度,適應(yīng)性設(shè)計(jì)委員會(huì)中可以包含多名統(tǒng)計(jì)師。因適應(yīng)性修改涉及多個(gè)環(huán)節(jié),設(shè)立一個(gè)有效的防火墻以防止期中分析結(jié)果外泄而造成可能的操作偏倚是執(zhí)行中zui為重要的任務(wù)。為此,適應(yīng)性設(shè)計(jì)的方案應(yīng)包含一個(gè)完善的操作流程,特別是關(guān)于如何設(shè)置相關(guān)信息的訪問權(quán)限。同時(shí),為避免不可控制因素對(duì)試驗(yàn)結(jié)果的影響,還要考慮怎樣避免根據(jù)試驗(yàn)所做的修改而被間接地推出期中分析的結(jié)果。應(yīng)該注意的是,適應(yīng)性設(shè)計(jì)委員會(huì)在所有提供給申辦方的任何修改的建議中,均不應(yīng)涉及具體的期中分析結(jié)果。申辦方也要準(zhǔn)備好所有需要的標(biāo)準(zhǔn)操作流程,并將所有涉及適應(yīng)性修改的相關(guān)程序融入其中,同時(shí)記錄好所有實(shí)際操作的過程以備在申報(bào)新藥時(shí)審查。以上這些因素都應(yīng)該在試驗(yàn)的設(shè)計(jì)階段仔細(xì)考慮,并特別需要在試驗(yàn)進(jìn)行中嚴(yán)格地執(zhí)行,以免影響試驗(yàn)的完整性和試驗(yàn)結(jié)論的可靠性。
(三)可行性
?適應(yīng)性設(shè)計(jì)的可行性是指試驗(yàn)的適應(yīng)性修改能否在實(shí)際中實(shí)施。由于適應(yīng)性設(shè)計(jì)比傳統(tǒng)設(shè)計(jì)更為復(fù)雜,并且實(shí)施和分析更加困難,在規(guī)劃適應(yīng)性設(shè)計(jì)之前,需要考慮以下因素:適應(yīng)性調(diào)整策略應(yīng)該能夠保障試驗(yàn)的合理性和完整性;相對(duì)于試驗(yàn)周期,應(yīng)該有充裕的時(shí)間根據(jù)試驗(yàn)累積數(shù)據(jù)的分析結(jié)果進(jìn)行適應(yīng)性修改和后續(xù)試驗(yàn)的執(zhí)行;期中數(shù)據(jù)收集和數(shù)據(jù)清理應(yīng)該可以快速完成,以便按預(yù)定計(jì)劃完成期中分析而無需中途暫停招募受試者;應(yīng)該能夠快速修改隨機(jī)化程序/藥物供應(yīng)系統(tǒng);應(yīng)該具備足夠的藥物供應(yīng)管理的能力以及能夠負(fù)擔(dān)增加的藥物供應(yīng);應(yīng)該提前準(zhǔn)備好適應(yīng)性設(shè)計(jì)的數(shù)據(jù)采集系統(tǒng);應(yīng)該保證與各相關(guān)方的溝通順暢有效;應(yīng)該能夠配備專業(yè)軟件來完成復(fù)雜設(shè)計(jì)和相關(guān)分析的計(jì)算等,以滿足試驗(yàn)運(yùn)行中適應(yīng)性修改和執(zhí)行的需求。同時(shí),在試驗(yàn)設(shè)計(jì)階段,申辦方可以與研究者溝通,根據(jù)臨床考慮提出一個(gè)試驗(yàn)的目標(biāo)列表,評(píng)估所考慮的適應(yīng)性設(shè)計(jì)在實(shí)際中能夠順利進(jìn)行的可行性。如果相關(guān)適應(yīng)性修改難以實(shí)施,則應(yīng)該考慮其它設(shè)計(jì)。
?綜上所述,若計(jì)劃采用適應(yīng)性設(shè)計(jì),需要仔細(xì)地評(píng)估其是否確有優(yōu)勢。若無法決策,可以采用模擬方法與傳統(tǒng)設(shè)計(jì)比較,以評(píng)估適應(yīng)性設(shè)計(jì)的效率,并選出較優(yōu)的設(shè)計(jì)。如果評(píng)估后適應(yīng)性設(shè)計(jì)沒有體現(xiàn)出太多的優(yōu)勢,建議謹(jǐn)慎考慮適應(yīng)性設(shè)計(jì)。
?三、常用的適應(yīng)性設(shè)計(jì)
?適應(yīng)性設(shè)計(jì)是按照預(yù)先計(jì)劃,根據(jù)累積的臨床試驗(yàn)數(shù)據(jù)的分析結(jié)果,在保證試驗(yàn)的合理性和完整性的前提下,對(duì)臨床試驗(yàn)方案進(jìn)行修改。一方面,適應(yīng)性修改是“按預(yù)先設(shè)定的計(jì)劃”進(jìn)行的,而不是臨時(shí)提出的修改方案;另一方面,適應(yīng)性修改是一個(gè)自我學(xué)習(xí)的過程,即通過對(duì)累積數(shù)據(jù)的不斷學(xué)習(xí),相應(yīng)地修改試驗(yàn)方案,以適應(yīng)不斷變化的研究環(huán)境。因此,適應(yīng)性設(shè)計(jì)旨在更好地改進(jìn)進(jìn)行中的臨床試驗(yàn),而不是因設(shè)計(jì)本身缺陷而有極大可能導(dǎo)致臨床試驗(yàn)失敗所做的臨時(shí)補(bǔ)救。
?適應(yīng)性設(shè)計(jì)在應(yīng)用中涉及范圍很廣,限于篇幅,本指導(dǎo)原則僅討論幾種常用的適應(yīng)性設(shè)計(jì),包括成組序貫設(shè)計(jì)、樣本量重估、兩階段無縫適應(yīng)性設(shè)計(jì)、適應(yīng)性富集設(shè)計(jì)、適應(yīng)性主方案試驗(yàn)設(shè)計(jì)、多重適應(yīng)性設(shè)計(jì)。這些設(shè)計(jì)的原理和方法也適用于大多數(shù)其他適應(yīng)性設(shè)計(jì)。此外,本章節(jié)中所討論的方法將會(huì)通過幾個(gè)假想的案例予以說明(見附錄2)。
(一)成組序貫設(shè)計(jì)
?成組序貫設(shè)計(jì)是指方案中預(yù)先計(jì)劃在試驗(yàn)過程中進(jìn)行一次或多次期中分析,依據(jù)每一次期中分析的結(jié)果做出后續(xù)試驗(yàn)的決策,決策通常有四種可能:①依據(jù)優(yōu)效性終止試驗(yàn);②依據(jù)無效性終止試驗(yàn);③依據(jù)安全性終止試驗(yàn);④繼續(xù)試驗(yàn)。期中分析的時(shí)間可以基于日歷時(shí)間,也可基于累積數(shù)據(jù)的占比,如受試者入組比例或發(fā)生目標(biāo)事件數(shù)的比例。如果期中分析至少有一次療效分析,且均有以無效性或優(yōu)效性提前終止試驗(yàn)的可能,則應(yīng)調(diào)整每次分析的I類錯(cuò)誤率,并將整體I類錯(cuò)誤率控制在雙側(cè)0.05(或單側(cè)0.025)水平。調(diào)整I類錯(cuò)誤率的常用方法包括Pocock方法、O'Brien & Fleming方法和Lan & DeMets方法。由于期中分析僅使用了部分?jǐn)?shù)據(jù),結(jié)果仍有較大的不確定性,評(píng)估有效性的方法應(yīng)較為保守以增加結(jié)論的可靠性。無效性終止試驗(yàn)的設(shè)計(jì)分為綁定邊界和非綁定邊界。綁定的無效性邊界會(huì)降低拒絕無效假設(shè)的概率,因此可以在控制整體I類錯(cuò)誤的前提下,適當(dāng)放寬優(yōu)效性邊界,提高得到陽性結(jié)果的概率,但在期中分析結(jié)果一旦跨越無效性邊界時(shí)必須終止試驗(yàn)。非綁定邊界即使在試驗(yàn)結(jié)果跨越該邊界時(shí),獨(dú)立數(shù)據(jù)監(jiān)查委員會(huì)基于全面考慮后仍然可以建議試驗(yàn)繼續(xù)進(jìn)行。
?選擇期中分析的時(shí)間點(diǎn)也要仔細(xì)考慮。如果成組序貫調(diào)整計(jì)劃中存在以優(yōu)效性提前終止試驗(yàn)的可能,時(shí)間點(diǎn)的選擇應(yīng)該考慮期中的數(shù)據(jù)是否充分以便能夠提供可靠的療效估計(jì)和安全性評(píng)價(jià)的結(jié)果,也包括重要的次要終點(diǎn)以及一些重要的亞組結(jié)果的估計(jì)。若期中分析是要驗(yàn)證藥物的安全性和無效性,時(shí)間點(diǎn)則應(yīng)該側(cè)重于如何zui大程度地保護(hù)受試者。
(二)樣本量重新估計(jì)
?樣本量重新估計(jì)是依據(jù)預(yù)先設(shè)定的期中分析計(jì)劃,利用累積的試驗(yàn)數(shù)據(jù)重新計(jì)算樣本量,以保證zui終的統(tǒng)計(jì)檢驗(yàn)?zāi)苓_(dá)到預(yù)先設(shè)定的目標(biāo)或修改后的目標(biāo),并同時(shí)能夠控制整體I類錯(cuò)誤率。
?初始樣本量的估計(jì)通常取決于效應(yīng)量、主要終點(diǎn)的變異度、試驗(yàn)隨訪時(shí)間、受試者脫落率等諸多因素,而這些常?;谝酝难芯繑?shù)據(jù)。多數(shù)情況下,試驗(yàn)設(shè)計(jì)階段樣本量的估計(jì)所需要的參數(shù)信息往往不夠充分,可能會(huì)導(dǎo)致錯(cuò)估樣本量。適應(yīng)性設(shè)計(jì)中的樣本量重新估計(jì)為此類問題提供了有效的解決方案。
?樣本量重新估計(jì)的方法可以分為盲態(tài)方法和非盲態(tài)方法。
?盲態(tài)方法,也稱為非比較分析方法(non-comparative analysis),是指期中分析時(shí)不使用實(shí)際試驗(yàn)分組的信息,或者雖然使用了實(shí)際試驗(yàn)分組的信息,但未做任何涉及組間比較的分析,如在期中分析時(shí)對(duì)兩個(gè)治療組的數(shù)據(jù)合并后做的匯總分析。
?盲態(tài)方法的樣本量重新估計(jì)是指根據(jù)累積的數(shù)據(jù),計(jì)算樣本量的重要參數(shù)(如合并方差或標(biāo)準(zhǔn)差),然后對(duì)樣本量進(jìn)行重新估計(jì),因期中分析時(shí)不涉及組間的療效比較,故一般不需要調(diào)整I類錯(cuò)誤率。該方法比較容易實(shí)施,一般不會(huì)引入操作偏倚,而且相關(guān)的統(tǒng)計(jì)方法也較為完善,只需要在試驗(yàn)設(shè)計(jì)的階段預(yù)先做好規(guī)劃。
?非盲態(tài)方法,也稱比較分析方法(comparative analysis),是指期中分析時(shí)使用了試驗(yàn)分組信息(包括各組的真實(shí)名稱或可區(qū)分的分組代碼)的分析,分析內(nèi)容涉及組間的比較。
?非盲態(tài)方法的樣本量重新估計(jì)是指根據(jù)累積數(shù)據(jù)以及分組信息,計(jì)算樣本量的重要參數(shù)(如每組的效應(yīng)量),然后對(duì)樣本量進(jìn)行重新估計(jì),因期中分析涉及組間的療效比較,通常需要對(duì)I類錯(cuò)誤率進(jìn)行相應(yīng)調(diào)整。
?非盲態(tài)分析的樣本量重新估計(jì)需要預(yù)先在研究方案中闡明,包括何時(shí)進(jìn)行重新估計(jì)、決策時(shí)使用什么標(biāo)準(zhǔn)、重新估計(jì)時(shí)使用什么方法、如何調(diào)整檢驗(yàn)水準(zhǔn)α以便控制整體I類錯(cuò)誤率、由誰執(zhí)行非盲態(tài)分析,以及zui后由誰執(zhí)行整個(gè)操作過程。應(yīng)該特別注意,一個(gè)試驗(yàn)中一般建議只做一次樣本量重新估計(jì)。當(dāng)重新估計(jì)的樣本量少于初次設(shè)計(jì)的樣本量時(shí),除非有非常特別的理由,通常不接受樣本量減少的調(diào)整。
?適應(yīng)性設(shè)計(jì)中是否采用非盲態(tài)樣本量重新估計(jì)需要考慮多種因素。例如,若有比較可靠的前期數(shù)據(jù),非盲態(tài)下樣本量重新估計(jì)是否必要?采用非盲態(tài)下樣本量重估所付的代價(jià)(如檢驗(yàn)水準(zhǔn)調(diào)整)與初始設(shè)計(jì)時(shí)略微放大樣本量相比,哪種策略更為有利?期中分析能否很快完成,是否可能因?yàn)槿虢M較快完成而導(dǎo)致沒有充足時(shí)間用來調(diào)整試驗(yàn)?在什么時(shí)間點(diǎn)進(jìn)行期中分析?因此,設(shè)計(jì)應(yīng)根據(jù)試驗(yàn)本身的特點(diǎn),仔細(xì)考慮各種因素,然后選擇出zui合適的方法。
?樣本量重新估計(jì)的方法有很多文獻(xiàn)可供參考,可根據(jù)具體試驗(yàn)選擇一種合適的方法。
(三)兩階段無縫適應(yīng)性設(shè)計(jì)
?兩階段無縫適應(yīng)性設(shè)計(jì),是指將一個(gè)試驗(yàn)分為兩個(gè)階段,在第1階段結(jié)束時(shí)進(jìn)行期中分析,依據(jù)預(yù)先設(shè)定的判斷標(biāo)準(zhǔn),對(duì)第2階段的試驗(yàn)進(jìn)行適應(yīng)性修改。無縫設(shè)計(jì)通常分為操作無縫設(shè)計(jì)和推斷無縫設(shè)計(jì)。操作無縫設(shè)計(jì)可將第一階段試驗(yàn)受試者排除在主要分析之外,不需要對(duì)I類錯(cuò)誤進(jìn)行調(diào)整。推斷無縫設(shè)計(jì)在主要分析中包含第一階段試驗(yàn)受試者,并根據(jù)自適應(yīng)的性質(zhì)和假設(shè)檢驗(yàn)策略作出相應(yīng)的調(diào)整。
?根據(jù)試驗(yàn)?zāi)繕?biāo)和試驗(yàn)終點(diǎn),兩階段設(shè)計(jì)一般可分為四種類型,即同目標(biāo)/同終點(diǎn)、同目標(biāo)/不同終點(diǎn)、不同目標(biāo)/同終點(diǎn)和不同目標(biāo)/不同終點(diǎn)。任何一個(gè)兩階段無縫適應(yīng)性設(shè)計(jì)都可以被適當(dāng)?shù)貧w類,可根據(jù)具體試驗(yàn)選擇合適的方法。
?如果試驗(yàn)在兩個(gè)階段的試驗(yàn)組數(shù)也相同,成組序貫設(shè)計(jì)可視為同目標(biāo)/同終點(diǎn)試驗(yàn)中的一個(gè)特例。兩階段無縫試驗(yàn)中,常見的是I/II期無縫適應(yīng)性設(shè)計(jì)和II/III期無縫適應(yīng)性設(shè)計(jì)。前者多用于探索性試驗(yàn),在第1階段可能會(huì)探索一個(gè)生物標(biāo)記,并在第2階段探索其早期有效性;后者常用于確證性試驗(yàn),在第1階段可做劑量選擇,并在第2階段驗(yàn)證其有效性。
?獨(dú)立的II期試驗(yàn)通常包括多個(gè)試驗(yàn)組,如相同藥物的多個(gè)劑量水平,目的是選出合適的劑量并決定是否進(jìn)行III期試驗(yàn)。III期試驗(yàn)是一個(gè)獨(dú)立于II期的試驗(yàn),其zui終分析并不包含II期試驗(yàn)的數(shù)據(jù),這種設(shè)計(jì)沒有充分地利用II期試驗(yàn)的數(shù)據(jù)。推斷無縫適應(yīng)性設(shè)計(jì)的zui終分析則包含了試驗(yàn)的兩個(gè)階段入組的所有受試者的數(shù)據(jù)。這種設(shè)計(jì)具有很多優(yōu)點(diǎn),例如可以縮短通常由II期試驗(yàn)結(jié)束時(shí)到III期試驗(yàn)開始時(shí)的時(shí)間間隔、減少試驗(yàn)的總樣本量、縮短試驗(yàn)的時(shí)長、減少試驗(yàn)的費(fèi)用、增加zui終分析的樣本量等。同時(shí),因第1階段入組的受試者有更長的隨訪時(shí)間,或能更早地觀察到藥物的長期安全性。
?采用無縫II/III期適應(yīng)性設(shè)計(jì)需要考慮多種因素。由于期中分析時(shí)對(duì)第1階段結(jié)果可能無法進(jìn)行全面深入地分析,加之選擇一個(gè)III期試驗(yàn)的劑量還會(huì)涉及很多其他因素,以及適應(yīng)性設(shè)計(jì)可能帶來的設(shè)計(jì)、操作和執(zhí)行方面的困難,因此,如果對(duì)試驗(yàn)藥物了解甚少,一般不宜選擇兩階段無縫適應(yīng)性設(shè)計(jì)。還有一些情形,采用兩階段無縫適應(yīng)性設(shè)計(jì)可能會(huì)有較大的風(fēng)險(xiǎn)。例如,III期試驗(yàn)的主要終點(diǎn)需要較長的隨訪時(shí)間,第1階段或許只能夠用替代終點(diǎn)進(jìn)行判斷,當(dāng)替代終點(diǎn)與主要終點(diǎn)關(guān)聯(lián)性不高甚至較差時(shí),用替代終點(diǎn)選擇III期試驗(yàn)的劑量會(huì)帶來很大的不確定性。又如,在達(dá)到主要終點(diǎn)所需要的時(shí)間較長而入組時(shí)間又較短的情況下,為避免過多的受試者進(jìn)入未選中的劑量組,需要暫停入組等待期中分析的結(jié)果,由此可能會(huì)引發(fā)出其他的問題。
?以上討論的兩階段適應(yīng)性設(shè)計(jì)的方法也可以直接應(yīng)用于其他類似的試驗(yàn),例如第1階段涉及不同藥物的選擇,或者聯(lián)合用藥和單藥的選擇。
(四)適應(yīng)性富集設(shè)計(jì)
?以兩階段無縫適應(yīng)性設(shè)計(jì)為背景,適應(yīng)性富集設(shè)計(jì)(adaptive enrichment design)是指試驗(yàn)第1階段結(jié)束后,根據(jù)期中分析的結(jié)果,依據(jù)預(yù)先設(shè)定的標(biāo)準(zhǔn)對(duì)目標(biāo)人群進(jìn)行適應(yīng)性調(diào)整,以決定第2階段的目標(biāo)人群。試驗(yàn)的第2階段可能繼續(xù)在全人群中進(jìn)行,或者僅入組亞群并有可能需要做一些對(duì)應(yīng)的適應(yīng)性調(diào)整,或者加大樣本量繼續(xù)入組全人群,這同時(shí)也自然地加大了亞群的入組率。試驗(yàn)的zui終分析目標(biāo)可能僅是全人群,或可能僅是亞群,或可能是全人群和亞群,其側(cè)重點(diǎn)則由α的分配比例來決定。試驗(yàn)的zui終分析將包含試驗(yàn)的兩個(gè)階段入組的所有受試者的數(shù)據(jù),并有相應(yīng)的調(diào)整方法以控制整體I類錯(cuò)誤率。
?如果已知試驗(yàn)藥物只對(duì)某特定亞群有效,那么,臨床試驗(yàn)應(yīng)該只在該亞群中招募受試者。但實(shí)際中更為常見的情形是試驗(yàn)藥物有可能對(duì)某亞群有較大的療效,但不清楚對(duì)全人群是否也有足夠大的療效。在這種情況下,如果試驗(yàn)藥物對(duì)全人群有足夠大的療效,只入組亞群受試者就會(huì)失去顯示對(duì)全人群有效的機(jī)會(huì);如果試驗(yàn)藥物對(duì)全人群療效較小但對(duì)某亞群有效,入組全人群受試者極有可能得不到預(yù)期的陽性結(jié)果,同時(shí)也失去了顯示對(duì)亞群有效的機(jī)會(huì)。采用兩階段無縫適應(yīng)性設(shè)計(jì)來選擇目標(biāo)人群,利用試驗(yàn)本身的結(jié)果以便可以更科學(xué)地選擇出目標(biāo)人群,增加藥物研發(fā)的成功率。
?因?yàn)檫m應(yīng)性設(shè)計(jì)中目標(biāo)人群的選擇涉及全人群和亞群,如果第1階段的期中分析采用非盲態(tài)下的組間比較,應(yīng)明確定義兩個(gè)人群的統(tǒng)計(jì)假設(shè)和相應(yīng)的統(tǒng)計(jì)方法,以控制整體I類錯(cuò)誤率。
?對(duì)于目標(biāo)人群的選擇標(biāo)準(zhǔn),可以基于疾病特征、預(yù)后生物標(biāo)志物或預(yù)測生物標(biāo)志物等各種標(biāo)準(zhǔn)。一般而言,采用公認(rèn)的疾病相關(guān)特征或預(yù)后相關(guān)生物標(biāo)志物來選定目標(biāo)人群,試驗(yàn)的設(shè)計(jì)和操作會(huì)相對(duì)簡單。目前,采用預(yù)測生物標(biāo)志物來選擇目標(biāo)人群的研究日趨增多,但許多預(yù)測生物標(biāo)志物的臨床價(jià)值尚不明確。如果試驗(yàn)要用一個(gè)全新的預(yù)測生物標(biāo)志物來選擇目標(biāo)人群,必須要有對(duì)應(yīng)的診斷方法。所用診斷方法必須已經(jīng)被監(jiān)管部門批準(zhǔn)上市,如果沒有,可能需要同時(shí)研發(fā)。如果試驗(yàn)數(shù)據(jù)zui終不支持所研發(fā)的體外診斷試劑(未能獲得器械監(jiān)管部門批準(zhǔn)上市申請(qǐng)),會(huì)直接導(dǎo)致試驗(yàn)中關(guān)于試驗(yàn)藥物的結(jié)論也不可靠。此外,如果需要同時(shí)研發(fā)伴隨治療的體外診斷試劑尚未確定亞群界定的閾值,若使用部分前期入組的受試者來確定閾值,這些受試者應(yīng)該從zui終的分析數(shù)據(jù)集中剔除,以免zui終的陽性結(jié)果難以解釋。為更好的理解生物標(biāo)志物預(yù)測的準(zhǔn)確性和全面評(píng)估試驗(yàn)的結(jié)果,通常鼓勵(lì)將非目標(biāo)人群的信息也納入研究。
?在未能充分了解亞群中藥物效應(yīng)的情況下,決定是否采用適應(yīng)性設(shè)計(jì)選擇目標(biāo)人群較為困難,同時(shí)也有較大的風(fēng)險(xiǎn)。如果無視有療效的目標(biāo)亞群,在全人群中可能得不到陽性結(jié)果,或者即使在全人群中得到了陽性結(jié)果,但在非目標(biāo)亞群患者中實(shí)際無效,從而導(dǎo)致倫理問題。另一方面,如果實(shí)際有療效的目標(biāo)人群為全人群和若干亞群,而通過試驗(yàn)僅僅選擇出了其中的一個(gè)亞群,導(dǎo)致有效的藥物得不到充分地利用。
(五)適應(yīng)性主方案試驗(yàn)設(shè)計(jì)
?主方案試驗(yàn)設(shè)計(jì)是指一個(gè)整體臨床試驗(yàn)方案含有多個(gè)子方案,不同的子方案可同時(shí)檢驗(yàn)一種藥物對(duì)于多種疾病的臨床效果,也可同時(shí)檢驗(yàn)多種藥物對(duì)于一種疾病的臨床效果,或者同時(shí)檢驗(yàn)多種藥物對(duì)于多種疾病的臨床效果。每一個(gè)子方案可以是單臂試驗(yàn),也可以是隨機(jī)對(duì)照試驗(yàn)。如果子方案都是隨機(jī)對(duì)照試驗(yàn),各個(gè)子方案有可能共用一個(gè)對(duì)照組,也可能有各自的對(duì)照組。主方案試驗(yàn)也用來泛指由患者特定特征(如疾病、組織學(xué)類型、分子標(biāo)記物)為標(biāo)志的臨床試驗(yàn)。主方案試驗(yàn)具有很多優(yōu)點(diǎn),例如能夠?yàn)榛颊咛峁?span style="font-family:宋體;font-size:16px;text-align:justify;text-indent:24px;white-space:normal;">zui大的入組機(jī)會(huì)并選擇zui合適的受試藥物的機(jī)會(huì)。常見的主方案設(shè)計(jì)包括籃式試驗(yàn)、傘式試驗(yàn)和平臺(tái)試驗(yàn)。
?適應(yīng)性主方案設(shè)計(jì)是指在主方案設(shè)計(jì)中包含了一種或多種適應(yīng)性調(diào)整的設(shè)計(jì),它可以靈活地采用多種適應(yīng)性調(diào)整,例如添加一個(gè)或多個(gè)新的子方案,提前結(jié)束一個(gè)或多個(gè)子方案,重新估計(jì)樣本量,調(diào)整檢驗(yàn)的假設(shè)、主要終點(diǎn)和主要統(tǒng)計(jì)方法,或?qū)Σ煌淖臃桨冈O(shè)計(jì)做不同的適應(yīng)性調(diào)整。
?主方案試驗(yàn)需要統(tǒng)一管理,設(shè)有統(tǒng)一管理機(jī)構(gòu),如機(jī)構(gòu)審查委員會(huì)、獨(dú)立數(shù)據(jù)監(jiān)查委員會(huì)、獨(dú)立審查委員會(huì)。實(shí)施時(shí)需要采用中央隨機(jī)化系統(tǒng)、電子數(shù)據(jù)采集系統(tǒng)、中央標(biāo)本庫和實(shí)驗(yàn)室,使用統(tǒng)一設(shè)計(jì)的病例報(bào)告表、知情同意書和臨床監(jiān)查人員等。
?籃式設(shè)計(jì)旨在評(píng)估一種藥物治療具有同一種生物學(xué)特征的不同疾病類型的臨床效果,該設(shè)計(jì)在一個(gè)整體臨床試驗(yàn)方案中含有多個(gè)子方案,通常每一個(gè)子方案都是一個(gè)單臂試驗(yàn),而每一個(gè)子方案都針對(duì)一種或多種疾病類型。在腫瘤學(xué)領(lǐng)域,有時(shí)使用腫瘤組織學(xué)進(jìn)行傳統(tǒng)的試驗(yàn)非常困難或很難實(shí)現(xiàn),而基因測序和全基因組分析已經(jīng)實(shí)現(xiàn)了詳細(xì)的分子生物學(xué)分類,籃式試驗(yàn)就是為了適應(yīng)這一新的分類變化提出的。
?傘式設(shè)計(jì)旨在評(píng)估多種藥物針對(duì)同一種疾病或生物標(biāo)記物類型的靶向治療的臨床效果,該設(shè)計(jì)在一個(gè)整體臨床試驗(yàn)方案中含有多個(gè)子方案,每一個(gè)子方案針對(duì)一種或多種藥物,可能是單臂試驗(yàn)或隨機(jī)對(duì)照試驗(yàn)。傘式試驗(yàn)常用來為確證性研究選擇候選藥物,也可用來作為確證性研究。
?平臺(tái)設(shè)計(jì)旨在評(píng)估多種治療針對(duì)多種疾病的臨床療效,該設(shè)計(jì)在一個(gè)整體臨床試驗(yàn)方案中包含有多個(gè)子方案,每一個(gè)子方案都是一個(gè)隨機(jī)對(duì)照試驗(yàn),一般會(huì)采用同一個(gè)對(duì)照組。平臺(tái)試驗(yàn)通常會(huì)維持試驗(yàn)長期進(jìn)行,并允許新的試驗(yàn)藥物隨時(shí)加入試驗(yàn)平臺(tái),同時(shí),對(duì)照藥物隨著時(shí)間推移也可能變更。
?主方案試驗(yàn)雖然具有很多優(yōu)點(diǎn),但由于其復(fù)雜性,在計(jì)劃、執(zhí)行、統(tǒng)一管理結(jié)構(gòu)的建立、尤其是統(tǒng)計(jì)分析等方面都面臨著較大地挑戰(zhàn)。如果計(jì)劃采用主方案試驗(yàn),應(yīng)在試驗(yàn)各個(gè)方面可能涉及的各種問題做全面、深入和細(xì)致的研究后,再慎重選擇。
(六)多重適應(yīng)性設(shè)計(jì)
?多重適應(yīng)性設(shè)計(jì)是指一個(gè)試驗(yàn)中采用兩種或兩種以上適應(yīng)性調(diào)整方法的試驗(yàn)設(shè)計(jì)。以上所討論的適應(yīng)性設(shè)計(jì)方法都可以同時(shí)用于同一個(gè)臨床試驗(yàn)。例如,一個(gè)臨床試驗(yàn)在第1階段結(jié)束時(shí)確定了下階段的用藥劑量,其后需要做樣本量重新估計(jì),再其后需要選擇目標(biāo)人群。
?原則上講,如果一個(gè)臨床試驗(yàn)設(shè)計(jì)包含了多種適應(yīng)性調(diào)整,只要符合合理性、完整性和可行性的要求,多重適應(yīng)性設(shè)計(jì)都可以考慮。由于多重適應(yīng)性設(shè)計(jì)的復(fù)雜性,建議慎重地考慮一個(gè)試驗(yàn)中是否的確有必要引入過多的適應(yīng)性調(diào)整。
?四、適應(yīng)性設(shè)計(jì)的其他考慮
(一)貝葉斯方法的應(yīng)用
?貝葉斯適應(yīng)性設(shè)計(jì)是指一個(gè)使用了貝葉斯方法并同時(shí)含有適應(yīng)性調(diào)整的試驗(yàn)設(shè)計(jì)。貝葉斯方法是一類統(tǒng)計(jì)方法,它根據(jù)貝葉斯原理將一個(gè)分布函數(shù)(先驗(yàn)分布)總結(jié)的前期試驗(yàn)的信息/數(shù)據(jù)和目前試驗(yàn)中得到的數(shù)據(jù)結(jié)合在一起,從而得到一個(gè)用來總結(jié)這些信息/數(shù)據(jù)的新的分布函數(shù)(后驗(yàn)分布),并基于此后驗(yàn)分布函數(shù)做出統(tǒng)計(jì)推斷的方法。前期試驗(yàn)的信息/數(shù)據(jù)可以基于目前試驗(yàn)中將要檢驗(yàn)的藥物,也可以基于其他相關(guān)的藥物。
?在臨床試驗(yàn)中,首要任務(wù)是要得到一個(gè)準(zhǔn)確和可靠的藥物療效估計(jì)。有時(shí)可以用一個(gè)先驗(yàn)分布來總結(jié)前期試驗(yàn)的信息/數(shù)據(jù)得到一個(gè)藥物療效的初始估計(jì)。因?yàn)榍捌谠囼?yàn)的信息/數(shù)據(jù)不夠充分或有其他的不確定性,其本身不能夠得到一個(gè)準(zhǔn)確和可靠的療效估計(jì),需要在目前的試驗(yàn)中收集更多的數(shù)據(jù)。根據(jù)新收集的數(shù)據(jù),對(duì)療效的初始估計(jì)(先驗(yàn)分布)進(jìn)行更新并得到一個(gè)新的估計(jì)(后驗(yàn)分布)。用貝葉斯方法得出的療效估計(jì)??梢暈榍捌谠囼?yàn)的信息/數(shù)據(jù)和目前試驗(yàn)的數(shù)據(jù)以某種特定方式而做出的加權(quán)平均,即如果沒有目前試驗(yàn)的數(shù)據(jù),療效估計(jì)就會(huì)全部基于前期試驗(yàn)的信息/數(shù)據(jù);如果有目前試驗(yàn)的數(shù)據(jù),療效估計(jì)就是一個(gè)加權(quán)平均。目前試驗(yàn)的數(shù)據(jù)的權(quán)重會(huì)隨著其數(shù)據(jù)量的增加而加大,并向1趨近。
?本指導(dǎo)原則中討論的使用基于頻率理論的適應(yīng)性設(shè)計(jì)大都可用于貝葉斯適應(yīng)性設(shè)計(jì)。由于貝葉斯方法在統(tǒng)計(jì)推斷中使用了前期或相關(guān)的信息/數(shù)據(jù),在某些方面它自然有其優(yōu)越性。貝葉斯方法的靈活性是可用一些統(tǒng)計(jì)模型來借用相關(guān)的數(shù)據(jù)。在很多情形下,獨(dú)自進(jìn)行一個(gè)達(dá)到合適樣本量的臨床試驗(yàn)會(huì)比較困難,若用貝葉斯方法來借用相關(guān)的數(shù)據(jù)從而得到更為可信的結(jié)論或許有其必要性。例如,兒童的臨床試驗(yàn)中借用成人臨床試驗(yàn)中的數(shù)據(jù);在罕見病中由于無法入組足夠多的病人而借用類似的疾病適應(yīng)癥的數(shù)據(jù);在某一區(qū)域沒有入組足夠的病人而借用相鄰區(qū)域的數(shù)據(jù);在一個(gè)非劣性臨床試驗(yàn)中借用過去試驗(yàn)中的數(shù)據(jù)從而減少對(duì)照組的病例數(shù)。貝葉斯方法對(duì)這些借用都會(huì)給出定量的分析和解釋。
?盡管貝葉斯方法在某些方面具有優(yōu)越性,其zui大的問題是統(tǒng)計(jì)推斷的結(jié)果有不確定性。使用同樣的前期試驗(yàn)的信息/數(shù)據(jù)和目前試驗(yàn)的數(shù)據(jù),若選擇不同的先驗(yàn)分布或者即便選擇相同的先驗(yàn)分布而使用不同的參數(shù)值,貝葉斯推斷也可能得出不同的結(jié)論。另外貝葉斯方法在zui終的統(tǒng)計(jì)推斷時(shí)也無公認(rèn)的方法來選擇決策標(biāo)準(zhǔn)。因?yàn)檫@些問題,目前貝葉斯方法更多地用于Ⅰ期臨床試驗(yàn)中藥物劑量的探索,Ⅱ期臨床試驗(yàn)中用于選擇后續(xù)研發(fā)策略,Ⅲ期臨床試驗(yàn)中的期中分析時(shí)的無效性推斷和一些預(yù)測分析,以及其他很多不以注冊為目的的分析。
?由于適應(yīng)性設(shè)計(jì)的復(fù)雜性以及基于頻率理論的統(tǒng)計(jì)方法的局限性,盡管貝葉斯方法有其不足,在一些設(shè)計(jì)中使用貝葉斯方法或許是一種更為合適的選擇。如果使用貝葉斯方法,需要有足夠的前期信息/數(shù)據(jù)、文獻(xiàn)和研究以支持所使用的統(tǒng)計(jì)模型的合理性,包括所選擇的先驗(yàn)分布及各個(gè)參數(shù)值。另外由于貝葉斯推斷基于先驗(yàn)分布和參數(shù)值的選擇而導(dǎo)致的不確定性,還需要通過大量模擬結(jié)果來說明在各種假想的,有可能在實(shí)際中發(fā)生的情形下方案的實(shí)施特性,特別是要通過模擬顯示試驗(yàn)中基于后驗(yàn)概率所定義的決策標(biāo)準(zhǔn)是否合理,例如可用對(duì)應(yīng)于基于頻率理論的統(tǒng)計(jì)方法的整體I類錯(cuò)誤率來衡量所選擇的決策標(biāo)準(zhǔn)。再者,還要考慮使用貝葉斯方法在實(shí)際中的可行性,例如如何向研究者解釋各種統(tǒng)計(jì)模型的意義,基于后驗(yàn)概率所定義的決策標(biāo)準(zhǔn)的意義,藥物療效估計(jì)的解釋,基于不等應(yīng)答適應(yīng)性概率的隨機(jī)分組是否給受試者帶來額外的安全性風(fēng)險(xiǎn),以及更新應(yīng)答適應(yīng)性概率所帶來的延遲是否會(huì)使入組的實(shí)際操作變得極其困難等問題。這里的應(yīng)答適應(yīng)性概率是指根據(jù)已入組的病人的數(shù)據(jù)計(jì)算出的各個(gè)試驗(yàn)組的療效,并以此概率來重新更新未來病人的隨機(jī)入組的比例。
?鑒于貝葉斯方法中面臨的許多挑戰(zhàn),若采用貝葉斯方法,需要仔細(xì)和慎重考慮以上所討論的各種問題,事先做好研究和規(guī)劃。
(二)模擬方法的應(yīng)用
?基于模擬方法的適應(yīng)性設(shè)計(jì)是指在適應(yīng)性試驗(yàn)中,基于模擬方法考察所做統(tǒng)計(jì)推斷的合理性。在臨床試驗(yàn)中,統(tǒng)計(jì)檢驗(yàn)是在統(tǒng)計(jì)假設(shè)下基于某個(gè)分布理論或近似的正態(tài)分布理論而做出的統(tǒng)計(jì)推斷。這些分布理論或近似的正態(tài)分布理論所要求的條件在傳統(tǒng)的臨床試驗(yàn)中一般都會(huì)得到滿足。為了適應(yīng)藥物研發(fā)的需求,許多新穎、復(fù)雜的試驗(yàn)設(shè)計(jì)不斷出現(xiàn),例如主方案試驗(yàn)同時(shí)涉及多個(gè)目標(biāo)人群、多個(gè)假設(shè)、多個(gè)終點(diǎn)或多重檢驗(yàn),這對(duì)推導(dǎo)統(tǒng)計(jì)檢驗(yàn)的分布理論提出了新的挑戰(zhàn)。在很多極其復(fù)雜的試驗(yàn)中,基于分布理論的條件有可能不再滿足,因此借助模擬方法來建立統(tǒng)計(jì)推斷所需要的依據(jù)經(jīng)常是唯yi的選擇。
?統(tǒng)計(jì)模擬試驗(yàn)的zui大優(yōu)點(diǎn)是在假設(shè)的臨床試驗(yàn)情形下能更好地了解試驗(yàn)特性。具體到臨床試驗(yàn)的模擬,重要的是,怎樣選擇模擬的模型和參數(shù)使其盡可能合理地描述試驗(yàn)在實(shí)際中發(fā)生的情形,并能夠控制整體I類錯(cuò)誤率。因?yàn)橛泻芏嚓P(guān)于統(tǒng)計(jì)模擬的文獻(xiàn)可供參考,其涉及的模擬方法、計(jì)算機(jī)語言、模擬軟件、模擬誤差的控制等諸多計(jì)算細(xì)節(jié)就不在此一一討論。
?若無明確的分布理論依據(jù),通過模擬方法來證明臨床試驗(yàn)中統(tǒng)計(jì)檢驗(yàn)的整體I類錯(cuò)誤率能在零假設(shè)下完全得到控制從理論上來說是不可能的。整體I類錯(cuò)誤率涉及整個(gè)零假設(shè)空間,即假設(shè)試驗(yàn)和對(duì)照藥物療效相同,這從理論上來說有無窮的可能性,故任何一個(gè)模擬都無法窮舉所有的情形以便驗(yàn)證。怎樣在模擬中排除一些明顯不合理的情形使其更符合實(shí)際,則需要從疾病特征和歷史數(shù)據(jù)來考慮,并使基于縮小的零假設(shè)空間的模擬結(jié)果從統(tǒng)計(jì)角度仍具有可靠性。另外在模擬時(shí),除了考慮怎樣選擇主要參數(shù)外,還要考慮滋擾參數(shù)、入組率、脫落率/刪失率、隨訪時(shí)間和模擬的準(zhǔn)確率等諸多其他因素。在選擇這些參數(shù)后,再加入適應(yīng)性設(shè)計(jì)中涉及的各種修改,以及有可能涉及的多個(gè)目標(biāo)人群、多個(gè)終點(diǎn)和多重檢驗(yàn),以便顯示所提出的統(tǒng)計(jì)方法在臨床試驗(yàn)中經(jīng)過多重調(diào)整后的I類錯(cuò)誤率仍可得到控制。
?鑒于基于模擬方法的統(tǒng)計(jì)推斷具有不確定性,除非應(yīng)用的適應(yīng)性設(shè)計(jì)非常有必要,并且比傳統(tǒng)的臨床試驗(yàn)確有很大的優(yōu)勢,否則需要綜合各個(gè)方面的因素再進(jìn)行慎重地選擇。如果有充足的醫(yī)學(xué)文獻(xiàn)、前期的數(shù)據(jù)等證據(jù)顯示應(yīng)用適應(yīng)性設(shè)計(jì)具有必要性,并且可靠的模擬方法、模擬結(jié)果顯示適應(yīng)性設(shè)計(jì)確實(shí)具有很大的優(yōu)越性,則可以考慮一個(gè)基于模擬方法的適應(yīng)性設(shè)計(jì)。
?五、監(jiān)管的考慮
?鑒于適應(yīng)性設(shè)計(jì)的復(fù)雜性,申辦方應(yīng)在設(shè)計(jì)試驗(yàn)時(shí)及早與監(jiān)管部門溝通,以便爭取更多的時(shí)間用來完善方案。
(一)與監(jiān)管部門的溝通
?對(duì)于以探索性研究為目的的適應(yīng)性設(shè)計(jì),不一定需要與監(jiān)管部門溝通交流。但是,若試驗(yàn)有可能影響很多受試者的安全性,如病例數(shù)較大的主方案試驗(yàn);或試驗(yàn)的早期以探索性研究為目的,但晚期有可能演化成以確證性研究為目的,則有必要與監(jiān)管部門進(jìn)行溝通交流。通常以確證性研究為目的的適應(yīng)性設(shè)計(jì)都應(yīng)與監(jiān)管部門提前進(jìn)行溝通交流,以便在設(shè)計(jì)早期有充分的時(shí)間考慮監(jiān)管部門的建議、顧慮或意見,尤其是對(duì)于復(fù)雜或采用了全新方法的設(shè)計(jì)。凡經(jīng)備案的與監(jiān)管部門達(dá)成的一致意見應(yīng)反映在修訂的試驗(yàn)方案中。
(二)對(duì)申報(bào)資料的要求
?申辦方準(zhǔn)備遞交的資料應(yīng)包含所有用來支持采用適應(yīng)性設(shè)計(jì)的理論、文獻(xiàn)和數(shù)據(jù)以便監(jiān)管部門審評(píng)。資料的準(zhǔn)備應(yīng)主要圍繞預(yù)先設(shè)定的調(diào)整計(jì)劃,充分論述醫(yī)學(xué)意義、合理性、完整性和可行性。
?醫(yī)學(xué)意義是判斷采用適應(yīng)性設(shè)計(jì)是否合適的重要因素。申報(bào)資料中應(yīng)包含用來支持調(diào)整后試驗(yàn)結(jié)果仍然具有醫(yī)學(xué)意義的充分證據(jù)。比如,在經(jīng)過一次或多次調(diào)整后,對(duì)試驗(yàn)結(jié)果的解釋有可能變得非常困難,或者試驗(yàn)結(jié)果zui終達(dá)到統(tǒng)計(jì)學(xué)陽性但無醫(yī)學(xué)意義。
?合理性主要針對(duì)的是統(tǒng)計(jì)方法,zui重要的判斷標(biāo)準(zhǔn)是所使用的統(tǒng)計(jì)方法能否將整體I類錯(cuò)誤率控制在雙側(cè)0.05(或單側(cè)0.025)的水平。申報(bào)資料中應(yīng)包括預(yù)先設(shè)定的調(diào)整計(jì)劃,所有調(diào)整的程序和細(xì)節(jié),以及所引用的全部文獻(xiàn)。如果適應(yīng)性設(shè)計(jì)極為復(fù)雜且無具體的理論公式,可能需要通過模擬方法來說明。申辦方在計(jì)劃時(shí)需要考慮模擬結(jié)果能否經(jīng)過第三方獨(dú)立的驗(yàn)證。
?完整性考慮的是試驗(yàn)的操作和執(zhí)行,判斷標(biāo)準(zhǔn)是所使用的設(shè)計(jì)不會(huì)因操作或執(zhí)行引入偏倚。申報(bào)資料中應(yīng)包含所有操作流程,特別是怎樣設(shè)定防火墻以保證分析結(jié)果不被泄露。對(duì)于數(shù)據(jù)監(jiān)查委員會(huì)負(fù)責(zé)的適應(yīng)性調(diào)整,可參考其他相關(guān)的指導(dǎo)原則。
?可行性旨在評(píng)估試驗(yàn)可能要做的適應(yīng)性修改能否在實(shí)際中實(shí)施,這一點(diǎn)需要申辦方做出綜合判斷。
?以上只是申報(bào)資料應(yīng)該包含的基本內(nèi)容。如果申辦方認(rèn)為還有其它資料有助于與監(jiān)管部門的溝通交流,也可一并申報(bào)遞交。
(三)其他的考慮
?原則上,適應(yīng)性設(shè)計(jì)中的修改計(jì)劃必須在臨床試驗(yàn)開始前的試驗(yàn)方案和統(tǒng)計(jì)分析計(jì)劃中預(yù)先設(shè)定。一般來說不建議對(duì)試驗(yàn)進(jìn)行非預(yù)先設(shè)定的修改。但在臨床試驗(yàn)的操作實(shí)踐中,基于本試驗(yàn)中的數(shù)據(jù)提示需要對(duì)試驗(yàn)進(jìn)行非預(yù)先設(shè)定的修改,此時(shí)應(yīng)經(jīng)過謹(jǐn)慎考慮后在保證不破壞試驗(yàn)的合理性、完整性及可行性的前提下對(duì)試驗(yàn)做出合理的修改,并需提前與監(jiān)管機(jī)構(gòu)進(jìn)行溝通確認(rèn)。此外,基于外部數(shù)據(jù)對(duì)于一個(gè)進(jìn)行中的臨床試驗(yàn)做出某些修改,并不屬于適應(yīng)性修改,而是通過試驗(yàn)方案的修正案來體現(xiàn),通常需與監(jiān)管部門進(jìn)行溝通。根據(jù)外部數(shù)據(jù)對(duì)試驗(yàn)方案進(jìn)行修改的情形有很多,例如,某試驗(yàn)中對(duì)標(biāo)志物為陰性的病人藥物毒性太大或者同一類藥物剛完成的試驗(yàn)顯示僅對(duì)標(biāo)志物為陽性的病人有效,需要修改目標(biāo)人群僅為陽性病人;同一類藥物剛完成的試驗(yàn)顯示某主要終點(diǎn)的選擇不合適,或新發(fā)布的相應(yīng)指南對(duì)主要終點(diǎn)另有定義,需要修改主要終點(diǎn);新的標(biāo)準(zhǔn)治療的改變,需要修改標(biāo)準(zhǔn)治療的對(duì)照組,或因無法繼續(xù)入組病人而需要提前終止試驗(yàn)。申辦方尤其要注意這些修改是僅基于外部數(shù)據(jù),而非基于進(jìn)行中的試驗(yàn)本身的結(jié)果。
?參考文獻(xiàn)
1.CDE. 臨床試驗(yàn)數(shù)據(jù)監(jiān)查委員會(huì)的建立和實(shí)施指導(dǎo)原則. 2020
2.Bauer P, K?hne K. Evaluation of experiments with adaptive interim analyses. Biometrics1994; 50:1029–1041, correctioninBiometrics1996; 52:380.
3.Bauer P,Kieser M. Combining different phases in the development of medical treatments within a single trial. Statistics in Medicine 1999; 18: 1833-1848.
4.Bauer P,Posch M. Letter to the Editor. Modification of the sample size and the schedule of interim analyses in survival trials based on data inspections by H. Schaefer and H.-H. Mueller, Statistics in Medicine 2001; 20: 3741–3751. Statistics in Medicine 2004; 23: 1333–1335.
5.Chang M. Adaptive design method based on sum of p-values. Statistics in Medicine 2007; 26:2772–2784.
6.Chen C, Li X, Li W, Beckman RA. Adaptive Expansion of Biomarker Populations in Phase 3 Clinical Trials. Contemporary Clinical Trials2018;71:18-85.
7.ChenJYH, DeMets DL, Lan GKK. Increasing the sample size when the unblinded interim results is promising. Statistics in Medicine 2004; 23:1023-1038.
8.ChowSC, Chang M. Adaptive Design Methods in Clinical Trials. CRC Press;2nd edition 2011.
9.Chow SC, Shao J, Wang H, Locknygina Y. Sample size calculations in clinical research. Chapman & Hall/CRC, 3rd edition2018.
10.Cui L, Hung HMJ, Wang SJ. Modification of sample size in group sequential clinical trials. Biometrics 1999; 55:853-857.
11.EMA Scientific Guidelines: Reflection paper on methodological issues in confirmatory clinical trials planned with an adaptive design. https://www.ema.europa.eu/en/human-regulatory/research-development/scientific-guidelines;2007.
12.FDA Draft Guidance for Industry. Adaptive Designs for clinical trials of drugs and biologics. https://www.fda.gov/drugs/guidances-drugs/all-guidances-drugs2018.
13.Friede T, Kieser M. Sample size recalculation in internal pilot study designs: a review. Biometrical Journal2006;48:537–555.
14.Friede T, Parsons N, Stallard N. A conditional error function approach for subgroup selection in adaptive clinical trials.Statistics in Medicine2012; 31:4309–4320.
15.Friede T, Stallard Nigel. A comparison of methods for adaptive treatment selection. Biometrical Journal 2008;50:767–781.
16.Gould AL. Interim analyses for monitoring clinical trials that do not materially affect the Type I error rate. Statistics in Medicine 1992; 14:1039-1051.
17.HochbergY. A sharper Bonferroni procedure for multiple tests of significance. Biometrika1988; 75: 800–802.
18.Jenkins M, Stone A, Jennison C. An adaptive seamless phase II/III design for oncology trials with subpopulation selection using correlated survival endpoints. Pharmaceutical Statistics 2011; 10:347–356.
19.Lan KG,DeMetsDL.Discrete Sequential Boundaries for Clinical Trials. Biometrika1983; 70:659–663.
20.Lehmacher W, Wassmer G. Adaptive sample size calculations in group sequential trials. Biometrics 1999; 55: 1286–1290.
21.Maca J, Bhattacharya S, Dragalin S. et al.Adaptive Seamless Phase II/III Designs Background, Operational Aspects, and Examples. Drug Information Journal 2006; 40: 463-474.
22.Marcus R, Peritz E, Gabriel KR. On closed testing procedures with special reference to ordered analysis of variance.Biometrika1976; 63:655–660.
23.Müller HH, Sch?fer H. Adaptive group sequential designs for clinical trials: Combining the advantages of adaptive andof classical group sequential approaches. Biometrics2001; 57:886–891.
24.Müller HH, Sch?fer H. A general statistical principle for changing a design any time during the course of a trial. Statistics in Medicine2004; 23:2497–2508.
25.O’Brien PC, Fleming TR. A Multiple Testing Procedure for Clinical Trials.Biometrics 1979; 549–556.
26.Pocock SJ, Group Sequential Methods in the Design and Analysis of Clinical Trials. Biometrika 1977; 64:191–199.
27.Proschan MA, Hunsberger SA. Designed extension of studies based on conditional power. Biometrics 1995; 51:1315–1324.
