QRPEM – NLMEの母集団PK/PD解析法における 高確度で高精度かつ

QRPEM – NLMEの母集団PK/PD解析法における
高確度で高精度かつ効率的な新しい標準手法
Bob Leary, Mike Dunlavey, Jason Chittenden, Brett Matzuka, Serge Guzy
要約: 最新バージョンのPhoenix® NLME™には、
高い確度を有する尤度EM推定法であるQRPEM
(Quasi-random Parametric Expectation
Maximization; 疑似ランダムパラメトリック期待値
最大化)が新たに導入されています。この手法が属
するものと同一のパラメトリックEM法の一般的ク
ラスには、NONMEM 7におけるIMPEM、S-ADAPT
におけるMCPEM、MONOLIX、S-ADAPTおよび
NONMEM 7におけるSAEMが含まれます。QRPEM
以外のEM法では期待値算出ステップにおけるコア
サンプリング法として確率的モンテカルロサンプリ
ング法が用いられるのに対し、QRPEM法では低ひ
ずみ(別称「疑似ランダム」)Sobol数列が用いられ
るという点が異なります。QRサンプリングが理論上
最も正確になるケースでは、Nをサンプル数とする
と、誤差はN-1に従って減少します。これは、N-1/2
に従って誤差が減少する確率的サンプリングの特性
に比べ、誤差の減少速度が速く、非常に有利である
ことを示しています。母集団PK/PD NLMEドメイン
で一般的に生じるタイプの問題の基本的特性として
は、サンプリングされる関数の次元が相対的に低い
ことや、平滑度が高いことが挙げられます。これは、
QR法の活用における理想的なケースとして知られ
ており、最も優れたケースであるN-1の誤差減衰挙動
が実際に起こり得ることが示唆されます。
次に、QRPEMの特徴として、SIR
(sampling-importance-resampling)を使用してい
る点が挙げられます。SIRは、各被験者の事後分布の
平均および共分散行列の推定値に基づく単純なEM
での更新では固定効果を決定できないモデルの解析
効率を、著しく向上させます。こうしたモデルには、
非線形共変量モデル、絶対誤差および比例誤差の混
合残差誤差モデルおよび独立した固定効果といった、
よく発生するケースが含まれます。また、構造パラ
「QRPEM 法は、期待値算出ステップにおけるコアサンプリング法として
低ひずみ Sobol 数列が用いられるという点が異なります。」
メーターの一部もしくは全部が指定されない、もし
くは指定できない、「μモデリング」と呼ばれるケー
スも、一般的には含まれます。こうしたケースでは、
解析コストの高い補助的な対数尤度最適化法を導入
することにより、それらのモデルにおける固定効果
が繰り返し更新されます。この最適化法は、全ての
推定手法の中でも最も高い解析コストを発生させる
傾向がありますが、SIRアルゴリズムを使用すれば、
サイズおよび複雑性が著しく低下し、結果的には全
体の実行時間が大幅に短縮されます。
この白書では、いくつかの基本的背景および歴史的
文脈を提供することに加え、以下の内容を証明する
一連の検証結果を示します。 a) 「高確度な尤度」
のパラメトリック EM 法は、FOCEI といった近似尤
度法に比べて理論上有利とされていますが、その有
利性が実践においても実際に得られること。 b)
QR サンプリングは MC サンプリングに比べて理論
上有利とされていますが、この有利性が、尤度およ
びパラメーターの推定値の改善(真の最大尤度によ
り接近)という形で実際に得られること。 c) SIR
アルゴリズムが解析効率の向上に著しく効果的であ
ること。
序論
母集団PK/PDの方法論における至高の目標とは、フ
ァーマコメトリクスのコミュニティで一般的に見ら
れるタイプのモデルおよびデータセットに対し、最
大尤度(ML)パラメーターの推定値を妥当な反復回
数で確実に算出する、NLMEアルゴリズムです。ML
推定には最適な統計的性質が数多く存在し、少なく
とも、ファーマコメトリクス解析で重要となる統計
量に対して(ベイズとは対照的に)最も頻繁に用い
られるアプローチにおいては、最も望ましい推定タ
イプであると、通常は見なされます。
最も幅広く用いられている解析方法としては、1978
年に初めて発表されたNONMEMにFOが導入され
ていたことから始まり、最新バージョンの
NONMEM、SPLUS、RおよびSASに導入されてい
るFOCE、FOCEI、LAPLACEまで続きますが、残
念ながらこれらの方法は上記の目標を達成するには
非常に不十分でした。これらの解析方法は最尤法ア
プローチに基づいていますが、周辺尤度を正確に算
出することが困難であるため、様々な精度の尤度近
Certara
pg. 2
似を採用しています。FOの場合には近似の相対的な
精度が低い場合が多く、それに対応して、FO推定の
全体的な精度も非常に低くなる可能性があります
(驚くほど低精度になる場合もあります)。一般的
に、FOCE推定法(特にFOCE with Interaction)お
よびLAPLACE推定法は、FOより高い精度を通常は
示しますが、それでも真のML推定の精度レベルには
達しません。特定の近似尤度法を使用することで損
なわれる確度の程度については、前もって知る方法
がありません。しかし、例えば、モデルの非線形性
の度合いが大きい場合や、構造パラメーターの母集
団分布における個体間変動が大きい場合、残差誤差
の分散が大きい場合、被験者1名あたりの観測値が構
造パラメーターの個数に比べて相対的に少ない形式
のスパースデータの場合には、いずれも確度が大き
く損なわれる傾向があります。実際の解析では、こ
のようなタイプの困難さを伴う状況にしばしば遭遇
します。
近似尤度法で、確度が損なわれることに加えて主に
問題となるのは、信頼性の低さです。いずれの近似
尤度法でも、数値的に微妙かつ失敗しやすい、勾配
に基づく形式的な尤度最適化法が用いられます。条
件付き法では、各反復回における最高レベルの周辺
尤度目的関数の評価に、それより低レベルの最適化
が多数含まれている場合には、入れ子化された最適
化スキームが用いられるため、特に脆弱です。
過去5年間で、様々なバージョンの確率的EM(期待
値最大化)アルゴリズムに基づく新たなNLME母集
団PK/PD法が、幅広く使用できるようになりました。
これらの解析方法は、伝統的な近似尤度法に取って
代わる、より優れた選択肢となる可能性があるとし
て、ファーマコメトリクスコミュニティにおける需
要が増し始めています。高い確度を有する新たな尤
度法には主に2つのタイプがありますが、その内の1
つは一般的にはMCPEM(Monte Carlo Parametric
Expectation Maximization; モンテカルロパラメト
リック期待値最大化)と呼ばれており、NONMEM 7
ではIMPEM(importance sampling PEM; 重点サ
ンプリングPEM)、S-ADAPTおよびPDx-MCPEM
ではMCPEMとして実装されています。これら3つは
全て、Eステップの重点サンプリング法を用いたモン
テカルロ積分の実装に基づいており、基本的には同
一です。もう一方のタイプはSAEM(stochastic
approximation EM; 確率的近似EM)と呼ばれてお
Phoenix NLME
Copyright © Certara, L.P. 2011
「次に、特徴的な QRPEM の特性として、
SIR(sampling-importance-resampling)アルゴリズムを使用している点が
挙げられます。SIR アルゴリズムは解析効率を著しく向上させます。」
り、これにはEステップのマルコフ連鎖モンテカルロ
法が実装されています。これは、異なる形式で実装
されてはいるものの、NONMEM 7、S-ADAPTおよ
びMONOLIXにおけるSAEMと本質的には同一のバ
ージョンです。
MCPEM および SAEM は、古典的な尤度法に関連す
る確度の問題および信頼性の問題の両方に対応して
います。これらの EM 法では周辺尤度を高い確度で
評価できるため(MCPEM の場合には、確度のレベ
ルは、ユーザーが設定するサンプルサイズパラメー
ターに依存します)、近似法で生じる固有のバイア
スおよび確度上の問題の多くを防げます。また、こ
れらの EM 法では、周辺尤度を最大化する際に形式
的な数値最適化法が用いられません(一部のケース
では、固定効果の推定値を得る際にいくらかの数値
的最適化が必須ですが、これは、条件付き近似尤度
法で必要となる入れ子化された最適化法に比べると、
はるかに頑健かつ信頼性が高い傾向があります)。
したがって、パラメトリック EM 法では、周辺尤度
の近似における直接的数値最適化に固有である致命
的なエラーの大半が防がれます。
近似尤度法とは異なり、MCPEMおよびSAEMでは、
恣意的に長時間を解析に費やせば少なくとも原理上
は真の最尤推定値に収束することになります。勿論、
実践では、いずれのアルゴリズムも妥当な実時間の
範囲内で終了させる必要があるため、実際の結果は
真のML推定の目標値には幾分か及ばない可能性が
あります。しかし、MCPEMおよびSAEMでは、近
似尤度法と同程度以下の解析時間でも近似尤度法よ
り優れた推定値が生成される場合が多いこと、また、
数値的信頼性が近似尤度法に比べてはるかに高く、
かつ安定していることが、実績として示されていま
す。
MCPEMおよびSAEMはいずれも、モデルの構造パ
ラメーターにおけるより妥当かつ尤もらしいサンプ
ル値の集合を、それらのパラメーターの条件付き分
布から連続的に発生させることにより、機能します。
最も基本的なケースでは、発生した値の平均および
共変量行列を算出する単純な代数式を適用すること
により、固定効果の推定値(θ)、ランダム効果パラ
メーター(ω)および残差誤差パラメーター(σ)が、
反復回ごとに算出されます。MCPEMとSAEMの主
な違いは、条件付き分布のサンプリング方法です。
Certara
Copyright © Certara, L.P. 2011
通常、MCPEMでは、重点サンプリングによって一
度に数百個(もしくはそれ以上)のサンプルが各被
験者の条件付き分布から収集され、収集されたサン
プルの平均および共分散を元にして、興味のあるパ
ラメーターが更新されます。SAEMでは、マルコフ
連鎖モンテカルロ法により条件付き分布からサンプ
リングが行われ、特に被験者1名あたりのサンプル個
数が1個である場合にはMCPEMよりはるかに高頻
度で更新が行われます。SAEMのパラメーター推定
値は、連続的反復過程全体におけるこうした小さな
サンプルの平均および共分散の移動平均として、最
初のバーンイン期間の後に得られます。
いずれのEM法も本質的には確率論に基づいており、
原理上は、確度および精度を上げて単純により多く
のサンプルを得るか(MCPEM)、もしくはより多
くの反復を実行することにより(SAEM)、真の最
尤推定値に近い結果が恣意的に得られます。一般的
には、確率的尤度推定に関連する誤差(不確度性)
は、サンプルサイズ(もしくは、SAEMの場合には
反復回数)Nが増加するに従って、N-1/2で減少する
のが通常です。そのため、尤度誤差を10分の1に減ら
すためには、サンプルサイズを100倍に増やす必要が
あります。
近年、低ひずみSobol数列(特定のタイプのいわゆる
疑似乱数(QR)、もしくはそれらに対するより近年
の一般化法である(T, M, S)-net)に基づくサンプリ
ング方法論が、MCPEMと同種の重点サンプリング
アルゴリズムに対して適用されました。疑似ランダ
ムサンプリングでは、MCPEMのパラメーター更新
式に入力される平均および分散の算出における誤差
減衰挙動が、理論上はおよそN-1まで大幅に改善され
ます。この理論上の挙動が実際の解析でも実現され
るならば、これは非常に大きな利点です。例えば、
被験者1名あたりの観測値数が比較的少ないスパー
スデータセットから「優れた」EM推定を得たい場合
には、それより密度の高いデータの場合に比べ、よ
り集中的にサンプリングを行う必要があることが一
般的です。個々の積分レベルでは、被験者1名あたり
500個という、実践ではよくある極めて小さなサイズ
のQRサンプルから生じる数値積分の確度が、10万個
超という実用性の限度を超えたレベルのサンプルサ
イズのモンテカルロ(MC)ランダムサンプルからの
数値積分の確度に等しくなる可能性が、理論上はあ
ります。この新たなアルゴリズムはQRPEMと呼ば
Phoenix NLME
pg. 3
「SIR アルゴリズムは、最も情報量の多いポイントを理論上妥当な方法で
選択することによりサンプルポイントを削減する手法です。」
れており、最新版のPhoenix NLMEに導入されてい
ます。
次に、QRPEM の特徴として、SIR(SamplingImportance-Resampling)アルゴリズムを使用して
いることが挙げられます。SIR アルゴリズムは我々
の知る限り、他のいずれのパラメトリック EM アル
ゴリズム(MCPEM、IMPEM もしくは SAEM)で
も使用できません[7, 8]。最も単純なケースでは、全
ての構造パラメーターを「μ モデル化」、つまり、
母平均値(通常は、単一の固定効果もしくは線形共
変量モデル形式での固定効果の線形結合)とランダ
ム効果との和として表現することができます。この
場合には、固定効果に対する反復 EM パラメーター
更新式は非常に単純な形をとり、各被験者の構造パ
ラメーターの事後分布における平均および共分散行
列の推定値から直接算出できます。しかし、非線形
共変量モデル、絶対誤差および比例誤差の混合残差
誤差モデル、もしくは単に、構造パラメーターの定
義においてランダム効果と対になっていない独立し
た固定効果が含まれるモデルといった、多くのケー
スでは、別の方法を用いてそうした固定効果の推定
値を更新する必要があります。
このようなケースで、NM IMPEMおよびPhoenix
QRPEMの両方で用いられる共通したアプローチの
1つは、これらの固定効果における補助的な対数尤度
関数の最適化です。この対数尤度関数は残差誤差モ
デルに基づいており、全体的な推定過程の確度を損
なうような近似および入れ子化された最適化が一切
必要ありません。しかし、この補助的な対数尤度関
数はかなり複雑になる可能性があり、被験者/サン
プルポイントの各組み合わせから発生する数十万個
もの項が容易に組み込まれてしまいます。これらの
補助的解析は、通常は解析全体に影響を及ぼします。
例えば、NONMEMのIMPEMでは、同等なμモデル
形式および非μモデル形式で表現可能なモデルを完
了するためにかかる時間は、後者の形式の場合には
前者の形式の場合の数倍になることが殆どです。SIR
アルゴリズムは、最も情報量の多いポイントを理論
上妥当な方法で選択することによりサンプルポイン
トを削減する(したがって、補助的対数尤度におけ
る項の個数を削減する)手法です。
この新たなアルゴリズムは QRPEM と呼ばれ、現在
リリースされている Phoenix® NLME™に導入され
Certara
pg. 4
ています。本白書では、QRPEM を歴史的文脈の中
で捉え、QR サンプリングおよび SIR 法の利点を説
明するいくつかの単純なテストケースを紹介します。
NLMEの解析手法の歴史的概要および誤差ス
ケーリング挙動の重要性に関する検討
パラメトリック母集団PK/PD推定法として幅広く用
いられることとなった最初の解析法は、1978年に
NONMEMの最初のバージョンに導入されたFOで
した。FOは、一致性がないといった非常に貧弱な統
計学的特性が現在では知られているにも関わらず未
だに幅広く用いられている、唯一の手法です。一致
性のある母集団NLMEの解析法には、基本構造とな
るモデルが正しい場合に被験者数および被験者1名
あたりの観測回数の両方を無限に増加させると、推
定値が真のモデルパラメーター値に収束するという
特徴があります。南カリフォルニア大学のAlan
Schumitzkyは、FOには一致性がないだけではなく、
被験者数および被験者1名あたりのデータ量を無限
に増加させるとFO推定が恣意的に粗悪な値へと収
束する可能性が現実にあるという残念な性質がある
ことを、証明しました。ただしFOは、近似尤度法の
中で最も高速かつ数値的信頼性が高く、また、モデ
ルが複雑である場合には結果を算出できる唯一の近
似尤度法である場合もあるため、統計学的特性が貧
弱であるにも関わらず、現在でも用いられています。
1990年代以降、より優れた確度のFOCE、FOCE-I
およびLAPLACE近似尤度法がNONMEM、SPLUS、
RおよびSASに導入されました。これらの方法は、
FOに比べて、統計学的特性ははるかに優れています
が、解析コストがはるかに高い上に、数値的安定性
および信頼性は非常に低く、特に、スパースデータ
の場合や、個人間変動の大きい場合および非常に非
線形なモデルの場合には、バイアスのかなり大きい、
不正確な結果となる可能性もあります。しかし、
FOCE-Iは、現在使用可能な手法の中では、おそらく
最も幅広く用いられる母集団PK/PD解析法です。
実践上の確度が優れている尤度法の中で最初に幅広
く使用可能になった手法は、1991年に南カリフォル
ニア大学のSchumitzkyが導入したNPEM
(NonParametric EM; ノンパラメトリックEM)で
す[1]。この手法は、ランダム効果の分布を仮定しな
い点が、より一般的なパラメトリック法と根本的に
Phoenix NLME
Copyright © Certara, L.P. 2011
「Phoenix NLME の QRPEM 法は、既存の PEM 法を大幅に改良した
バージョンであり、はるかに洗練された効率的な重点サンプリングが
用いられています。」
異なります。NPEMは、比較的貧弱な誤差スケーリ
ング特性を持つ、グリッドに基づいた手法であり、
ランダム効果の個数をd、使用するグリッドポイント
数をNとすると、誤差はN-1/dに従って減少します。
そのため、非常に高確度な結果が求められている場
合には、NPEMの解析コストが特に高くなる可能性
があります。例えば、2000年にBob Learyは、カリ
フォルニア大学サンディエゴ校(UCSD)で、当時
の世界最速の非機密スーパーコンピュータであった
サンディエゴスーパーコンピュータセンター(SDSC)
のBlue Horizonに、NPEMを実装させました。これ
まで試みられてきた中でおそらく最も高い解析負荷
を持つ単一の母集団PK/PDジョブとして、6つのラン
ダム効果および数千万個のグリッドを伴うピペラシ
リンの高確度NPEMモデルを、およそ2300CPU時間
(1152個のプロセッサで実時間2時間)で実行するこ
とに成功しました。Learyは、誤差スケーリング特性
の重要性を示すものとして、NPAG(non-parametric
adaptive grid; ノンパラメトリック適応型グリッド)
と呼ばれるはるかに効率的なバージョンを、後に開
発しました。NPAGでは、NPEMと同様に厳密なノ
ンパラメトリック尤度が用いられますが、誤差スケ
ーリング挙動がおよそ1/(反復回数)まで改善され、
ほんの少数のグリッドポイントのみが用いられます。
NPAGでは、2000CPU時間超の大規模なNPEG解析
よりさらに高確度なピシラシリンのモデル推定値を、
単一のPC上で10分未満で一から算出できました。こ
のNPAGの改良バージョンが、Phoenix NLMEに現
在実装されているノンパラメトリック法です。
高確度尤度パラメトリック法が最初に登場したのは
2000年代前半で、当初は研究レベルでの実装として
導入されました。Bob BauerおよびSerge Guzyは、
現在のS-ADAPTおよびNONMEMの重点サンプリ
ングEM法の前身である、MCPEMを開発しました。
UCSD/SDSCのBob Learyは、疑似ランダムサンプリ
ング法を導入することによりMCPEMに比べてはる
かに粗いバージョンの重点サンプリングを行う、
PEM(Parametric EM method; パラメトリックEM
法)を開発しました。後にMONOLIXへと発展する
こととなるSAEMの最初のバージョンは、B. Delyon、
M. LavielleおよびE. Moulines(および彼らに続く貢
献者ら)によって、フランスで導入されました。
2004年には、これらの高確度尤度法は既に大きな注
目を集め、フランスの保健医療研究局である
Certara
Copyright © Certara, L.P. 2011
INSERMの後援により、SAEM、PEMおよび
MCPEMの相互比較や、古典的なFO、FOCEおよび
LAPLACEといった既に実装されている様々な近似
尤度法との比較を行う、手法間盲検比較演習が行わ
れました。最初の2004年の演習では、単純なEMAX
PDモデルに基づくシミュレーションを100回反復す
ることにより生成されたかなりスパースなデータセ
ットが、シミュレーションに使用されたパラメータ
ーの真の値を知らない参加者全員に配布されました。
参加者は主催者に結果を返送し、そこから解析およ
び採点が行われました。これに続く2005年の盲検比
較演習では、経口1次吸収の1コンパートメントPKモ
デルに基づいて(このモデルの「フリップフロップ」
現象を防止するための、かなり特殊なパラメーター
化を用いた上で)行われ、この時も、幾分かスパー
スなデータが用いられました。各解析方法は、承認
されたエキスパートによって実行されました(新た
なEM法の場合には、それぞれ、そのEM法の発案者
の1人が実行しました)。演習の結果は、2005年7月
にフランスのリヨンで開催された参加者全員による
会議において明らかにされ(合計で約10種の解析方
法が比較されました)、2005年にスペインのパンプ
ロナで開催されたPAGE(Population Approach
Group in Europe)でも発表されました[3]。主な評
価基準は、パラメーター推定におけるバイアスの程
度および相対的精度(データのシミュレーションに
用いられたパラメーターの推定値と真の値との間に
おける誤差の平方根)でした。3つの高確度尤度EM
法はいずれも両カテゴリーの中では最高のパフォー
マンスを示し、SAEMが最も高精度で、PEMが最も
バイアスが少ないという結果になりました。予想通
り、近似尤度法であるLAPLACEおよびFOCEはいず
れの基準についても非常に低いランクに位置付けら
れ、FOのパフォーマンスは両カテゴリーの中で圧倒
的に最下位でした。
Phoenix NLMEに現在実装されているQRPEM法は、
当初のPEM法を大幅に改良したバージョンであり、
元のバージョンに比べるとはるかに洗練された効率
的なバージョンの重点サンプリングが用いられてい
ます。このPhoenix NLMEのQRPEM法には、スタ
ンフォード大学のOwenが近年開発した「スクランブ
リング」法[6]が一部に組み込まれた、Sobol低ひずみ
数列による疑似ランダムサンプリングが実装されて
います。スクランブリング法では、基本の疑似ラン
ダムアプローチにおける数値積分のパフォーマンス
Phoenix NLME
pg. 5
「QRPEM 法は、SIR アルゴリズムが適用された最初の
PK/PD パラメトリック EM 法であり、これによって、補助的対数尤度の
算出が用いられる場合の解析パフォーマンスが大幅に向上します。」
がさらに向上します。さらにPhoenix NLMEの
QRPEM法は、SIR(Sampling-ImportanceResampling)アルゴリズム[7, 8]が適用された最初
のPK/PDパラメトリックEM法であり、これにより、
補助的対数尤度の算出から固定効果の一部もしくは
全部を推定する場合の解析パフォーマンスが大幅に
向上します。
分は、伝統的な近似尤度法で用いられる、勾配に基
づく正式な数値最適化法に比べると、大抵の場合で
はるかに安定した過程です。そのため確率的EM法は、
致命的な数値エラーを防ぐという点では、伝統的な
近似尤度法よりもはるかに信頼性が高いです。しか
し、EMアルゴリズムの推定の質および収束特性は、
これらの数値積分の確度に大きく依存します。
疑似ランダム数値積分
Nをサンプル数とすると、ランダムサンプリングに
よるMCPEMでの積分の誤差は、N-1/2に比例します。
したがって、この誤差を10分の1に減らしたい場合に
は、サンプル数を100倍に増やす必要があります。誤
差減少速度がこのように比較的緩やかである一番の
理由としては、単位d次元ハイパーキューブ全体でラ
ンダムサンプルが一様分布に完全には従わないこと
が、挙げられます。例えば、偶然、一部のエリアが
他のエリアに比べて高い密度で常に密集し、比較的
広いエリアが全くサンプリングされない可能性もあ
ります。
MCPEMといった確率的EM法では、d次元のパラメ
ーター空間全体における条件付き密度関数の数値積
分を被験者ごとに行って、正規化係数、平均および
共分散を求める必要があります。ここでは、dはラン
ダム効果の個数です。通常、NLME母集団PK/PDモ
デルにおけるdは、1から、実用的と言える限度であ
る約20までの範囲にあり、標準的には2~6となりま
す。この積分は、0~1の範囲の全座標を持つd次元の
単位ボックス(ハイパーキューブ)上での積分に必
ず変換できます。
この数値積分の値が単純な代数式に適用されること
により、モデルのパラメーター推定の更新値が算出
されます。この数値積分の確度が十分に高ければ、
更新のたびに全体の周辺尤度が向上します。数値積
直感には反するかもしれませんが、一見かなり一様
にサンプリングされているハイパーキューブ上の正
則方形グリッドも、実際には、2より大きな次元の空
間全体でのランダムサンプリングよりはるかに低い
パフォーマンスを示します。誤差の大きさはサンプ
リングポイントの数列の「ひずみ」の大きさに比例
図1:2000個の一様分布ランダムポイントによる比較的ひずみの大きい数列(左図)と、2000個の一様分布Sobol疑似
ランダムポイントによるはるかにひずみの小さい数列(右図)との比較。ひずみとは、境界四角形内で見られる、最も
大きくて方形で密度の低い空白部分の面積です。
Certara
pg. 6
Phoenix NLME
Copyright © Certara, L.P. 2011
「QRPEM アルゴリズムでは、MONOLIX 2.0 がリリースされる際に
付属する 144 個のテストケース全てについて、高確度の推定値を
算出することに成功しました。」
し、これは大まかに言うと、ハイパーキューブ内で
最も大きい方形である「ブリック」の体積です。d次
元の方形グリッドでは、ひずみが非常に大きく、か
つ、そのせいで誤差減少速度がN-1/dと非常に緩やか
である場合には、d-1次元の長さが1で残りの次元の
長さがN-1/dである多数のブリックが、ポイントの全
くない、密度の低い、スラブのような状態で残りま
す。d=5の一般的な母集団PK/PDモデルで誤差を10
分の1に減らしたい場合には、サンプル数を100,000
倍に増やす必要があります。そのため正則方形グリ
ッドは、EM法に基づく一般的なNLME母集団
PK/PD推定における実用性が比較的低くなります。
ひずみが正則グリッドもしくはランダムグリッドに
比べて小さいサンプリング法では誤差減少速度がは
るかに高速になりますが、数値積分用の代替となる
そうしたサンプリング法は、低ひずみもしくは疑似
ランダムと呼ばれるd次元数列を単位ハイパーキュ
ーブ全体に分布させることにより得られます(疑似
ランダムの数列および手法に関する、適切かつ一般
的な参考文献については、[2]を参照してください)。
図1には、単位平方上の2000ポイントの一様ランダム
分布におけるひずみが、QRPEMに使用されるタイ
プのSobol数列による2000ポイントの分布における
ひずみに比べてはるかに大きいことを、示していま
す。
低ひずみ数列の基本的な概念は比較的新しく、1960
年代の、様々な人々の貢献を起源としています。こ
の概念は、後にNiederreiterによって(t,m,s) netへと
一般化されました(そのため「ネット」は、「グリ
ッド」に類似しているものの、より一般的な意味で
用いられます)。実用的な低ひずみ数列(一般的に
は、Faure、Halton、Niederreiter、Hammersley
およびSobol数列等が含まれます)は、1960年代後半
から提唱され始めました。現在では、より一般的な
疑似乱数発生器と同程度の速度を持つ非常に高速な
実装が、様々な重要ケースに適用されています。当
初は、特に物理および金融工学における数値積分に、
主に適用されました。後にこの手法は、全てではな
いにしてもある種のモンテカルロシミュレーション
に対する、より効率的な代替手法の候補として拡張
されました(例えば、この分野は近年、Owenらによ
って「スクランブリング」[6]の概念が導入されたこ
とである程度は進展しましたが、それでも、SAEM
といったマルコフ連鎖モンテカルロ法に基づく手法
Certara
Copyright © Certara, L.P. 2011
については低ひずみ数列の適用が難しいことが知ら
れています)。
QRPEMに用いられるSobol数列は、母集団PK/PD推
定における興味の主な対象である40次元未満の低次
元空間における数値積分の問題に対して特に大きな
影響を与えることが、広く認識されています。理論
上の誤差減少速度は、Koksma-Hlawkaの不等式によ
ってN-1 [log(N)] d以上として証明されており、dが
比較的小さい場合にはN-1に効果的に近付きます。よ
り高次元では、一見、[log(N)] dの項が非常に有意と
なり、QRのパフォーマンスを低下させるように見え
る場合があります。実際に、Koksma-Hlawkaの境界
では、病理学上の非常に「粗い」関数における「最
悪のケース」の減少速度が定義されます。一般的に
母集団PK/PDでは、QR法における「スイートスポッ
ト」である、低次元の非常に平滑かつ無限微分可能
な被積分関数が扱われます。この場合、経験的には、
N-1に従った減少速度の誤差が観測されることが多
いです。
検証結果
時期間変動といった幾つかの高度な特性の開発は未
だ進行中ですが、Phoenixに現在実装されている
QRPEMアルゴリズムでは、最も一般的なタイプの
母集団PK/PD NLME推定問題に対してNLME推定
を実行できます。例えば、MONOLIX 2.0がリリース
された際に付属していた144個のテストケース全て
について、高確度の推定値を算出することに成功し
ています。
ここでは、示唆に富んだ様々な興味深いテストセッ
トから得られた結果を要約し、 a) PH-QR: QR
およびSIRの両方が実装されたPhoenix QRPEMア
ルゴリズム、 b) PH-MC: QRの代わりにMC
サンプリングが実装されたPhoenix QRPEMアルゴ
リズム、 c) PH-NS: SIR機能を使用しない標
準的なPhoenix QRPEMアルゴリズムを比較します。
これらに加えて、 d) NM-MC: NONMEM 7
IMPEMアルゴリズム(MCサンプリング、SIRなし)
の結果も含まれており、また少数のケースでは、 e)
NM SAEM: NONMEM 7 SAEMアルゴリズムの
結果も含まれます。QRPEMとMONOLIX SAEMと
の直接比較は、ここでは示しません。
Phoenix NLME
pg. 7
「Phoenix NLME の新たなエンジンである QRPEM は、
サンプルサイズ 200 以上の場合には『高確度尤度法』と見なすことが
できますが、これは MCPEM 法の場合には成立しません。」
テスト1:
単純な線形モデル
非常に単純な線形モデルが、シミュレーションされ
ました。この線形モデルは、固定効果とランダム効
果との和からなるμモデル化された2つの構造パラメ
ーターおよび絶対誤差から構成されました。
Y(T) = (THETA_a+ETA_a) +( THETA_b + ETA_b)*T + EPS
この時、Tは独立時間変数、THETA_aおよび
THETA_bは固定効果、ETA_aおよびETA_bは正規
分布ランダム効果、EPSは正規分布ランダム絶対誤
差です。データは、各被験者の様々なT値における3
個の観測値で構成され、全体の被験者数は1000名で
した。全ての固定効果がμモデル化されているため、
ここではSIRアルゴリズムを適用することができま
せん。データのシミュレーションに用いられた計画
値は、THETA_ a=THETA_b=1.0、var(ETA_a)=0.09、
var(ETA_b)=0.16、cov(ETA_a,ETA_b)=0および
var(EPS)=0.01でした。
絶対誤差に従う線形モデルの特殊なケースでは、FO、
FOCEおよびLAPLACEアルゴリズムの尤度近似は
図 2:
Certara
pg. 8
全て厳密で、これらに対応する推定手順によって厳
密な最尤(ML)推定が生成されます。この時、FOCE
によって算出される厳密なML推定により、拡張最小
2乗法の目的値(ELS OBJ)として-5769.515が得ら
れたため、この値を、様々なパラメトリックEMの結
果と比較される真のELS OBJ値のリファレンスと
します。以下のグラフに、様々なサンプルサイズの
PH-QR、PH-MCおよびNM-MCから出力された、
ELS OBJの最適値を示します(絶対誤差に従うELS
OBJ値は、ガウス応答のモデルにおける負の周辺対
数尤度の2倍を表します。これらは、NMで最小化さ
れることとなる最も一般的な形式の目的関数です)。
いずれも、反復回数が(収束に必要な回数を上回る)
100回に設定され、同一の初期条件および重点サンプ
リング分布設定から実行されました。
グラフが示す通り、PH-QRのELS OBJ値が非常に高
速に(サンプルサイズ200周辺で)真のML値へと収
束する一方、PH-MCおよびNM-MCの値はPH-QRに
比べてはるかに緩やかに収束し、サンプルサイズ800
以上でも有意な違いが見られます。したがって
PH-QRは、サンプルサイズ200以上の場合には「高
確度尤度法」と見なせますが、これはMCPEM法の
場合には成立しません。また
PH-MCは、NM-MCにほぼ等し
い結果を示しましたが、少なくと
もNM-MCの3倍の速度で常に実
行されていました。PH-QRの実
行速度は、PH-MCとほぼ同一で
した(つまり、MCサンプリング
に比べれば、QRサンプリングの
コストは無視できます)。確証は
ありませんが、PHとNMの速度
差は、EPSの分散が推定される
方法の差が原因であると推測さ
れます。EPSの分散値は、
NM-MCでは比較的高コストな
補助的尤度最適化によって推定
される一方で、PH-QRおよび
PH-MCではEMアルゴリズムの
期待値ステップから直接算出さ
れます。
結論: パラメトリックEM法が
「厳密な尤度」法として見なされ
る場合が多いにも関わらず、実際
Phoenix NLME
Copyright © Certara, L.P. 2011
「SIR アルゴリズムを実装した場合には、
Phoenix QRPEM および Phoenix MCPEM の実行速度はほぼ同一で、
反復回数が同一の場合の NONMEM MCPEM の約 8 倍でした。」
に出力される尤度値およびELS OBJ値はサンプル
サイズに従って向上する近似値であるという事実が、
この例では示されています。QRサンプリングは、
MCサンプリングに比べてはるかに小さいサンプル
サイズでほぼ正確な尤度に達し、同一の設定では、
QRの尤度近似はMCの尤度近似に比べてはるかに良
好です。
テスト2: スパースかつ非線形性の高い、困難
なEMAXモデル
結果の概要: スパースかつ非線形性の高い、困難
なEMAX PDモデル上で、PH-FOCEI(NM FOCEI
にほぼ等しい)、PH-QR、PH-MCおよびNM-MCを
比較しました。このモデルは、スウェーデンのウプ
サラにあるMats Karlssonの研究室でNM SAEMお
よびMONOLIX SAEMを伝統的近似尤度モデルと
比較した際に用いられた、最新のモデルセットから
採用されました[4]。1つのデータにつきシミュレーシ
ョンされたデータセットが100個含まれるスパース
データおよび、Hill係数が3の、非線形性が高い
EMAXシグモイドモデルが用意され、全ての解析手
法で実行されました。パラメトリックEM法の場合に
は、100、300、1000、3000および10000のサンプル
サイズが用いられました。
サンプルサイズが300以上の同一サイズである場合
には、いずれのパラメトリックEM法(PH-QR、
PH-MCおよびNM-MC)でも、ほぼ等しく、本質的
に不偏なパラメーター推定が得られた一方で、
FOCEI法では有意なバイアスが示されました。サン
プルサイズが1000以上になると、QRの対数尤度およ
びELS OBJ値の確度はかなり高くなりましたが、
MC法ではそれに比べてはるかに低い確度が示され
ました。FOCEI法およびパラメトリックEM法の両
方のパラメーター推定を高精度なQR対数尤度とと
もに評価したところ、パラメトリックEM法は平均的
にはFOCEより約40単位高いELS OBJを示し、結果
として、QR法およびMC法により生成されるパラメ
ーター推定値のほうが真のML推定にはるかに近い
ことが、直接的に示されました。サンプルサイズが
N=100と最も小さい場合には、MC推定よりもQR推
定のほうが、ML推定への非常に良好な接近を示しま
した。PH-MCはNM-MCに比べてはるかに高速(約
8倍)でしたが、推定結果に関する統計的質という点
では、テスト1と同様に、NM-MCとPH-MCのパフ
Certara
Copyright © Certara, L.P. 2011
ォーマンス間に有意な違いはありませんでした。
このモデルでは、FOCEI以外の全ての手法で、補助
的対数尤度推定手順を用いる必要があります。SIR
アルゴリズムを実装した場合には、PH-QRおよび
PH-MCの実行速度はほぼ同一で、同一の反復回数に
おけるNM-MCの速度の約8倍でした。PH-MCの場
合にはSIRアルゴリズムによって補助的尤度最適化
が単純化されるため、PH-MCとNM-MCとでは解析
過程が大きく異なりますが、それにも関わらずこれ
らの結果の統計的質は本質的には同一でした。
PH-QRおよびPH-MCにおいてSIRアルゴリズムを
無効化したところ、全てのパラメトリックEM法
(NMおよびPH)が本質的には同等な速度で実行さ
れました。
詳細: 2011年のACoP学会(および2010年のPAGE
学会)で、Elodie Planら[4]は以下のEMAX PDモデ
ルを発表しました。
E = E0 + Emax*Dose γ /(Dose γ+ ED50 γ)
このモデルからシミュレーションされたデータを用
いて、NM SAEMおよびMonolix SAEMのパフォー
マンスが伝統的尤度近似モデルのパフォーマンスと
比較されました(この比較にNM IMPEMは含まれて
いませんでした)。ここでは、γは非線形性の程度を
決定するHill係数です(この値が高いほど、非線形性
が高くなります)。今回の検討では、発表されたPlan
ケースの中から、γ=3とHill係数が最も高く、かつ、
データが最もスパース(被験者1名につき2個の観測
値)である最も困難なケースが、テストケースとし
て選択されました。構造パラメーターE0、Emaxお
よびED50は、いずれも、E0 = tvE0*exp(eta_E0)と
いった対数正規分布に従う構造パラメーターの形式
で表現されました。Hill係数γは、ランダム効果と対
にはなっていませんでしたが、単純な独立した固定
効果として推定されました。発表されたPlanと同一
の真の固定効果パラメーター値であるtvE0=5、
tvEmax=30、tvED50=500およびγ=3が、用いられ
ました。ω行列の真の値は、以下の通りでした。
E0
0.0900
0.000
0.0
EMAX
ED50
0.490
0.245
0.490
Phoenix NLME
pg. 9
「サンプルサイズが最も小さかった場合でも、この尺度における Phoenix
QRPEM パラメーター推定の質はかなり高いままで、Phoenix MCPEM
および NONMEM MCPEM の推定に比べて有意に優れていました。」
TRUE
FOCEI
PH-MC
PH-QR
tvE0
5.00
5.00 (0)
5.01(+0.2)
5.01(+0.2)
tvEmax
30.00
26.6(-13)
29.9(-0.3)
29.6 (-1)
tvED50
500
521(+4)
499(-0.2)
496(-1)
γ
3.00
2.66(-10)
2.98(-1)
3.02(+1)
stddev(eps)
0.1
0.128(+28)
0.108(+8)
0.103(+3)
Omega(1,1)
0.09
0.088(-2)
0.088(-2)
0.089(-1)
Omega(2,2)
0.49
0.48(-2)
0.50(+2)
0.48(-2)
Omega(3,2)
0.25
0.18(-28)
0.24(-4)
0.25(0)
Omega(3,3)
0.49
0.42(-14)
0.48(-2)
0.47(-4)
表1:パラメーター推定値の平均および(%バイアス)
残差モデルには、stddev(ε)=0.1の比例誤差が用いら
れました。 我々のモデルとPlanモデルとを比較す
ると、我々のモデルでは被験者数が1000名であるの
に対してPlanモデルでは100名であるという点のみ
が、異なります。
サンプルサイズが300の場合について、データセット
100個全体におけるFOCEI、PH-MCおよびPH-QR
の平均の推定値およびそれに対応する(%バイアス)
を、下表に示します。NM-MCの結果は割愛しますが、
PH-MCの結果に非常に類似していました。
表から判る通り、FOCEIのバイアスは、重度ではな
いものの、最も大きい場合にはパラメトリックEM法
から得られるバイアスに比べてはるかに大きいこと
が示されています。
真の周辺対数尤度(もしくはこれと同等な真のELS
OBJ値)が、いかなるパラメーター推定値のセット
が与えられた場合にも高確度で算出できる場合には、
パラメトリックEM法とFOCEI法との間でパラメー
ター推定の相対的な質を測る尺度として、推定法間
での高確度ELS OBJ値の差および真の(高確度)ML
値からの差を評価します。後述する通り、サンプル
サイズ3000以上でQRサンプリングされた積分を用
いれば、真のELS OBJレベルの非常に高確度な推定
が、(0.5 ELS OBJ単位以内で)得られます。この
真のELS OBJスケールについてデータセット100個
全体の平均を見たところ、パラメトリックEM法では
FOCEI法より40.1 ELS OBJ単位高い、より良好な
Certara
pg. 10
推定が生成されており、これは統計学的には非常に
有意な差です。また、サンプルサイズが300以上の場
合には、パラメトリックEMの最適な推定値から真の
ML推定までの平均の距離が1.0 ELS OBJ単位未満
だったため、妥当なサンプルサイズであればいずれ
のパラメトリックEM法でも本質的に真のML推定が
実際に生成されました。サンプルサイズがN=100と
最も小さかった場合でも、この尺度におけるPH-QR
パラメーター推定の質はかなり高いままで、PH-MC
およびNM-MCの推定に比べて有意に優れていまし
た。
以下の一般的なデータセットについてのグラフでは、
様々なサンプルサイズサイズでのPH-QR、PH-MC
およびNM-MCにより出力された最適な近似ELS
OBJ値と真のML ELS OBJ値との比較を示します。
グラフで示されている通り、QRの出力値は、MCの
値に比べてはるかに高速に真のML値へと収束しま
す。この挙動は、出力されるELS OBJ値が尤度の数
値積分による評価から直接得られる、QRの理論に非
常によく一致しています。
QRおよびN=1000以上のサンプルサイズを用いた場
合には、出力されるELS OBJ値が1 ELS OBJ単位以
内で収束に達することに注目してください。したが
って、サンプルサイズがN=10000と最も大きい場合
には、QRによるELS OBJの評価では「真」の尤度
評価が表され、MCによるELS OBJの評価や、より
小さなサンプルサイズにおけるはるかに狭い範囲の
QRに比べ、大幅に異なる結果が示される可能性があ
Phoenix NLME
Copyright © Certara, L.P. 2011
「SIR 法により、Phoenix QRPEM 法および Phoenix MCPEM 法は、
SIR 法を持たない NONMEM MCPEM 法の約 8 倍高速となる一方、
推定の質は低下しません。」
ります。例えば、サンプルサイズN=300では、PH-MC
およびNM-MCのいずれでも出力されるELS OBJの
最適値はおよそ7280で、7259.2であるML値を約20
単位上回る一方、N=300のPH-QRで出力されるELS
OBJの最適値は5単位以内の精度を示します。しかし、
N=300以上の時にPH-MCおよびNM-MCから得ら
れるパラメーター推定値をN=10000の高精度かつ
QRに基づく数値積分を用いて評価した場合のELS
OBJ値は、PH-QRのELS OBJ値と同様に、全てが
7259~7260の範囲に含まれます。つまり、MCの各
反復回で評価される目的関数が近似でしかないにも
関わらず、MC法によって厳密なMLパラメーター推
定値が得られました(ただし、ELS OBJ推定値は得
られませんでした)。また、PH-QRでも、これらの
サンプルサイズで同様の精度のML値が得られるこ
とに加え、高精度のELS OBJ推定値も得られるとい
う利点がありました。
ただし、サンプルサイズがN=100と最小の場合には、
パラメーター推定値における真のELS OBJ値だけ
でなく、N=100の近似ELS OBJ推定においても、QR
サンプリングの優位性が明白になりました。PH-QR
推定値における真のELS OBJは7261.8で、真のML
値との差は2.6 ELS OBJ単位とごくわずかでした。
そのため、サンプルサイズがこのように非常に小さ
い場合でも、PH-QRはMLパラメーター推定値に非
常に近くなります。それに比べ、MCパラメーター推
定のELS OBJ値に対する高精度な評価は、ML推定
から10単位以上離れており、QRの場合に比べて非常
に有意に劣っていました。N=100で出力される近似
尤度ELS OBJ値についても、MCに比べてQRのほう
が50単位以上も高確度でした。
最後に、実行時間に関しては、PH-QRおよびPH-MC
はNM-MCに比べてはるかに高速でした。例えば、サ
ンプルサイズ1000で100回反復するために必要とな
る時間は、PH-QRおよびPH-MCの場合には約400秒
であるのに対し、NM-MCの場合には3200秒以上と8
倍でした。これは、PHの解析手法にSIRが使用され
ていることが原因である可能性があります。こうし
た差の直接の原因がPH-QR内およびPH-MC内の
SIRアルゴリズムであることを検証するために、SIR
が無効化された特別なバージョンのPH-QRおよび
PH-MCを設定しました。この場合には、PH-QRお
よびPH-MCのランタイムは約2900秒まで増加し、
NMのランタイムとの誤差は
10%以内でした。
結論:
a) 今回のスパースデータかつ
非線形性の高いモデルでは、パ
ラメーター推定に対する(QRサ
ンプリングを用いた)高精度の
尤度積分評価およびバイアスの
両方で評価された通り、サンプ
ルサイズがN=300と中程度の時
にはいずれの「高確度」パラメ
トリックEM法でも、近似尤度法
であるFOCEIに比べて有意に
優れた推定値が生成されました。
図 3:
Certara
Copyright © Certara, L.P. 2011
b) いずれのサンプルサイズで
も、PH-MCおよびNM-MCで報
告される最適な対数尤度および
ELS OBJ値はほぼ等しいこと
が示されました。しかし、真の
ELS OBJ値と比較した場合に
は、PH-QRで報告される対数尤
Phoenix NLME
pg. 11
「疑似ランダムサンプリングでは、MC サンプリングに比べ、
はるかに高度にクラスター化された結果が様々な初期条件から
生成されるだけでなく、生成される ELS 目的値もはるかに正確です。」
度およびELS OBJ推定のほうがNM-MCに比べ
てはるかに高確度でした。理論から予測される
通り、QRの尤度評価はMCの評価よりはるかに
正確でした。
c)
サンプルサイズが300以上である場合には、同
一のサンプルサイズでのMCの尤度近似に比べ
てQRの尤度近似がはるかに正確であるにも関
わらず、絶対的な高確度尤度スケールにおける
QRおよびMCのパラメーター推定の統計的質は
非常に類似していました。
サンプルサイズが100
と最小であった場合には、この高確度スケール
で評価された通り、PH-QRの推定量はPH-MC
の推定量に比べて有意に優れていました。この
ように小さなサンプルサイズの場合にも、
PH-QRの推定量は真のML推定量にかなり接近
していました(差は真の値から3 ELS OBJ単位
未満でした)。
d) このモデルで使用されるSIR法により、PH-QR
法およびPH-MC法はSIR法を持たないNM-MC
法の約8倍高速となる一方、推定の質は低下しま
せん。PHのSIR法を無効にすると、PHおよび
NMのランタイムはほぼ等しくなります。その
ため、このケースではSIRアルゴリズムの適用
によって大きな影響が与えられていました。
テスト3: 比較的容易な急速静脈注射モデルに
おける再現性およびELS OBJ精度の検証
結果の概要: MONOLIX 2.0のリリースに含まれて
いるMONOLIXテストモデルの中で最も単純なモデ
ルは、リッチデータの単回投与1コンパートメント急
速静脈注射モデルです。このモデルが、PH-QRおよ
びNM-MCを用いて様々な初期条件から実行されま
した。また、Phoenix NLME内の適応ガウス求積法
(Adaptive Gaussian Quadrature; AQG)により、
非常に高精度の最尤推定が得られました。いずれの
実行からも、パラメーター推定値が、シミュレーシ
ョンされた既知のパラメーター値と十分に一致して
いるという点で、優れた結果が示されました。しか
し、PH-QRの結果はNM-MCの結果に比べてはるか
に再現性が高く、各実行では、正しいML推定値が0.1
ELS OBJ単位の範囲内で再現性を持って得られま
した。NM-MCの結果はPH-QRの結果に比べてはる
かに変動が大きく、実行のたびに1.5 ELS OBJ単位
Certara
pg. 12
程度で結果が変動し、大抵は1.0 ELS OBJ単位以内
の時のみ真のML値と一致しました。こうした再現性
および確度は、共変量の探索を実行する際に考慮す
べき重要事項です。共変量の探索においては、
NM-MCの実行で観測された程度にELS OBJ値が不
正確であると、共変量の有意性に関して誤った結論
が導かれる可能性があります。
詳細: Phoenixの適応ガウス求積法(AGQ)エン
ジンが様々な求積点数で実行され、真のML ELS
OBJ値が4041.790にほぼ等しいことを強く示唆する、
以下のような非常に一致した結果が得られました。
AGQ
AGQ
AGQ
25 Points
100 Points
400 Points
ELSOBJ = -4041.788
ELSOBJ= -4041.790
ELSOBJ= -4041.790
(今回のようなd=2という低次元では、等しい求積点
サイズNでのQR法よりもAGQ法のほうが理論上は
高確度であることに、注目してください。ただし、
次元が増加してもQRのパフォーマンスはほぼ一定
のままである一方、残念ながらAGQの理論上の数値
積分パフォーマンスは速やかに低下します。)
AGQのグリッドの細かさをさらに向上させても、
ELSOBJもしくはパラメーター推定のいずれの値も
変化しませんでした。
PH-QRによる評価では、AGQと同一の限定した結果
へとほぼ正確に収束し、これは様々な初期条件で非
常によく一貫していました。
PH-QR
PH-QR
PH-QR
PH-QR
PH-QR
PH-QR
PH-QR
N=300 start 1
N=300 start 2
N=300 start 3
N=500 start 1
N=1000 start 1
N=2000 start 1
N=2000 start 2
ELSOBJ=-4041.749
ELSOBJ= -4041.749
ELSOBJ= -4041.749
ELSOBJ=-4041.784
ELSOBJ=-4041.788
ELSOBJ=-4041.790
ELSOBJ=-4041.791
パラメーター推定の初期値を50%程度で変動させた
複数の初期条件で実行しても、得られたPH-QRの結
果はほぼ同一であったことに、注目してください。
求積点を最も細かくした場合のAGQおよびPH-QR
のパラメーター推定は、少なくとも有効数字4桁まで
は同一で、ELSOBJ値も0.001単位の範囲で同一でし
た。当然、いずれも基本的には、正確なML推定まで
Phoenix NLME
Copyright © Certara, L.P. 2011
「Phoenix の新たな QRPEM アルゴリズムの実行速度は、
NONMEM の MCPEM エンジンに比べて有意に高速です。」
達したと結論付けることができます。「一般的」な
サンプルサイズであるN=300の時には、PH-QRのパ
ラメーター推定は(1%以内の誤差で)ML推定とほ
ぼ同一で、ELSOBJ値はML値から0.24単位以内でし
た。統計学的観点から言うと、0.24単位のひずみは
取るに足りません。
N=300の時のNM-MCの結果は以下の通りです。
NM-MC
NM-MC
NM-MC
N=300 start1
N=300 start2
N=300 start3
ELSOBJ=-4040.891
ELSOBJ= -4041.368
ELSOBJ= -4042.353
QRPEMに比べるとNM-MCのほうがELS OBJ値の
変動がはるかに大きく、QRPEMの場合には3つの初
期条件全体で0.000 ELSOBJポイントの範囲で変動
していたのに対し、NM-MCの場合には1.5 ELSOBJ
ポイントの範囲で変動していました。高精度の場合
には(N=90000)、NM-MCの値が
ELSOBJ=-4040.740として得られ、QRPEM=300に
おけるELS OBJ= -4040.749にかなり近付きました。
ここからも、MCに比べてQRのほうが数値積分のパ
フォーマンスの面で大幅に優れていることが、証明
されます。
結論: QRサンプリングでは、MCサンプリングに
比べ、はるかに高度にクラスター化された結果が
様々な初期条件から生成されるだけでなく、生成さ
れるELS OBJ値もはるかに正確です。
テスト4: 2007 MONOLIXテストセットから
の1コンパートメント単回投与モデル
背景: 2007年にリリースされたMONOLIX 2.0に
は、24種類の基本タイプの1コンパートメントモデル
および2コンパートメントモデルが含まれ、それらの
各基本モデルに投与パターンおよびモデルパラメー
ターのバリエーションが6種類ずつ用意された、計
144個のテストケースが付属していました。ここでは、
Ke-Vタイプのパラメーターを持つ12種類の基本的
な1コンパートメント単回投与モデルについて、
PH-QR、NM-MCおよびNM SAEMの結果を比較し
ます。これらのモデルは、6種類の線形消失モデルお
よび6種類の非線形ミカエリスメンテン消失モデル
から構成されており、いずれも比例誤差ガウス残差
モデルが設定されています。データが比較的リッチ
Certara
Copyright © Certara, L.P. 2011
であったにも関わらず、これらのモデルの多くが
PHX ELS FOCEIおよびNM FOCEIにとっては収
束が困難であることが判明し、これらのモデルの大
多数でPHX ELS FOCEIおよびNM FOCEIの両方
が収束に失敗しました。[5]で報告されている通り、
MONOLIXのSAEMでは、データセットのシミュレ
ーションに用いられた既知のパラメーター値にほぼ
一致する優れた推定が、いずれのモデルでも得られ
ました。
結果の概要: 奇数番号のモデルでは線形消失、偶
数番号のモデルではミカエリスメンテンの非線形消
失に従います。モデルおよび真のパラメーター値の
詳細については、[5]のExprimoの報告を参照してく
ださい。
NM-MCおよびPH-QRはいずれも、初期設定のサン
プリングレベルであるN=300サンプル/被験者で実
行され、最大反復回数は2000回でした。NM-MCは
収束基準CTYPE=3で実行され、NM SAEMは最大反
復回数が1000かつCTYPE=1で実行されました。い
ずれのケースでも、NM-MCおよびPH-QRは、反復
回数が上限に達する前の早い段階で収束しましたが、
SAEMには最大回数である1000回の反復が必要でし
た。
NM-MCおよびPH-QRは、72種類全ての1コンパート
メントモデル(および72種類全ての2コンパートメン
トモデル)で収束に成功し、既知のパラメーター推
定値と非常によく一致したパラメーター推定が得ら
れました。NM SAEMは、以下に示す12種類のモデ
ルについては、許容できる範囲の良好な結果が得ら
れなかったと判定されましたが、その他の全てのモ
デルでは成功しました。初期条件を変えて解析を再
度開始しても成功しなかったため、このモデルにお
けるSAEMには大きな変動があることが判りました。
PH-MCの実行速度は、より複雑なモデルの場合に特
に、NM-MCに比べて有意に速く(通常、1.5~3倍)、
テスト2で説明した方法で評価したところ、PH-MC
で報告されたELS OBJ値のほうが真のELS OBJ値
にはるかに接近していました。NM-MCはNM SAEM
に比べ、実行速度が1.5~2倍高速でした。
詳細: 以下に記載する値は、様々な実行条件での
ELS OBJ値と、そのタイミングです。略語「sd」は
Phoenix NLME
pg. 13
「Phoenix の QRPEM アルゴリズムでは、NONMEM MCPEM に比べて
有意に高い確度で ELS 目的値が得られます。」
「単回投与」を意味しており、これは、各モデルタ
イプに組み合わされた6種類の異なる投与バリエー
ションの内の1つです。
mlx101 sd
PH-QR
NM-MC
NM SAEM
-4041.749
-4040.891
-4041.471
14 sec
20 sec
69 sec
高精度AGQから得られた真のML ELS OBJ値:
-4041.790
mlx102 sd
PH-QR
NM-MC
NM SAEM
-4090.768
-4090.424
-4089.632
140 sec
165 sec
225 sec
mlx103 sd
PH-QR
NM-MC
NM SAEM
-4035.484
-4034.644
-4035.201
12 sec
20 sec
74 sec
mlx104 sd
PH-QR
NM-MC
NM SAEM
-4185.945
-4186.020
-4185.848
120 sec
176 sec
261 sec
mlx111 sd(このモデルは、SAEMの収束が困難なモ
デルであることが判明しました。NM-MCおよびNM
SAEMに比べ、PH-QRの結果には極めて高い再現性
がありました。)
PH-QR
-3511.458
34 sec
PH-QR
-3511.459
32 sec(初期条件変更)
NM-MC
-3510.741
29 sec
NM-MC
-3508.197
50 sec(初期条件変更)
NM SAEM -3458.423
118 sec 異常なELS OBJ値、
貧弱なω推定
NM SAEM -3484.962
116 sec 初期条件変更、異常
なELS OBJ値および貧弱なω推定のまま
mlx112 sd – (mlx111 sdと同様に、様々な初期条件
からのPH-QRの結果の再現性は、NM-MCおよび
NM SAEMに比べてはるかに良好でした。)
PH-QR
PH-QR
NM-MC
NM-MC
NM SAEM
NM SAEM
-3434.675
-3434.779
-3434.974
-3432.923
-3431.192
-3430.728
237 sec
301 sec(初期条件変更)
709 sec
680 sec(初期条件変更)
861 sec
842 sec(初期条件変更)
結論:
mlx105 sd
PH-QR
NM-MC
NM SAEM
-3829.337
-3829.094
-3828.736
13 sec
23 sec
90 sec
mlx106 sd
PH-QR
NM-MC
NM SAEM
-3876.126
-3875.227
-3873.968
122 sec
221 sec
290 sec
mlx107 sd
PH-QR
NM-MC
NM SAEM
-3885.470
-3885.309
-3885.061
15 sec
24 sec
91 sec
c)
mlx108 sd
PH-QR
NM-MC
NM SAEM
-4080.355
-4079.661
-4078.293
180 sec
567 sec
1051 sec
テスト5: 2007 MONOLIXテストセットから
の2コンパートメントモデル
mlx109 sd
PH-QR
NM-MC
NM SAEM
-3231.600
-3230.105
-3231.311
43 sec
29.5 sec
120 sec
mlx110 sd
PH-QR
NM-MC
NM SAEM
-3397.163
-3397.186
-3395.371
106 sec
133 sec
232 sec
Certara
pg. 14
a) PH-QRおよびNM-MCのいずれのパラメトリッ
クEM法でも正確な推定が一貫して得られ、それ
らの信頼性はPHおよびNMのFOCEI法に比べ
てはるかに良好でした。
b) PH-QRの実行速度は、NM-MCに比べて有意に
高速でした。
NM SAEMは、NM-MCに比べると信頼性が若
干低く、実行速度も遅かったですが、FOCE法
に比べると信頼性がはるかに良好でした。
背景: テスト4で説明した1コンパートメントモデ
ルに類似した、単回投与に基づく12種類の2コンパー
トメントモデルにおける、PH-QRおよびNM-MCの
タイミングの比較およびELS OBJの結果サンプル
を、より大きなデータセットを含むいくつかの追加
のモデルと一緒に示します(実際に、72種類全ての2
コンパートメントモデルがPH-QRでの実行に成功
Phoenix NLME
Copyright © Certara, L.P. 2011
し、全てのケースで高確度の推定が得られました)。
いずれのモデルでも単純な比例ガウス誤差εが用い
られ、全ての構造パラメーターがμモデル化されてい
ました(ただし、PH-QRではEステップで直接算出
された残差が用いられるのに対し、NM-MC法では補
助的尤度関数最適化を用いてvar(ε)が推定されると
推測されます。これが、PH-QRがNM-MCに比べて
高速であることが観測される原因であると、考えら
れます)。1コンパートメントモデルの場合と同様に、
奇数番号のモデルは線形消失に対応しており、偶数
番号のモデルは、奇数番号のモデルに比べて大幅に
困難かつ時間を要する非線形ミカエリスメンテンモ
デルです。1コンパートメントモデルと同様に、これ
らのモデルの大半で、NM FOCEIおよびPH ELS
FOCEIが収束に失敗しました。奇数番号の各モデル
には、サンプルサイズは比較的小さいもののデータ
量は十分に豊富な単回投与データセット「sd」、デ
ータ量がsdに比べてかなり大きな反復投与データセ
ット「all」という、2つのデータセットが含まれてい
ます。偶数番号の非線形モデルについては、ここで
はsdの結果のみを示します。
結果の概要: PH-QRおよびNM-MCはいずれも、
ここに示す全てのモデルで収束に成功し、データの
シミュレーションに用いられた既知の値とほぼ一致
する優れたパラメーター推定が生成されました(実
際には、PH-QRは72種類全ての2コンパートメント
ケースで成功しました)。PH-QRは実行速度が
NM-MCより高速である場合が多く(2~5倍)、ま
た、比較のために高精度AGQが実行されるように選
択されたケースではELS OBJ値の確度もNM-MCに
比べてはるかに高く、NM-MCのELS OBJ値が真の
値から約2.0ELS OBJ単位であったのに対して
PH-QRのELS OBJ値は0.2 ELS OBJ単位以内でし
た(この観測結果のデータは示されていません)。
上記のテストケースの一部は固定された反復回数で
実行されましたが、ここではそれとは異なり、各ア
ルゴリズムの内部の収束基準に合致した時点で実行
が終了されました。そのため、いくつかのタイミン
グ差については、反復カウント(下表内のITERS)
の差が原因の一部である可能性があります。
詳細:
Method/Model
Dataset
Time
ELSOBJ
ITERS
PH-QR201
NM-MC201
PH-QR201
NM-MC201
sd
sd
all
all
97 sec
245 sec
245 sec
223 sec
20296.006
20296.391
65933.468
65932.981
80
113
60
39
PH-QR202
NM-MC202
sd
sd
286 sec
1008 sec
-4221.047
-4220.901
130
201
PH-QR203
NM-MC203
PH-QR203
NM-MC203
sd
sd
all
all
29 sec
90 sec
78 sec
122 sec
19834.529
19834.882
65133.507
65133.733
40
41
40
20
PH-QR204
NM-MC204
sd
sd
128 sec
809 sec
-4150.415
-4151.040
50
154
PH-QR205
NM-MC205
PH-QR205
NM-MC205
sd
sd
all
all
51 sec
222 sec
152 sec
509 sec
-3801.372
-3801.406
-13696.353
-13696.055
60
86
60
91
PH-QR206
NM-MC206
sd
sd
158 sec
652 sec
-4088.784
-4089.790
60
117
PH-QR207
sd
71 sec
19555.424
80
Certara
Copyright © Certara, L.P. 2011
Phoenix NLME
pg. 15
NM-MC207
PH-QR207
NM-MC207
sd
all
all
213 sec
154 sec
553 sec
19554.815
64282.186
64282.751
82
60
83
PH-QR208
NM-MC208
sd
sd
293 sec
902 sec
-3996.374
-3994.868
80
86
PH-QR209
NM-MC209
PH-QR209
NM-MC209
sd
sd
all
all
36 sec
180 sec
166 sec
378 sec
-3356.841
-3356.903
-13220.644
-13220.921
40
39
60
28
PH-QR210
NM-MC210
sd
sd
166 sec
630 sec
-3384.766
-3386.107
60
85
PH-QR211
NM-MC211
PH-QR211
NM-MC211
sd
sd
all
all
79 sec
557 sec
234 sec
1496 sec
-3569.209
-3570.122
-13487.620
-13488.557
80
179
80
179
PH-QR212
NM-MC212
sd
sd
199 sec
1129 sec
-3693.311
-3692.731
60
109
結論:
a) PH-QRおよびNM-MCのいずれのパラメトリッ
クEM法でも正確な推定が一貫して得られ、それ
らの信頼性はPHおよびNMのFOCEI法に比べ
てはるかに良好でした。
b) PH-QRの実行速度は、NM-MCに比べて有意に
高速でした。
c) PH-QRでは、NM-MCに比べて有意に高い確度
でELS OBJ値が得られました。
参考文献
[1] A. Schumitzky. Nonparametric EM Algorithms
for Estimating Prior Distributions. App. Math.
and Computation 45: 143-158, 1991.
[2] H. Niederreiter. Random Number Generation
and Quasi-Monte Carlo Methods. SIAM. 1992.
[3] P. Girard and F. Mentre’. A Comparison of
Estimation methods in Nonlinear Mixed
Effects Models Using a Blind Analysis. PAGE
Certara
pg. 16
2005. Pamplona, Spain.
http://www.pagemeeting.org/page/
page2005/PAGE2005O08.pdf
[4] E. Plan, A. Maloney, F. Mentre’, M. Karlsson
and J. Bertrand. Performance Comparison of
Various Maximum Likelihood Nonlinear
Mixed-effects Estimation Methods for
Pharmacodynamic Models, American
Conference on Pharmacometrics. San Diego.
April, 2011.
http://www.go-acop.org/2011/posters
http://www.page-meeting.
org/pdf_assets/4694-Elodie_Plan_
PAGE_Poster.pdf にある、PAGE 2010年前期バ
ージョンでも閲覧できます。
[5] C. Laveille, M. Lavielle, K. Chatel, P. Jacqmin.
Evaluation of the PK and PK-PD libraries of
MONOLIX: A comparison with NONMEM,
PAGE 2008; also P.Jacmin, C. Laveille, M.
Lavielle, Software Evaluation : Simulation of
PK Data Sets for Evaluation of the Monolix PK
Library, June 6, 2007, Exprimo report.
Phoenix NLME
Copyright © Certara, L.P. 2011
[6] A. Owen. Scrambling Sobol and
Niederreiter-Xing points. J. of Complexity 1998.
14:466-89.
[7] Rubin, D.B. (1987) J. Am. Stat. Assoc., 82,
543-546 (1987).
[8] J. S. Liu, Monte Carlo Strategies in Scientific
Computing, Springer, 2008.
We’re the name behind the names you know.
Certara は、従来であれば組織内の複数の部門や分散した研究活動のために統合が妨げられていた技術、ワー
クフローおよび処理過程を統合し、創薬および開発業界を前進させ、トランスレーショナルサイエンスの構想
を実現するために、業界トップの科学の買収に基づいて設立されました。
TM
Certaraは、創薬から前臨床や臨床までに及ぶ医薬品開発の全範囲に渡って、最新の研究および開発情報科学
を予測科学の方法論と組み合わせることにより、従来であれば提供できなかった医薬品開発の最初から最後ま
でのソリューションを製薬企業および生物工学企業に提供し、人々の健康の向上を追求します。
おそらく、我々のソリューションのいくつかについては既にお持ちでしょう。是非、その他のソリューション
についてもご参照ください。
全ての製品名は、Certara, L.Pの商標もしくは登録商標です。
その他全ての商標は、それら個々の所有者の所有物です。
Printed in U.S.A. Copyright © Certara, L.P. 2011 04.12
Certara
Copyright © Certara, L.P. 2011
Phoenix NLME
pg. 17