QRPEM – NLMEの母集団PK/PD解析法における 高確度で高精度かつ効率的な新しい標準手法 Bob Leary, Mike Dunlavey, Jason Chittenden, Brett Matzuka, Serge Guzy 要約: 最新バージョンのPhoenix® NLME™には、 高い確度を有する尤度EM推定法であるQRPEM (Quasi-random Parametric Expectation Maximization; 疑似ランダムパラメトリック期待値 最大化)が新たに導入されています。この手法が属 するものと同一のパラメトリックEM法の一般的ク ラスには、NONMEM 7におけるIMPEM、S-ADAPT におけるMCPEM、MONOLIX、S-ADAPTおよび NONMEM 7におけるSAEMが含まれます。QRPEM 以外のEM法では期待値算出ステップにおけるコア サンプリング法として確率的モンテカルロサンプリ ング法が用いられるのに対し、QRPEM法では低ひ ずみ(別称「疑似ランダム」)Sobol数列が用いられ るという点が異なります。QRサンプリングが理論上 最も正確になるケースでは、Nをサンプル数とする と、誤差はN-1に従って減少します。これは、N-1/2 に従って誤差が減少する確率的サンプリングの特性 に比べ、誤差の減少速度が速く、非常に有利である ことを示しています。母集団PK/PD NLMEドメイン で一般的に生じるタイプの問題の基本的特性として は、サンプリングされる関数の次元が相対的に低い ことや、平滑度が高いことが挙げられます。これは、 QR法の活用における理想的なケースとして知られ ており、最も優れたケースであるN-1の誤差減衰挙動 が実際に起こり得ることが示唆されます。 次に、QRPEMの特徴として、SIR (sampling-importance-resampling)を使用してい る点が挙げられます。SIRは、各被験者の事後分布の 平均および共分散行列の推定値に基づく単純なEM での更新では固定効果を決定できないモデルの解析 効率を、著しく向上させます。こうしたモデルには、 非線形共変量モデル、絶対誤差および比例誤差の混 合残差誤差モデルおよび独立した固定効果といった、 よく発生するケースが含まれます。また、構造パラ 「QRPEM 法は、期待値算出ステップにおけるコアサンプリング法として 低ひずみ Sobol 数列が用いられるという点が異なります。」 メーターの一部もしくは全部が指定されない、もし くは指定できない、「μモデリング」と呼ばれるケー スも、一般的には含まれます。こうしたケースでは、 解析コストの高い補助的な対数尤度最適化法を導入 することにより、それらのモデルにおける固定効果 が繰り返し更新されます。この最適化法は、全ての 推定手法の中でも最も高い解析コストを発生させる 傾向がありますが、SIRアルゴリズムを使用すれば、 サイズおよび複雑性が著しく低下し、結果的には全 体の実行時間が大幅に短縮されます。 この白書では、いくつかの基本的背景および歴史的 文脈を提供することに加え、以下の内容を証明する 一連の検証結果を示します。 a) 「高確度な尤度」 のパラメトリック EM 法は、FOCEI といった近似尤 度法に比べて理論上有利とされていますが、その有 利性が実践においても実際に得られること。 b) QR サンプリングは MC サンプリングに比べて理論 上有利とされていますが、この有利性が、尤度およ びパラメーターの推定値の改善(真の最大尤度によ り接近)という形で実際に得られること。 c) SIR アルゴリズムが解析効率の向上に著しく効果的であ ること。 序論 母集団PK/PDの方法論における至高の目標とは、フ ァーマコメトリクスのコミュニティで一般的に見ら れるタイプのモデルおよびデータセットに対し、最 大尤度(ML)パラメーターの推定値を妥当な反復回 数で確実に算出する、NLMEアルゴリズムです。ML 推定には最適な統計的性質が数多く存在し、少なく とも、ファーマコメトリクス解析で重要となる統計 量に対して(ベイズとは対照的に)最も頻繁に用い られるアプローチにおいては、最も望ましい推定タ イプであると、通常は見なされます。 最も幅広く用いられている解析方法としては、1978 年に初めて発表されたNONMEMにFOが導入され ていたことから始まり、最新バージョンの NONMEM、SPLUS、RおよびSASに導入されてい るFOCE、FOCEI、LAPLACEまで続きますが、残 念ながらこれらの方法は上記の目標を達成するには 非常に不十分でした。これらの解析方法は最尤法ア プローチに基づいていますが、周辺尤度を正確に算 出することが困難であるため、様々な精度の尤度近 Certara pg. 2 似を採用しています。FOの場合には近似の相対的な 精度が低い場合が多く、それに対応して、FO推定の 全体的な精度も非常に低くなる可能性があります (驚くほど低精度になる場合もあります)。一般的 に、FOCE推定法(特にFOCE with Interaction)お よびLAPLACE推定法は、FOより高い精度を通常は 示しますが、それでも真のML推定の精度レベルには 達しません。特定の近似尤度法を使用することで損 なわれる確度の程度については、前もって知る方法 がありません。しかし、例えば、モデルの非線形性 の度合いが大きい場合や、構造パラメーターの母集 団分布における個体間変動が大きい場合、残差誤差 の分散が大きい場合、被験者1名あたりの観測値が構 造パラメーターの個数に比べて相対的に少ない形式 のスパースデータの場合には、いずれも確度が大き く損なわれる傾向があります。実際の解析では、こ のようなタイプの困難さを伴う状況にしばしば遭遇 します。 近似尤度法で、確度が損なわれることに加えて主に 問題となるのは、信頼性の低さです。いずれの近似 尤度法でも、数値的に微妙かつ失敗しやすい、勾配 に基づく形式的な尤度最適化法が用いられます。条 件付き法では、各反復回における最高レベルの周辺 尤度目的関数の評価に、それより低レベルの最適化 が多数含まれている場合には、入れ子化された最適 化スキームが用いられるため、特に脆弱です。 過去5年間で、様々なバージョンの確率的EM(期待 値最大化)アルゴリズムに基づく新たなNLME母集 団PK/PD法が、幅広く使用できるようになりました。 これらの解析方法は、伝統的な近似尤度法に取って 代わる、より優れた選択肢となる可能性があるとし て、ファーマコメトリクスコミュニティにおける需 要が増し始めています。高い確度を有する新たな尤 度法には主に2つのタイプがありますが、その内の1 つは一般的にはMCPEM(Monte Carlo Parametric Expectation Maximization; モンテカルロパラメト リック期待値最大化)と呼ばれており、NONMEM 7 ではIMPEM(importance sampling PEM; 重点サ ンプリングPEM)、S-ADAPTおよびPDx-MCPEM ではMCPEMとして実装されています。これら3つは 全て、Eステップの重点サンプリング法を用いたモン テカルロ積分の実装に基づいており、基本的には同 一です。もう一方のタイプはSAEM(stochastic approximation EM; 確率的近似EM)と呼ばれてお Phoenix NLME Copyright © Certara, L.P. 2011 「次に、特徴的な QRPEM の特性として、 SIR(sampling-importance-resampling)アルゴリズムを使用している点が 挙げられます。SIR アルゴリズムは解析効率を著しく向上させます。」 り、これにはEステップのマルコフ連鎖モンテカルロ 法が実装されています。これは、異なる形式で実装 されてはいるものの、NONMEM 7、S-ADAPTおよ びMONOLIXにおけるSAEMと本質的には同一のバ ージョンです。 MCPEM および SAEM は、古典的な尤度法に関連す る確度の問題および信頼性の問題の両方に対応して います。これらの EM 法では周辺尤度を高い確度で 評価できるため(MCPEM の場合には、確度のレベ ルは、ユーザーが設定するサンプルサイズパラメー ターに依存します)、近似法で生じる固有のバイア スおよび確度上の問題の多くを防げます。また、こ れらの EM 法では、周辺尤度を最大化する際に形式 的な数値最適化法が用いられません(一部のケース では、固定効果の推定値を得る際にいくらかの数値 的最適化が必須ですが、これは、条件付き近似尤度 法で必要となる入れ子化された最適化法に比べると、 はるかに頑健かつ信頼性が高い傾向があります)。 したがって、パラメトリック EM 法では、周辺尤度 の近似における直接的数値最適化に固有である致命 的なエラーの大半が防がれます。 近似尤度法とは異なり、MCPEMおよびSAEMでは、 恣意的に長時間を解析に費やせば少なくとも原理上 は真の最尤推定値に収束することになります。勿論、 実践では、いずれのアルゴリズムも妥当な実時間の 範囲内で終了させる必要があるため、実際の結果は 真のML推定の目標値には幾分か及ばない可能性が あります。しかし、MCPEMおよびSAEMでは、近 似尤度法と同程度以下の解析時間でも近似尤度法よ り優れた推定値が生成される場合が多いこと、また、 数値的信頼性が近似尤度法に比べてはるかに高く、 かつ安定していることが、実績として示されていま す。 MCPEMおよびSAEMはいずれも、モデルの構造パ ラメーターにおけるより妥当かつ尤もらしいサンプ ル値の集合を、それらのパラメーターの条件付き分 布から連続的に発生させることにより、機能します。 最も基本的なケースでは、発生した値の平均および 共変量行列を算出する単純な代数式を適用すること により、固定効果の推定値(θ)、ランダム効果パラ メーター(ω)および残差誤差パラメーター(σ)が、 反復回ごとに算出されます。MCPEMとSAEMの主 な違いは、条件付き分布のサンプリング方法です。 Certara Copyright © Certara, L.P. 2011 通常、MCPEMでは、重点サンプリングによって一 度に数百個(もしくはそれ以上)のサンプルが各被 験者の条件付き分布から収集され、収集されたサン プルの平均および共分散を元にして、興味のあるパ ラメーターが更新されます。SAEMでは、マルコフ 連鎖モンテカルロ法により条件付き分布からサンプ リングが行われ、特に被験者1名あたりのサンプル個 数が1個である場合にはMCPEMよりはるかに高頻 度で更新が行われます。SAEMのパラメーター推定 値は、連続的反復過程全体におけるこうした小さな サンプルの平均および共分散の移動平均として、最 初のバーンイン期間の後に得られます。 いずれのEM法も本質的には確率論に基づいており、 原理上は、確度および精度を上げて単純により多く のサンプルを得るか(MCPEM)、もしくはより多 くの反復を実行することにより(SAEM)、真の最 尤推定値に近い結果が恣意的に得られます。一般的 には、確率的尤度推定に関連する誤差(不確度性) は、サンプルサイズ(もしくは、SAEMの場合には 反復回数)Nが増加するに従って、N-1/2で減少する のが通常です。そのため、尤度誤差を10分の1に減ら すためには、サンプルサイズを100倍に増やす必要が あります。 近年、低ひずみSobol数列(特定のタイプのいわゆる 疑似乱数(QR)、もしくはそれらに対するより近年 の一般化法である(T, M, S)-net)に基づくサンプリ ング方法論が、MCPEMと同種の重点サンプリング アルゴリズムに対して適用されました。疑似ランダ ムサンプリングでは、MCPEMのパラメーター更新 式に入力される平均および分散の算出における誤差 減衰挙動が、理論上はおよそN-1まで大幅に改善され ます。この理論上の挙動が実際の解析でも実現され るならば、これは非常に大きな利点です。例えば、 被験者1名あたりの観測値数が比較的少ないスパー スデータセットから「優れた」EM推定を得たい場合 には、それより密度の高いデータの場合に比べ、よ り集中的にサンプリングを行う必要があることが一 般的です。個々の積分レベルでは、被験者1名あたり 500個という、実践ではよくある極めて小さなサイズ のQRサンプルから生じる数値積分の確度が、10万個 超という実用性の限度を超えたレベルのサンプルサ イズのモンテカルロ(MC)ランダムサンプルからの 数値積分の確度に等しくなる可能性が、理論上はあ ります。この新たなアルゴリズムはQRPEMと呼ば Phoenix NLME pg. 3 「SIR アルゴリズムは、最も情報量の多いポイントを理論上妥当な方法で 選択することによりサンプルポイントを削減する手法です。」 れており、最新版のPhoenix NLMEに導入されてい ます。 次に、QRPEM の特徴として、SIR(SamplingImportance-Resampling)アルゴリズムを使用して いることが挙げられます。SIR アルゴリズムは我々 の知る限り、他のいずれのパラメトリック EM アル ゴリズム(MCPEM、IMPEM もしくは SAEM)で も使用できません[7, 8]。最も単純なケースでは、全 ての構造パラメーターを「μ モデル化」、つまり、 母平均値(通常は、単一の固定効果もしくは線形共 変量モデル形式での固定効果の線形結合)とランダ ム効果との和として表現することができます。この 場合には、固定効果に対する反復 EM パラメーター 更新式は非常に単純な形をとり、各被験者の構造パ ラメーターの事後分布における平均および共分散行 列の推定値から直接算出できます。しかし、非線形 共変量モデル、絶対誤差および比例誤差の混合残差 誤差モデル、もしくは単に、構造パラメーターの定 義においてランダム効果と対になっていない独立し た固定効果が含まれるモデルといった、多くのケー スでは、別の方法を用いてそうした固定効果の推定 値を更新する必要があります。 このようなケースで、NM IMPEMおよびPhoenix QRPEMの両方で用いられる共通したアプローチの 1つは、これらの固定効果における補助的な対数尤度 関数の最適化です。この対数尤度関数は残差誤差モ デルに基づいており、全体的な推定過程の確度を損 なうような近似および入れ子化された最適化が一切 必要ありません。しかし、この補助的な対数尤度関 数はかなり複雑になる可能性があり、被験者/サン プルポイントの各組み合わせから発生する数十万個 もの項が容易に組み込まれてしまいます。これらの 補助的解析は、通常は解析全体に影響を及ぼします。 例えば、NONMEMのIMPEMでは、同等なμモデル 形式および非μモデル形式で表現可能なモデルを完 了するためにかかる時間は、後者の形式の場合には 前者の形式の場合の数倍になることが殆どです。SIR アルゴリズムは、最も情報量の多いポイントを理論 上妥当な方法で選択することによりサンプルポイン トを削減する(したがって、補助的対数尤度におけ る項の個数を削減する)手法です。 この新たなアルゴリズムは QRPEM と呼ばれ、現在 リリースされている Phoenix® NLME™に導入され Certara pg. 4 ています。本白書では、QRPEM を歴史的文脈の中 で捉え、QR サンプリングおよび SIR 法の利点を説 明するいくつかの単純なテストケースを紹介します。 NLMEの解析手法の歴史的概要および誤差ス ケーリング挙動の重要性に関する検討 パラメトリック母集団PK/PD推定法として幅広く用 いられることとなった最初の解析法は、1978年に NONMEMの最初のバージョンに導入されたFOで した。FOは、一致性がないといった非常に貧弱な統 計学的特性が現在では知られているにも関わらず未 だに幅広く用いられている、唯一の手法です。一致 性のある母集団NLMEの解析法には、基本構造とな るモデルが正しい場合に被験者数および被験者1名 あたりの観測回数の両方を無限に増加させると、推 定値が真のモデルパラメーター値に収束するという 特徴があります。南カリフォルニア大学のAlan Schumitzkyは、FOには一致性がないだけではなく、 被験者数および被験者1名あたりのデータ量を無限 に増加させるとFO推定が恣意的に粗悪な値へと収 束する可能性が現実にあるという残念な性質がある ことを、証明しました。ただしFOは、近似尤度法の 中で最も高速かつ数値的信頼性が高く、また、モデ ルが複雑である場合には結果を算出できる唯一の近 似尤度法である場合もあるため、統計学的特性が貧 弱であるにも関わらず、現在でも用いられています。 1990年代以降、より優れた確度のFOCE、FOCE-I およびLAPLACE近似尤度法がNONMEM、SPLUS、 RおよびSASに導入されました。これらの方法は、 FOに比べて、統計学的特性ははるかに優れています が、解析コストがはるかに高い上に、数値的安定性 および信頼性は非常に低く、特に、スパースデータ の場合や、個人間変動の大きい場合および非常に非 線形なモデルの場合には、バイアスのかなり大きい、 不正確な結果となる可能性もあります。しかし、 FOCE-Iは、現在使用可能な手法の中では、おそらく 最も幅広く用いられる母集団PK/PD解析法です。 実践上の確度が優れている尤度法の中で最初に幅広 く使用可能になった手法は、1991年に南カリフォル ニア大学のSchumitzkyが導入したNPEM (NonParametric EM; ノンパラメトリックEM)で す[1]。この手法は、ランダム効果の分布を仮定しな い点が、より一般的なパラメトリック法と根本的に Phoenix NLME Copyright © Certara, L.P. 2011 「Phoenix NLME の QRPEM 法は、既存の PEM 法を大幅に改良した バージョンであり、はるかに洗練された効率的な重点サンプリングが 用いられています。」 異なります。NPEMは、比較的貧弱な誤差スケーリ ング特性を持つ、グリッドに基づいた手法であり、 ランダム効果の個数をd、使用するグリッドポイント 数をNとすると、誤差はN-1/dに従って減少します。 そのため、非常に高確度な結果が求められている場 合には、NPEMの解析コストが特に高くなる可能性 があります。例えば、2000年にBob Learyは、カリ フォルニア大学サンディエゴ校(UCSD)で、当時 の世界最速の非機密スーパーコンピュータであった サンディエゴスーパーコンピュータセンター(SDSC) のBlue Horizonに、NPEMを実装させました。これ まで試みられてきた中でおそらく最も高い解析負荷 を持つ単一の母集団PK/PDジョブとして、6つのラン ダム効果および数千万個のグリッドを伴うピペラシ リンの高確度NPEMモデルを、およそ2300CPU時間 (1152個のプロセッサで実時間2時間)で実行するこ とに成功しました。Learyは、誤差スケーリング特性 の重要性を示すものとして、NPAG(non-parametric adaptive grid; ノンパラメトリック適応型グリッド) と呼ばれるはるかに効率的なバージョンを、後に開 発しました。NPAGでは、NPEMと同様に厳密なノ ンパラメトリック尤度が用いられますが、誤差スケ ーリング挙動がおよそ1/(反復回数)まで改善され、 ほんの少数のグリッドポイントのみが用いられます。 NPAGでは、2000CPU時間超の大規模なNPEG解析 よりさらに高確度なピシラシリンのモデル推定値を、 単一のPC上で10分未満で一から算出できました。こ のNPAGの改良バージョンが、Phoenix NLMEに現 在実装されているノンパラメトリック法です。 高確度尤度パラメトリック法が最初に登場したのは 2000年代前半で、当初は研究レベルでの実装として 導入されました。Bob BauerおよびSerge Guzyは、 現在のS-ADAPTおよびNONMEMの重点サンプリ ングEM法の前身である、MCPEMを開発しました。 UCSD/SDSCのBob Learyは、疑似ランダムサンプリ ング法を導入することによりMCPEMに比べてはる かに粗いバージョンの重点サンプリングを行う、 PEM(Parametric EM method; パラメトリックEM 法)を開発しました。後にMONOLIXへと発展する こととなるSAEMの最初のバージョンは、B. Delyon、 M. LavielleおよびE. Moulines(および彼らに続く貢 献者ら)によって、フランスで導入されました。 2004年には、これらの高確度尤度法は既に大きな注 目を集め、フランスの保健医療研究局である Certara Copyright © Certara, L.P. 2011 INSERMの後援により、SAEM、PEMおよび MCPEMの相互比較や、古典的なFO、FOCEおよび LAPLACEといった既に実装されている様々な近似 尤度法との比較を行う、手法間盲検比較演習が行わ れました。最初の2004年の演習では、単純なEMAX PDモデルに基づくシミュレーションを100回反復す ることにより生成されたかなりスパースなデータセ ットが、シミュレーションに使用されたパラメータ ーの真の値を知らない参加者全員に配布されました。 参加者は主催者に結果を返送し、そこから解析およ び採点が行われました。これに続く2005年の盲検比 較演習では、経口1次吸収の1コンパートメントPKモ デルに基づいて(このモデルの「フリップフロップ」 現象を防止するための、かなり特殊なパラメーター 化を用いた上で)行われ、この時も、幾分かスパー スなデータが用いられました。各解析方法は、承認 されたエキスパートによって実行されました(新た なEM法の場合には、それぞれ、そのEM法の発案者 の1人が実行しました)。演習の結果は、2005年7月 にフランスのリヨンで開催された参加者全員による 会議において明らかにされ(合計で約10種の解析方 法が比較されました)、2005年にスペインのパンプ ロナで開催されたPAGE(Population Approach Group in Europe)でも発表されました[3]。主な評 価基準は、パラメーター推定におけるバイアスの程 度および相対的精度(データのシミュレーションに 用いられたパラメーターの推定値と真の値との間に おける誤差の平方根)でした。3つの高確度尤度EM 法はいずれも両カテゴリーの中では最高のパフォー マンスを示し、SAEMが最も高精度で、PEMが最も バイアスが少ないという結果になりました。予想通 り、近似尤度法であるLAPLACEおよびFOCEはいず れの基準についても非常に低いランクに位置付けら れ、FOのパフォーマンスは両カテゴリーの中で圧倒 的に最下位でした。 Phoenix NLMEに現在実装されているQRPEM法は、 当初のPEM法を大幅に改良したバージョンであり、 元のバージョンに比べるとはるかに洗練された効率 的なバージョンの重点サンプリングが用いられてい ます。このPhoenix NLMEのQRPEM法には、スタ ンフォード大学のOwenが近年開発した「スクランブ リング」法[6]が一部に組み込まれた、Sobol低ひずみ 数列による疑似ランダムサンプリングが実装されて います。スクランブリング法では、基本の疑似ラン ダムアプローチにおける数値積分のパフォーマンス Phoenix NLME pg. 5 「QRPEM 法は、SIR アルゴリズムが適用された最初の PK/PD パラメトリック EM 法であり、これによって、補助的対数尤度の 算出が用いられる場合の解析パフォーマンスが大幅に向上します。」 がさらに向上します。さらにPhoenix NLMEの QRPEM法は、SIR(Sampling-ImportanceResampling)アルゴリズム[7, 8]が適用された最初 のPK/PDパラメトリックEM法であり、これにより、 補助的対数尤度の算出から固定効果の一部もしくは 全部を推定する場合の解析パフォーマンスが大幅に 向上します。 分は、伝統的な近似尤度法で用いられる、勾配に基 づく正式な数値最適化法に比べると、大抵の場合で はるかに安定した過程です。そのため確率的EM法は、 致命的な数値エラーを防ぐという点では、伝統的な 近似尤度法よりもはるかに信頼性が高いです。しか し、EMアルゴリズムの推定の質および収束特性は、 これらの数値積分の確度に大きく依存します。 疑似ランダム数値積分 Nをサンプル数とすると、ランダムサンプリングに よるMCPEMでの積分の誤差は、N-1/2に比例します。 したがって、この誤差を10分の1に減らしたい場合に は、サンプル数を100倍に増やす必要があります。誤 差減少速度がこのように比較的緩やかである一番の 理由としては、単位d次元ハイパーキューブ全体でラ ンダムサンプルが一様分布に完全には従わないこと が、挙げられます。例えば、偶然、一部のエリアが 他のエリアに比べて高い密度で常に密集し、比較的 広いエリアが全くサンプリングされない可能性もあ ります。 MCPEMといった確率的EM法では、d次元のパラメ ーター空間全体における条件付き密度関数の数値積 分を被験者ごとに行って、正規化係数、平均および 共分散を求める必要があります。ここでは、dはラン ダム効果の個数です。通常、NLME母集団PK/PDモ デルにおけるdは、1から、実用的と言える限度であ る約20までの範囲にあり、標準的には2~6となりま す。この積分は、0~1の範囲の全座標を持つd次元の 単位ボックス(ハイパーキューブ)上での積分に必 ず変換できます。 この数値積分の値が単純な代数式に適用されること により、モデルのパラメーター推定の更新値が算出 されます。この数値積分の確度が十分に高ければ、 更新のたびに全体の周辺尤度が向上します。数値積 直感には反するかもしれませんが、一見かなり一様 にサンプリングされているハイパーキューブ上の正 則方形グリッドも、実際には、2より大きな次元の空 間全体でのランダムサンプリングよりはるかに低い パフォーマンスを示します。誤差の大きさはサンプ リングポイントの数列の「ひずみ」の大きさに比例 図1:2000個の一様分布ランダムポイントによる比較的ひずみの大きい数列(左図)と、2000個の一様分布Sobol疑似 ランダムポイントによるはるかにひずみの小さい数列(右図)との比較。ひずみとは、境界四角形内で見られる、最も 大きくて方形で密度の低い空白部分の面積です。 Certara pg. 6 Phoenix NLME Copyright © Certara, L.P. 2011 「QRPEM アルゴリズムでは、MONOLIX 2.0 がリリースされる際に 付属する 144 個のテストケース全てについて、高確度の推定値を 算出することに成功しました。」 し、これは大まかに言うと、ハイパーキューブ内で 最も大きい方形である「ブリック」の体積です。d次 元の方形グリッドでは、ひずみが非常に大きく、か つ、そのせいで誤差減少速度がN-1/dと非常に緩やか である場合には、d-1次元の長さが1で残りの次元の 長さがN-1/dである多数のブリックが、ポイントの全 くない、密度の低い、スラブのような状態で残りま す。d=5の一般的な母集団PK/PDモデルで誤差を10 分の1に減らしたい場合には、サンプル数を100,000 倍に増やす必要があります。そのため正則方形グリ ッドは、EM法に基づく一般的なNLME母集団 PK/PD推定における実用性が比較的低くなります。 ひずみが正則グリッドもしくはランダムグリッドに 比べて小さいサンプリング法では誤差減少速度がは るかに高速になりますが、数値積分用の代替となる そうしたサンプリング法は、低ひずみもしくは疑似 ランダムと呼ばれるd次元数列を単位ハイパーキュ ーブ全体に分布させることにより得られます(疑似 ランダムの数列および手法に関する、適切かつ一般 的な参考文献については、[2]を参照してください)。 図1には、単位平方上の2000ポイントの一様ランダム 分布におけるひずみが、QRPEMに使用されるタイ プのSobol数列による2000ポイントの分布における ひずみに比べてはるかに大きいことを、示していま す。 低ひずみ数列の基本的な概念は比較的新しく、1960 年代の、様々な人々の貢献を起源としています。こ の概念は、後にNiederreiterによって(t,m,s) netへと 一般化されました(そのため「ネット」は、「グリ ッド」に類似しているものの、より一般的な意味で 用いられます)。実用的な低ひずみ数列(一般的に は、Faure、Halton、Niederreiter、Hammersley およびSobol数列等が含まれます)は、1960年代後半 から提唱され始めました。現在では、より一般的な 疑似乱数発生器と同程度の速度を持つ非常に高速な 実装が、様々な重要ケースに適用されています。当 初は、特に物理および金融工学における数値積分に、 主に適用されました。後にこの手法は、全てではな いにしてもある種のモンテカルロシミュレーション に対する、より効率的な代替手法の候補として拡張 されました(例えば、この分野は近年、Owenらによ って「スクランブリング」[6]の概念が導入されたこ とである程度は進展しましたが、それでも、SAEM といったマルコフ連鎖モンテカルロ法に基づく手法 Certara Copyright © Certara, L.P. 2011 については低ひずみ数列の適用が難しいことが知ら れています)。 QRPEMに用いられるSobol数列は、母集団PK/PD推 定における興味の主な対象である40次元未満の低次 元空間における数値積分の問題に対して特に大きな 影響を与えることが、広く認識されています。理論 上の誤差減少速度は、Koksma-Hlawkaの不等式によ ってN-1 [log(N)] d以上として証明されており、dが 比較的小さい場合にはN-1に効果的に近付きます。よ り高次元では、一見、[log(N)] dの項が非常に有意と なり、QRのパフォーマンスを低下させるように見え る場合があります。実際に、Koksma-Hlawkaの境界 では、病理学上の非常に「粗い」関数における「最 悪のケース」の減少速度が定義されます。一般的に 母集団PK/PDでは、QR法における「スイートスポッ ト」である、低次元の非常に平滑かつ無限微分可能 な被積分関数が扱われます。この場合、経験的には、 N-1に従った減少速度の誤差が観測されることが多 いです。 検証結果 時期間変動といった幾つかの高度な特性の開発は未 だ進行中ですが、Phoenixに現在実装されている QRPEMアルゴリズムでは、最も一般的なタイプの 母集団PK/PD NLME推定問題に対してNLME推定 を実行できます。例えば、MONOLIX 2.0がリリース された際に付属していた144個のテストケース全て について、高確度の推定値を算出することに成功し ています。 ここでは、示唆に富んだ様々な興味深いテストセッ トから得られた結果を要約し、 a) PH-QR: QR およびSIRの両方が実装されたPhoenix QRPEMア ルゴリズム、 b) PH-MC: QRの代わりにMC サンプリングが実装されたPhoenix QRPEMアルゴ リズム、 c) PH-NS: SIR機能を使用しない標 準的なPhoenix QRPEMアルゴリズムを比較します。 これらに加えて、 d) NM-MC: NONMEM 7 IMPEMアルゴリズム(MCサンプリング、SIRなし) の結果も含まれており、また少数のケースでは、 e) NM SAEM: NONMEM 7 SAEMアルゴリズムの 結果も含まれます。QRPEMとMONOLIX SAEMと の直接比較は、ここでは示しません。 Phoenix NLME pg. 7 「Phoenix NLME の新たなエンジンである QRPEM は、 サンプルサイズ 200 以上の場合には『高確度尤度法』と見なすことが できますが、これは MCPEM 法の場合には成立しません。」 テスト1: 単純な線形モデル 非常に単純な線形モデルが、シミュレーションされ ました。この線形モデルは、固定効果とランダム効 果との和からなるμモデル化された2つの構造パラメ ーターおよび絶対誤差から構成されました。 Y(T) = (THETA_a+ETA_a) +( THETA_b + ETA_b)*T + EPS この時、Tは独立時間変数、THETA_aおよび THETA_bは固定効果、ETA_aおよびETA_bは正規 分布ランダム効果、EPSは正規分布ランダム絶対誤 差です。データは、各被験者の様々なT値における3 個の観測値で構成され、全体の被験者数は1000名で した。全ての固定効果がμモデル化されているため、 ここではSIRアルゴリズムを適用することができま せん。データのシミュレーションに用いられた計画 値は、THETA_ a=THETA_b=1.0、var(ETA_a)=0.09、 var(ETA_b)=0.16、cov(ETA_a,ETA_b)=0および var(EPS)=0.01でした。 絶対誤差に従う線形モデルの特殊なケースでは、FO、 FOCEおよびLAPLACEアルゴリズムの尤度近似は 図 2: Certara pg. 8 全て厳密で、これらに対応する推定手順によって厳 密な最尤(ML)推定が生成されます。この時、FOCE によって算出される厳密なML推定により、拡張最小 2乗法の目的値(ELS OBJ)として-5769.515が得ら れたため、この値を、様々なパラメトリックEMの結 果と比較される真のELS OBJ値のリファレンスと します。以下のグラフに、様々なサンプルサイズの PH-QR、PH-MCおよびNM-MCから出力された、 ELS OBJの最適値を示します(絶対誤差に従うELS OBJ値は、ガウス応答のモデルにおける負の周辺対 数尤度の2倍を表します。これらは、NMで最小化さ れることとなる最も一般的な形式の目的関数です)。 いずれも、反復回数が(収束に必要な回数を上回る) 100回に設定され、同一の初期条件および重点サンプ リング分布設定から実行されました。 グラフが示す通り、PH-QRのELS OBJ値が非常に高 速に(サンプルサイズ200周辺で)真のML値へと収 束する一方、PH-MCおよびNM-MCの値はPH-QRに 比べてはるかに緩やかに収束し、サンプルサイズ800 以上でも有意な違いが見られます。したがって PH-QRは、サンプルサイズ200以上の場合には「高 確度尤度法」と見なせますが、これはMCPEM法の 場合には成立しません。また PH-MCは、NM-MCにほぼ等し い結果を示しましたが、少なくと もNM-MCの3倍の速度で常に実 行されていました。PH-QRの実 行速度は、PH-MCとほぼ同一で した(つまり、MCサンプリング に比べれば、QRサンプリングの コストは無視できます)。確証は ありませんが、PHとNMの速度 差は、EPSの分散が推定される 方法の差が原因であると推測さ れます。EPSの分散値は、 NM-MCでは比較的高コストな 補助的尤度最適化によって推定 される一方で、PH-QRおよび PH-MCではEMアルゴリズムの 期待値ステップから直接算出さ れます。 結論: パラメトリックEM法が 「厳密な尤度」法として見なされ る場合が多いにも関わらず、実際 Phoenix NLME Copyright © Certara, L.P. 2011 「SIR アルゴリズムを実装した場合には、 Phoenix QRPEM および Phoenix MCPEM の実行速度はほぼ同一で、 反復回数が同一の場合の NONMEM MCPEM の約 8 倍でした。」 に出力される尤度値およびELS OBJ値はサンプル サイズに従って向上する近似値であるという事実が、 この例では示されています。QRサンプリングは、 MCサンプリングに比べてはるかに小さいサンプル サイズでほぼ正確な尤度に達し、同一の設定では、 QRの尤度近似はMCの尤度近似に比べてはるかに良 好です。 テスト2: スパースかつ非線形性の高い、困難 なEMAXモデル 結果の概要: スパースかつ非線形性の高い、困難 なEMAX PDモデル上で、PH-FOCEI(NM FOCEI にほぼ等しい)、PH-QR、PH-MCおよびNM-MCを 比較しました。このモデルは、スウェーデンのウプ サラにあるMats Karlssonの研究室でNM SAEMお よびMONOLIX SAEMを伝統的近似尤度モデルと 比較した際に用いられた、最新のモデルセットから 採用されました[4]。1つのデータにつきシミュレーシ ョンされたデータセットが100個含まれるスパース データおよび、Hill係数が3の、非線形性が高い EMAXシグモイドモデルが用意され、全ての解析手 法で実行されました。パラメトリックEM法の場合に は、100、300、1000、3000および10000のサンプル サイズが用いられました。 サンプルサイズが300以上の同一サイズである場合 には、いずれのパラメトリックEM法(PH-QR、 PH-MCおよびNM-MC)でも、ほぼ等しく、本質的 に不偏なパラメーター推定が得られた一方で、 FOCEI法では有意なバイアスが示されました。サン プルサイズが1000以上になると、QRの対数尤度およ びELS OBJ値の確度はかなり高くなりましたが、 MC法ではそれに比べてはるかに低い確度が示され ました。FOCEI法およびパラメトリックEM法の両 方のパラメーター推定を高精度なQR対数尤度とと もに評価したところ、パラメトリックEM法は平均的 にはFOCEより約40単位高いELS OBJを示し、結果 として、QR法およびMC法により生成されるパラメ ーター推定値のほうが真のML推定にはるかに近い ことが、直接的に示されました。サンプルサイズが N=100と最も小さい場合には、MC推定よりもQR推 定のほうが、ML推定への非常に良好な接近を示しま した。PH-MCはNM-MCに比べてはるかに高速(約 8倍)でしたが、推定結果に関する統計的質という点 では、テスト1と同様に、NM-MCとPH-MCのパフ Certara Copyright © Certara, L.P. 2011 ォーマンス間に有意な違いはありませんでした。 このモデルでは、FOCEI以外の全ての手法で、補助 的対数尤度推定手順を用いる必要があります。SIR アルゴリズムを実装した場合には、PH-QRおよび PH-MCの実行速度はほぼ同一で、同一の反復回数に おけるNM-MCの速度の約8倍でした。PH-MCの場 合にはSIRアルゴリズムによって補助的尤度最適化 が単純化されるため、PH-MCとNM-MCとでは解析 過程が大きく異なりますが、それにも関わらずこれ らの結果の統計的質は本質的には同一でした。 PH-QRおよびPH-MCにおいてSIRアルゴリズムを 無効化したところ、全てのパラメトリックEM法 (NMおよびPH)が本質的には同等な速度で実行さ れました。 詳細: 2011年のACoP学会(および2010年のPAGE 学会)で、Elodie Planら[4]は以下のEMAX PDモデ ルを発表しました。 E = E0 + Emax*Dose γ /(Dose γ+ ED50 γ) このモデルからシミュレーションされたデータを用 いて、NM SAEMおよびMonolix SAEMのパフォー マンスが伝統的尤度近似モデルのパフォーマンスと 比較されました(この比較にNM IMPEMは含まれて いませんでした)。ここでは、γは非線形性の程度を 決定するHill係数です(この値が高いほど、非線形性 が高くなります)。今回の検討では、発表されたPlan ケースの中から、γ=3とHill係数が最も高く、かつ、 データが最もスパース(被験者1名につき2個の観測 値)である最も困難なケースが、テストケースとし て選択されました。構造パラメーターE0、Emaxお よびED50は、いずれも、E0 = tvE0*exp(eta_E0)と いった対数正規分布に従う構造パラメーターの形式 で表現されました。Hill係数γは、ランダム効果と対 にはなっていませんでしたが、単純な独立した固定 効果として推定されました。発表されたPlanと同一 の真の固定効果パラメーター値であるtvE0=5、 tvEmax=30、tvED50=500およびγ=3が、用いられ ました。ω行列の真の値は、以下の通りでした。 E0 0.0900 0.000 0.0 EMAX ED50 0.490 0.245 0.490 Phoenix NLME pg. 9 「サンプルサイズが最も小さかった場合でも、この尺度における Phoenix QRPEM パラメーター推定の質はかなり高いままで、Phoenix MCPEM および NONMEM MCPEM の推定に比べて有意に優れていました。」 TRUE FOCEI PH-MC PH-QR tvE0 5.00 5.00 (0) 5.01(+0.2) 5.01(+0.2) tvEmax 30.00 26.6(-13) 29.9(-0.3) 29.6 (-1) tvED50 500 521(+4) 499(-0.2) 496(-1) γ 3.00 2.66(-10) 2.98(-1) 3.02(+1) stddev(eps) 0.1 0.128(+28) 0.108(+8) 0.103(+3) Omega(1,1) 0.09 0.088(-2) 0.088(-2) 0.089(-1) Omega(2,2) 0.49 0.48(-2) 0.50(+2) 0.48(-2) Omega(3,2) 0.25 0.18(-28) 0.24(-4) 0.25(0) Omega(3,3) 0.49 0.42(-14) 0.48(-2) 0.47(-4) 表1:パラメーター推定値の平均および(%バイアス) 残差モデルには、stddev(ε)=0.1の比例誤差が用いら れました。 我々のモデルとPlanモデルとを比較す ると、我々のモデルでは被験者数が1000名であるの に対してPlanモデルでは100名であるという点のみ が、異なります。 サンプルサイズが300の場合について、データセット 100個全体におけるFOCEI、PH-MCおよびPH-QR の平均の推定値およびそれに対応する(%バイアス) を、下表に示します。NM-MCの結果は割愛しますが、 PH-MCの結果に非常に類似していました。 表から判る通り、FOCEIのバイアスは、重度ではな いものの、最も大きい場合にはパラメトリックEM法 から得られるバイアスに比べてはるかに大きいこと が示されています。 真の周辺対数尤度(もしくはこれと同等な真のELS OBJ値)が、いかなるパラメーター推定値のセット が与えられた場合にも高確度で算出できる場合には、 パラメトリックEM法とFOCEI法との間でパラメー ター推定の相対的な質を測る尺度として、推定法間 での高確度ELS OBJ値の差および真の(高確度)ML 値からの差を評価します。後述する通り、サンプル サイズ3000以上でQRサンプリングされた積分を用 いれば、真のELS OBJレベルの非常に高確度な推定 が、(0.5 ELS OBJ単位以内で)得られます。この 真のELS OBJスケールについてデータセット100個 全体の平均を見たところ、パラメトリックEM法では FOCEI法より40.1 ELS OBJ単位高い、より良好な Certara pg. 10 推定が生成されており、これは統計学的には非常に 有意な差です。また、サンプルサイズが300以上の場 合には、パラメトリックEMの最適な推定値から真の ML推定までの平均の距離が1.0 ELS OBJ単位未満 だったため、妥当なサンプルサイズであればいずれ のパラメトリックEM法でも本質的に真のML推定が 実際に生成されました。サンプルサイズがN=100と 最も小さかった場合でも、この尺度におけるPH-QR パラメーター推定の質はかなり高いままで、PH-MC およびNM-MCの推定に比べて有意に優れていまし た。 以下の一般的なデータセットについてのグラフでは、 様々なサンプルサイズサイズでのPH-QR、PH-MC およびNM-MCにより出力された最適な近似ELS OBJ値と真のML ELS OBJ値との比較を示します。 グラフで示されている通り、QRの出力値は、MCの 値に比べてはるかに高速に真のML値へと収束しま す。この挙動は、出力されるELS OBJ値が尤度の数 値積分による評価から直接得られる、QRの理論に非 常によく一致しています。 QRおよびN=1000以上のサンプルサイズを用いた場 合には、出力されるELS OBJ値が1 ELS OBJ単位以 内で収束に達することに注目してください。したが って、サンプルサイズがN=10000と最も大きい場合 には、QRによるELS OBJの評価では「真」の尤度 評価が表され、MCによるELS OBJの評価や、より 小さなサンプルサイズにおけるはるかに狭い範囲の QRに比べ、大幅に異なる結果が示される可能性があ Phoenix NLME Copyright © Certara, L.P. 2011 「SIR 法により、Phoenix QRPEM 法および Phoenix MCPEM 法は、 SIR 法を持たない NONMEM MCPEM 法の約 8 倍高速となる一方、 推定の質は低下しません。」 ります。例えば、サンプルサイズN=300では、PH-MC およびNM-MCのいずれでも出力されるELS OBJの 最適値はおよそ7280で、7259.2であるML値を約20 単位上回る一方、N=300のPH-QRで出力されるELS OBJの最適値は5単位以内の精度を示します。しかし、 N=300以上の時にPH-MCおよびNM-MCから得ら れるパラメーター推定値をN=10000の高精度かつ QRに基づく数値積分を用いて評価した場合のELS OBJ値は、PH-QRのELS OBJ値と同様に、全てが 7259~7260の範囲に含まれます。つまり、MCの各 反復回で評価される目的関数が近似でしかないにも 関わらず、MC法によって厳密なMLパラメーター推 定値が得られました(ただし、ELS OBJ推定値は得 られませんでした)。また、PH-QRでも、これらの サンプルサイズで同様の精度のML値が得られるこ とに加え、高精度のELS OBJ推定値も得られるとい う利点がありました。 ただし、サンプルサイズがN=100と最小の場合には、 パラメーター推定値における真のELS OBJ値だけ でなく、N=100の近似ELS OBJ推定においても、QR サンプリングの優位性が明白になりました。PH-QR 推定値における真のELS OBJは7261.8で、真のML 値との差は2.6 ELS OBJ単位とごくわずかでした。 そのため、サンプルサイズがこのように非常に小さ い場合でも、PH-QRはMLパラメーター推定値に非 常に近くなります。それに比べ、MCパラメーター推 定のELS OBJ値に対する高精度な評価は、ML推定 から10単位以上離れており、QRの場合に比べて非常 に有意に劣っていました。N=100で出力される近似 尤度ELS OBJ値についても、MCに比べてQRのほう が50単位以上も高確度でした。 最後に、実行時間に関しては、PH-QRおよびPH-MC はNM-MCに比べてはるかに高速でした。例えば、サ ンプルサイズ1000で100回反復するために必要とな る時間は、PH-QRおよびPH-MCの場合には約400秒 であるのに対し、NM-MCの場合には3200秒以上と8 倍でした。これは、PHの解析手法にSIRが使用され ていることが原因である可能性があります。こうし た差の直接の原因がPH-QR内およびPH-MC内の SIRアルゴリズムであることを検証するために、SIR が無効化された特別なバージョンのPH-QRおよび PH-MCを設定しました。この場合には、PH-QRお よびPH-MCのランタイムは約2900秒まで増加し、 NMのランタイムとの誤差は 10%以内でした。 結論: a) 今回のスパースデータかつ 非線形性の高いモデルでは、パ ラメーター推定に対する(QRサ ンプリングを用いた)高精度の 尤度積分評価およびバイアスの 両方で評価された通り、サンプ ルサイズがN=300と中程度の時 にはいずれの「高確度」パラメ トリックEM法でも、近似尤度法 であるFOCEIに比べて有意に 優れた推定値が生成されました。 図 3: Certara Copyright © Certara, L.P. 2011 b) いずれのサンプルサイズで も、PH-MCおよびNM-MCで報 告される最適な対数尤度および ELS OBJ値はほぼ等しいこと が示されました。しかし、真の ELS OBJ値と比較した場合に は、PH-QRで報告される対数尤 Phoenix NLME pg. 11 「疑似ランダムサンプリングでは、MC サンプリングに比べ、 はるかに高度にクラスター化された結果が様々な初期条件から 生成されるだけでなく、生成される ELS 目的値もはるかに正確です。」 度およびELS OBJ推定のほうがNM-MCに比べ てはるかに高確度でした。理論から予測される 通り、QRの尤度評価はMCの評価よりはるかに 正確でした。 c) サンプルサイズが300以上である場合には、同 一のサンプルサイズでのMCの尤度近似に比べ てQRの尤度近似がはるかに正確であるにも関 わらず、絶対的な高確度尤度スケールにおける QRおよびMCのパラメーター推定の統計的質は 非常に類似していました。 サンプルサイズが100 と最小であった場合には、この高確度スケール で評価された通り、PH-QRの推定量はPH-MC の推定量に比べて有意に優れていました。この ように小さなサンプルサイズの場合にも、 PH-QRの推定量は真のML推定量にかなり接近 していました(差は真の値から3 ELS OBJ単位 未満でした)。 d) このモデルで使用されるSIR法により、PH-QR 法およびPH-MC法はSIR法を持たないNM-MC 法の約8倍高速となる一方、推定の質は低下しま せん。PHのSIR法を無効にすると、PHおよび NMのランタイムはほぼ等しくなります。その ため、このケースではSIRアルゴリズムの適用 によって大きな影響が与えられていました。 テスト3: 比較的容易な急速静脈注射モデルに おける再現性およびELS OBJ精度の検証 結果の概要: MONOLIX 2.0のリリースに含まれて いるMONOLIXテストモデルの中で最も単純なモデ ルは、リッチデータの単回投与1コンパートメント急 速静脈注射モデルです。このモデルが、PH-QRおよ びNM-MCを用いて様々な初期条件から実行されま した。また、Phoenix NLME内の適応ガウス求積法 (Adaptive Gaussian Quadrature; AQG)により、 非常に高精度の最尤推定が得られました。いずれの 実行からも、パラメーター推定値が、シミュレーシ ョンされた既知のパラメーター値と十分に一致して いるという点で、優れた結果が示されました。しか し、PH-QRの結果はNM-MCの結果に比べてはるか に再現性が高く、各実行では、正しいML推定値が0.1 ELS OBJ単位の範囲内で再現性を持って得られま した。NM-MCの結果はPH-QRの結果に比べてはる かに変動が大きく、実行のたびに1.5 ELS OBJ単位 Certara pg. 12 程度で結果が変動し、大抵は1.0 ELS OBJ単位以内 の時のみ真のML値と一致しました。こうした再現性 および確度は、共変量の探索を実行する際に考慮す べき重要事項です。共変量の探索においては、 NM-MCの実行で観測された程度にELS OBJ値が不 正確であると、共変量の有意性に関して誤った結論 が導かれる可能性があります。 詳細: Phoenixの適応ガウス求積法(AGQ)エン ジンが様々な求積点数で実行され、真のML ELS OBJ値が4041.790にほぼ等しいことを強く示唆する、 以下のような非常に一致した結果が得られました。 AGQ AGQ AGQ 25 Points 100 Points 400 Points ELSOBJ = -4041.788 ELSOBJ= -4041.790 ELSOBJ= -4041.790 (今回のようなd=2という低次元では、等しい求積点 サイズNでのQR法よりもAGQ法のほうが理論上は 高確度であることに、注目してください。ただし、 次元が増加してもQRのパフォーマンスはほぼ一定 のままである一方、残念ながらAGQの理論上の数値 積分パフォーマンスは速やかに低下します。) AGQのグリッドの細かさをさらに向上させても、 ELSOBJもしくはパラメーター推定のいずれの値も 変化しませんでした。 PH-QRによる評価では、AGQと同一の限定した結果 へとほぼ正確に収束し、これは様々な初期条件で非 常によく一貫していました。 PH-QR PH-QR PH-QR PH-QR PH-QR PH-QR PH-QR N=300 start 1 N=300 start 2 N=300 start 3 N=500 start 1 N=1000 start 1 N=2000 start 1 N=2000 start 2 ELSOBJ=-4041.749 ELSOBJ= -4041.749 ELSOBJ= -4041.749 ELSOBJ=-4041.784 ELSOBJ=-4041.788 ELSOBJ=-4041.790 ELSOBJ=-4041.791 パラメーター推定の初期値を50%程度で変動させた 複数の初期条件で実行しても、得られたPH-QRの結 果はほぼ同一であったことに、注目してください。 求積点を最も細かくした場合のAGQおよびPH-QR のパラメーター推定は、少なくとも有効数字4桁まで は同一で、ELSOBJ値も0.001単位の範囲で同一でし た。当然、いずれも基本的には、正確なML推定まで Phoenix NLME Copyright © Certara, L.P. 2011 「Phoenix の新たな QRPEM アルゴリズムの実行速度は、 NONMEM の MCPEM エンジンに比べて有意に高速です。」 達したと結論付けることができます。「一般的」な サンプルサイズであるN=300の時には、PH-QRのパ ラメーター推定は(1%以内の誤差で)ML推定とほ ぼ同一で、ELSOBJ値はML値から0.24単位以内でし た。統計学的観点から言うと、0.24単位のひずみは 取るに足りません。 N=300の時のNM-MCの結果は以下の通りです。 NM-MC NM-MC NM-MC N=300 start1 N=300 start2 N=300 start3 ELSOBJ=-4040.891 ELSOBJ= -4041.368 ELSOBJ= -4042.353 QRPEMに比べるとNM-MCのほうがELS OBJ値の 変動がはるかに大きく、QRPEMの場合には3つの初 期条件全体で0.000 ELSOBJポイントの範囲で変動 していたのに対し、NM-MCの場合には1.5 ELSOBJ ポイントの範囲で変動していました。高精度の場合 には(N=90000)、NM-MCの値が ELSOBJ=-4040.740として得られ、QRPEM=300に おけるELS OBJ= -4040.749にかなり近付きました。 ここからも、MCに比べてQRのほうが数値積分のパ フォーマンスの面で大幅に優れていることが、証明 されます。 結論: QRサンプリングでは、MCサンプリングに 比べ、はるかに高度にクラスター化された結果が 様々な初期条件から生成されるだけでなく、生成さ れるELS OBJ値もはるかに正確です。 テスト4: 2007 MONOLIXテストセットから の1コンパートメント単回投与モデル 背景: 2007年にリリースされたMONOLIX 2.0に は、24種類の基本タイプの1コンパートメントモデル および2コンパートメントモデルが含まれ、それらの 各基本モデルに投与パターンおよびモデルパラメー ターのバリエーションが6種類ずつ用意された、計 144個のテストケースが付属していました。ここでは、 Ke-Vタイプのパラメーターを持つ12種類の基本的 な1コンパートメント単回投与モデルについて、 PH-QR、NM-MCおよびNM SAEMの結果を比較し ます。これらのモデルは、6種類の線形消失モデルお よび6種類の非線形ミカエリスメンテン消失モデル から構成されており、いずれも比例誤差ガウス残差 モデルが設定されています。データが比較的リッチ Certara Copyright © Certara, L.P. 2011 であったにも関わらず、これらのモデルの多くが PHX ELS FOCEIおよびNM FOCEIにとっては収 束が困難であることが判明し、これらのモデルの大 多数でPHX ELS FOCEIおよびNM FOCEIの両方 が収束に失敗しました。[5]で報告されている通り、 MONOLIXのSAEMでは、データセットのシミュレ ーションに用いられた既知のパラメーター値にほぼ 一致する優れた推定が、いずれのモデルでも得られ ました。 結果の概要: 奇数番号のモデルでは線形消失、偶 数番号のモデルではミカエリスメンテンの非線形消 失に従います。モデルおよび真のパラメーター値の 詳細については、[5]のExprimoの報告を参照してく ださい。 NM-MCおよびPH-QRはいずれも、初期設定のサン プリングレベルであるN=300サンプル/被験者で実 行され、最大反復回数は2000回でした。NM-MCは 収束基準CTYPE=3で実行され、NM SAEMは最大反 復回数が1000かつCTYPE=1で実行されました。い ずれのケースでも、NM-MCおよびPH-QRは、反復 回数が上限に達する前の早い段階で収束しましたが、 SAEMには最大回数である1000回の反復が必要でし た。 NM-MCおよびPH-QRは、72種類全ての1コンパート メントモデル(および72種類全ての2コンパートメン トモデル)で収束に成功し、既知のパラメーター推 定値と非常によく一致したパラメーター推定が得ら れました。NM SAEMは、以下に示す12種類のモデ ルについては、許容できる範囲の良好な結果が得ら れなかったと判定されましたが、その他の全てのモ デルでは成功しました。初期条件を変えて解析を再 度開始しても成功しなかったため、このモデルにお けるSAEMには大きな変動があることが判りました。 PH-MCの実行速度は、より複雑なモデルの場合に特 に、NM-MCに比べて有意に速く(通常、1.5~3倍)、 テスト2で説明した方法で評価したところ、PH-MC で報告されたELS OBJ値のほうが真のELS OBJ値 にはるかに接近していました。NM-MCはNM SAEM に比べ、実行速度が1.5~2倍高速でした。 詳細: 以下に記載する値は、様々な実行条件での ELS OBJ値と、そのタイミングです。略語「sd」は Phoenix NLME pg. 13 「Phoenix の QRPEM アルゴリズムでは、NONMEM MCPEM に比べて 有意に高い確度で ELS 目的値が得られます。」 「単回投与」を意味しており、これは、各モデルタ イプに組み合わされた6種類の異なる投与バリエー ションの内の1つです。 mlx101 sd PH-QR NM-MC NM SAEM -4041.749 -4040.891 -4041.471 14 sec 20 sec 69 sec 高精度AGQから得られた真のML ELS OBJ値: -4041.790 mlx102 sd PH-QR NM-MC NM SAEM -4090.768 -4090.424 -4089.632 140 sec 165 sec 225 sec mlx103 sd PH-QR NM-MC NM SAEM -4035.484 -4034.644 -4035.201 12 sec 20 sec 74 sec mlx104 sd PH-QR NM-MC NM SAEM -4185.945 -4186.020 -4185.848 120 sec 176 sec 261 sec mlx111 sd(このモデルは、SAEMの収束が困難なモ デルであることが判明しました。NM-MCおよびNM SAEMに比べ、PH-QRの結果には極めて高い再現性 がありました。) PH-QR -3511.458 34 sec PH-QR -3511.459 32 sec(初期条件変更) NM-MC -3510.741 29 sec NM-MC -3508.197 50 sec(初期条件変更) NM SAEM -3458.423 118 sec 異常なELS OBJ値、 貧弱なω推定 NM SAEM -3484.962 116 sec 初期条件変更、異常 なELS OBJ値および貧弱なω推定のまま mlx112 sd – (mlx111 sdと同様に、様々な初期条件 からのPH-QRの結果の再現性は、NM-MCおよび NM SAEMに比べてはるかに良好でした。) PH-QR PH-QR NM-MC NM-MC NM SAEM NM SAEM -3434.675 -3434.779 -3434.974 -3432.923 -3431.192 -3430.728 237 sec 301 sec(初期条件変更) 709 sec 680 sec(初期条件変更) 861 sec 842 sec(初期条件変更) 結論: mlx105 sd PH-QR NM-MC NM SAEM -3829.337 -3829.094 -3828.736 13 sec 23 sec 90 sec mlx106 sd PH-QR NM-MC NM SAEM -3876.126 -3875.227 -3873.968 122 sec 221 sec 290 sec mlx107 sd PH-QR NM-MC NM SAEM -3885.470 -3885.309 -3885.061 15 sec 24 sec 91 sec c) mlx108 sd PH-QR NM-MC NM SAEM -4080.355 -4079.661 -4078.293 180 sec 567 sec 1051 sec テスト5: 2007 MONOLIXテストセットから の2コンパートメントモデル mlx109 sd PH-QR NM-MC NM SAEM -3231.600 -3230.105 -3231.311 43 sec 29.5 sec 120 sec mlx110 sd PH-QR NM-MC NM SAEM -3397.163 -3397.186 -3395.371 106 sec 133 sec 232 sec Certara pg. 14 a) PH-QRおよびNM-MCのいずれのパラメトリッ クEM法でも正確な推定が一貫して得られ、それ らの信頼性はPHおよびNMのFOCEI法に比べ てはるかに良好でした。 b) PH-QRの実行速度は、NM-MCに比べて有意に 高速でした。 NM SAEMは、NM-MCに比べると信頼性が若 干低く、実行速度も遅かったですが、FOCE法 に比べると信頼性がはるかに良好でした。 背景: テスト4で説明した1コンパートメントモデ ルに類似した、単回投与に基づく12種類の2コンパー トメントモデルにおける、PH-QRおよびNM-MCの タイミングの比較およびELS OBJの結果サンプル を、より大きなデータセットを含むいくつかの追加 のモデルと一緒に示します(実際に、72種類全ての2 コンパートメントモデルがPH-QRでの実行に成功 Phoenix NLME Copyright © Certara, L.P. 2011 し、全てのケースで高確度の推定が得られました)。 いずれのモデルでも単純な比例ガウス誤差εが用い られ、全ての構造パラメーターがμモデル化されてい ました(ただし、PH-QRではEステップで直接算出 された残差が用いられるのに対し、NM-MC法では補 助的尤度関数最適化を用いてvar(ε)が推定されると 推測されます。これが、PH-QRがNM-MCに比べて 高速であることが観測される原因であると、考えら れます)。1コンパートメントモデルの場合と同様に、 奇数番号のモデルは線形消失に対応しており、偶数 番号のモデルは、奇数番号のモデルに比べて大幅に 困難かつ時間を要する非線形ミカエリスメンテンモ デルです。1コンパートメントモデルと同様に、これ らのモデルの大半で、NM FOCEIおよびPH ELS FOCEIが収束に失敗しました。奇数番号の各モデル には、サンプルサイズは比較的小さいもののデータ 量は十分に豊富な単回投与データセット「sd」、デ ータ量がsdに比べてかなり大きな反復投与データセ ット「all」という、2つのデータセットが含まれてい ます。偶数番号の非線形モデルについては、ここで はsdの結果のみを示します。 結果の概要: PH-QRおよびNM-MCはいずれも、 ここに示す全てのモデルで収束に成功し、データの シミュレーションに用いられた既知の値とほぼ一致 する優れたパラメーター推定が生成されました(実 際には、PH-QRは72種類全ての2コンパートメント ケースで成功しました)。PH-QRは実行速度が NM-MCより高速である場合が多く(2~5倍)、ま た、比較のために高精度AGQが実行されるように選 択されたケースではELS OBJ値の確度もNM-MCに 比べてはるかに高く、NM-MCのELS OBJ値が真の 値から約2.0ELS OBJ単位であったのに対して PH-QRのELS OBJ値は0.2 ELS OBJ単位以内でし た(この観測結果のデータは示されていません)。 上記のテストケースの一部は固定された反復回数で 実行されましたが、ここではそれとは異なり、各ア ルゴリズムの内部の収束基準に合致した時点で実行 が終了されました。そのため、いくつかのタイミン グ差については、反復カウント(下表内のITERS) の差が原因の一部である可能性があります。 詳細: Method/Model Dataset Time ELSOBJ ITERS PH-QR201 NM-MC201 PH-QR201 NM-MC201 sd sd all all 97 sec 245 sec 245 sec 223 sec 20296.006 20296.391 65933.468 65932.981 80 113 60 39 PH-QR202 NM-MC202 sd sd 286 sec 1008 sec -4221.047 -4220.901 130 201 PH-QR203 NM-MC203 PH-QR203 NM-MC203 sd sd all all 29 sec 90 sec 78 sec 122 sec 19834.529 19834.882 65133.507 65133.733 40 41 40 20 PH-QR204 NM-MC204 sd sd 128 sec 809 sec -4150.415 -4151.040 50 154 PH-QR205 NM-MC205 PH-QR205 NM-MC205 sd sd all all 51 sec 222 sec 152 sec 509 sec -3801.372 -3801.406 -13696.353 -13696.055 60 86 60 91 PH-QR206 NM-MC206 sd sd 158 sec 652 sec -4088.784 -4089.790 60 117 PH-QR207 sd 71 sec 19555.424 80 Certara Copyright © Certara, L.P. 2011 Phoenix NLME pg. 15 NM-MC207 PH-QR207 NM-MC207 sd all all 213 sec 154 sec 553 sec 19554.815 64282.186 64282.751 82 60 83 PH-QR208 NM-MC208 sd sd 293 sec 902 sec -3996.374 -3994.868 80 86 PH-QR209 NM-MC209 PH-QR209 NM-MC209 sd sd all all 36 sec 180 sec 166 sec 378 sec -3356.841 -3356.903 -13220.644 -13220.921 40 39 60 28 PH-QR210 NM-MC210 sd sd 166 sec 630 sec -3384.766 -3386.107 60 85 PH-QR211 NM-MC211 PH-QR211 NM-MC211 sd sd all all 79 sec 557 sec 234 sec 1496 sec -3569.209 -3570.122 -13487.620 -13488.557 80 179 80 179 PH-QR212 NM-MC212 sd sd 199 sec 1129 sec -3693.311 -3692.731 60 109 結論: a) PH-QRおよびNM-MCのいずれのパラメトリッ クEM法でも正確な推定が一貫して得られ、それ らの信頼性はPHおよびNMのFOCEI法に比べ てはるかに良好でした。 b) PH-QRの実行速度は、NM-MCに比べて有意に 高速でした。 c) PH-QRでは、NM-MCに比べて有意に高い確度 でELS OBJ値が得られました。 参考文献 [1] A. Schumitzky. Nonparametric EM Algorithms for Estimating Prior Distributions. App. Math. and Computation 45: 143-158, 1991. [2] H. Niederreiter. Random Number Generation and Quasi-Monte Carlo Methods. SIAM. 1992. [3] P. Girard and F. Mentre’. A Comparison of Estimation methods in Nonlinear Mixed Effects Models Using a Blind Analysis. PAGE Certara pg. 16 2005. Pamplona, Spain. http://www.pagemeeting.org/page/ page2005/PAGE2005O08.pdf [4] E. Plan, A. Maloney, F. Mentre’, M. Karlsson and J. Bertrand. Performance Comparison of Various Maximum Likelihood Nonlinear Mixed-effects Estimation Methods for Pharmacodynamic Models, American Conference on Pharmacometrics. San Diego. April, 2011. http://www.go-acop.org/2011/posters http://www.page-meeting. org/pdf_assets/4694-Elodie_Plan_ PAGE_Poster.pdf にある、PAGE 2010年前期バ ージョンでも閲覧できます。 [5] C. Laveille, M. Lavielle, K. Chatel, P. Jacqmin. Evaluation of the PK and PK-PD libraries of MONOLIX: A comparison with NONMEM, PAGE 2008; also P.Jacmin, C. Laveille, M. Lavielle, Software Evaluation : Simulation of PK Data Sets for Evaluation of the Monolix PK Library, June 6, 2007, Exprimo report. Phoenix NLME Copyright © Certara, L.P. 2011 [6] A. Owen. Scrambling Sobol and Niederreiter-Xing points. J. of Complexity 1998. 14:466-89. [7] Rubin, D.B. (1987) J. Am. Stat. Assoc., 82, 543-546 (1987). [8] J. S. Liu, Monte Carlo Strategies in Scientific Computing, Springer, 2008. We’re the name behind the names you know. Certara は、従来であれば組織内の複数の部門や分散した研究活動のために統合が妨げられていた技術、ワー クフローおよび処理過程を統合し、創薬および開発業界を前進させ、トランスレーショナルサイエンスの構想 を実現するために、業界トップの科学の買収に基づいて設立されました。 TM Certaraは、創薬から前臨床や臨床までに及ぶ医薬品開発の全範囲に渡って、最新の研究および開発情報科学 を予測科学の方法論と組み合わせることにより、従来であれば提供できなかった医薬品開発の最初から最後ま でのソリューションを製薬企業および生物工学企業に提供し、人々の健康の向上を追求します。 おそらく、我々のソリューションのいくつかについては既にお持ちでしょう。是非、その他のソリューション についてもご参照ください。 全ての製品名は、Certara, L.Pの商標もしくは登録商標です。 その他全ての商標は、それら個々の所有者の所有物です。 Printed in U.S.A. Copyright © Certara, L.P. 2011 04.12 Certara Copyright © Certara, L.P. 2011 Phoenix NLME pg. 17
© Copyright 2024 Paperzz