スペクトル検索講座② 検索にふさわしいスペクトル - Bio-Rad

THE SADTLER NEWSLETTER
Vol. 28 Jun., 2010 (Japanese)
スペクトル検索講座② 検索にふさわしいスペクトル
前号では検索ソフトウェアの役目と検索対象とするデータベースによる検索結果の違いについて説明しました。前回
も触れましたが、検索ソフトウェアにスペクトロスコピーに関する知識はありません。検索ソフトウェアの仕事は、
測定スペクトルとデータベーススペクトルの形を面積やピークの傾きに着目して比較し、その計算結果を数値化して
リストすることであることを認識し、ユーザーは検索条件の設定という形スペクトル検索をサポートしなければなり
ません。検索する測定スペクトルは検索ソフトウェアを混乱させないスペクトルであることが必要です。今回は検索
にふさわしいスペクトルの条件とそれに合わせるためのデータ処理の効果、検索結果の違いを紹介します。
測定条件の調整
ここでは下のスペクトルを検証してみます。
スペクトル検索では、未知化合物サンプルのスペクトル
の測定条件がデータベーススペクトルと同じであること
が前提となっています。サーチアルゴリズムはピークの
位置と強度だけでなく、その面積を比較して検索結果を
出します。スペクトルのピークは、たとえそれがノイズ
によるものであってもピークとして検索の対象にされて
しまいます。ベースラインが歪んでいたり、不当に大き
なピークのあるスペクトルはスペクトル全体の面積に影
響します。このように条件を満たしていないスペクトル
ではサーチアルゴリズムを混乱させ、未知化合物同定の
目的を達成することはできません。
スペクトル検索をするときには、測定スペクトルの次の
点に注意してください。
*
横軸の範囲
*
縦軸のスケール
*
測定方法
*
ベースラインが歪んでいないこと。
*
ノイズのないスペクトルであること。
スペクトルは高分子関連のサンプルを ATR 法で測定し
たもので、ATR 補正等のデータマニピュレーションは
行っていません。
このスペクトルを次の条件でサーチしたのが下図
(HitList1) です。
ちなみにサドラーのスペクトルデータベースは特別なも
のを除き、次の条件で測定されたスペクトルが登録され
ています。
*
波数範囲:4000~500cm-1
*
吸光度(縦軸値):0~1
*
KBr錠剤による透過法
*
ベースライン補正済み。
*
不要なノイズを除去。
サーチアルゴリズム:1st Derivatives、
データベース:ハブ・イットオール IR( すべての IR ス
ペクトルデータベース )、<ATR スペクトルとして検索
する > にチェック。
この条件に合わないスペクトルの場合、データ処理で、
条件を整える必要があります。データ処理をした場合と
しない場合の検索結果を比較します。
1
Sadtler Newsletter Vol.28
リストされたエントリーの物性情報を確認すると、化合
物はポリプロピレンとなっており、データベースに登
録された測定方法は気相サンプルのものであることが
わかります。二酸化炭素領域のピークに重きが置かれ
た検索結果であることも明らかで、シャープなピーク
に注目するサーチアルゴリズムの特徴を表しています。
HQI( ヒットクオリティーインデックス ) は未知化合物
同定の決定打とすべきものではありませんが、ヒットリ
スト全体のクオリティーの指標とはなります。HitList1
の最高 HQI が 558、リストの最後にあるエントリー
の HQI が 539 となっています。1st Derivatives では
HQI700 以上で、精度の高いヒットリストとされてい
ます。また、HQI の最高と最低の値の差が小さいのに、
リストされた化合物に一貫性がないものは良質のヒット
リストとは言えないとされています。 このように満足なヒットリストが得られなかった場合、
次の点を考慮する必要があります。
サーチ領域
ノイズとなったと考えられる領域をサーチ領域の対
象外とする。場合によってはデータ処理によって削
除する。
HitList1 よりは HQI は高く、測定方法も一致していま
す。データ処理をしていないため、二酸化炭素領域のピー
クが検索結果の体裁を悪くしており、レポートにした際
にも説得力があるとは思われません。そこでデータ処理
の効果を考えます。
データ処理
データ処理は測定スペクトルをデータベーススペクトル
と同じにするために必要不可欠なプロセスです。レポー
トにおいても体裁のよい検索結果レポートを作成するこ
とができます。また、測定スペクトルでユーザーデータ
ベースを構築する際にも、データベースを構成するスペ
クトルの測定条件を同じにすることでデータアーカイブ
としての価値を高めることができます。
サーチアルゴリズム
ピークの特徴を把握し、サーチアルゴリズムを変更
してみる。( サーチアルゴリズムの詳細については
次号に記載する予定です。
データベースの選択
ここでは行いませんでしたが、事前情報を元にデー
タベースの種類を絞りこみむことで、ノイズとなる
エントリーを排除します。絞込みの対象は、測定方
法、アプリケーション、プロパティーの内容などさ
まざまです。
横軸の範囲を揃える→トランケート / パッド
そこでサーチ範囲を図のように、設定変更して検索をし、
その結果 (HitList2) を示します。
測定スペクトルの波数範囲がデータベーススペクトルと
異なる場合には波数範囲を IR 標準の 4000 ~ 500 に指
定します。これより広い範囲のデータは削除されます。
測定スペクトルの範囲がこれより狭い場合にはパッドコ
マンドが実行され、指定領域までを < ゼロ > か < 終点
の値 > のうちどちらかの値を埋め込みます。通常は終値
で埋め込みます。今回のスペクトルの場合、600cm-1 以
下の大きなノイズは検索の障害となります。また、600
以下のピークは同定の決め手とはならないため高波数域
を 4000、低波数域を 600 とします。次がトランケート
したスペクトルです。
分光器によっては赤外領域外のデータまで測定されてい
るスペクトルもあります。画面に表示されていない場合、
領域をカットしないままで検索をすると、思わぬ検索結
果が作成されてしまうことがあります。
Sadtler Newsletter Vol.28
2
ピーク削除
ノイズを除去する→スムージング
サンプルが固体や液体の場合、2390 ~ 2225cm-1 に現
れるピークは二酸化炭素によるものです。サドラーのス
ペクトルデータベースはこのような物質同定に不必要な
ピークは削除してありますので、測定スペクトルでもこ
れを削除します。KnowItAll では検索のノイズとなると
いわれる領域が登録されています。ワンクリックで設定
された 2390-2285cm-1 領域の二酸化炭素によるピーク
を削除することができます。
微量サンプルの場合、ノイズの多いスペクトルとなりま
す。ノーマライズでノイズとなる小さなピークを平滑化
することができます。
下がデータ処理をしたスペクトルです。
検索
ベースライン補正
次にベースラインを真直ぐにします。< マウスで選択>
にチェックをいれ、スペクトル上をクリックし、ベース
ラインを水平にします。KnowItAll では、プレビュー画
面で補正状況を確認しながら、作業することができます。
スペクトルサーチにおける検索条件にはサーチ領域、
サーチアルゴリズム、データベースの選択があります。
このスペクトルにはシャープなピークがあるため、サー
チアルゴリズムには 1st Derivatives、データベースは
ハブ・イットオール IR( すべての IR スペクトルデータ
ベース )、測定スペクトルが ATR によるものなので、サー
チ条件に <ATR スペクトルとして検索する > と設定し
ました。
下図 (HitList3) はデータ処理したスペクトルの検索結
果です。検索結果から、一目でポリプロピレンもしくは
その関連製品のスペクトルであることが判ります。
測定方法を揃える→ ATR 補正
ATR 法では低波数側に大きな吸収があるようなスペ
クトルになります。サドラーの供給しているスペクト
ルデータベースの大部分は透過法で測定したスペク
トルです。このデータベースで ATR スペクトルを検
索するには ATR 補正は必須のデータ処理となります。
KnowItAll の ATR 補正は ZnSe 45°の ATR 結晶を使っ
たスペクトルを前提としています。ここではサーチ条件
で ATR スペクトルの設定を行いますので、データ処理
は省略します。
縦軸のスケールを揃える→ノーマライズ
分光器によっては、縦軸のスケールを信号強度のままス
ペクトルとして取り込むことがあります。定量を目的と
したスペクトルであるならばそのまま利用することがで
きますが、スペクトル検索用のスペクトルとしては適当
ではありません。IR では吸光度スペクトルが検索の前
提ですので、吸光度表示で高を 1、低を 0 に設定します。
透過率スペクトルも自動的に吸光度モードに変換されま
すので、この値を使用してください。
3
HitList2 からも未知化合物がポリプロピレンであるこ
とは読み取れますが、測定スペクトルとデータベースス
ペクトルが見た目に一致感がなく、HQI の値と違和感
があります。どちらの検索結果が信頼できるかは、一目
瞭然です。
スペクトル検索において、データ処理は手間なようでも、
一番確実で、効率的な未知化合物同定のプロセスです。
Sadtler Newsletter Vol.28
お知らせ
パッケージデータベースが新フォーマットになります
2012 年 1 月より、パッケージデータベースを新しい
フォーマットで供給いたします。現行フォーマットでご
利用中のデータベースはそのままお使いいただくことが
できますが、2012 年以降は現行フォーマットのデータ
ベースの供給、サポートを終了させていただきますので、
ご了承の下さい。
新フォーマットへの移行措置について
2010~2011 年に購入またはアップグレードされたデー
タベースは、2012 年以降に無償で新フォーマットへ変
換することができます。
フォーマット変更の理由とメリット
従来より一部のパッケージデータベースの構造式やプロ
パティーにバグがありました。インフォマティクス事業
部ではその問題を解決または回避すべく、都度バグの除
去や修正ファイルを提供を行ってきましたが、このたび、
すべてのデータベースに登録されている構造式やプロパ
ティーを一新すべくファイルフォーマットの変更が決定
されました。
これを機にパッケージデータベース用のセキュリティー
デバイスとコントロールファイルが廃止されます。この
ためデータベースのインストールやバックアップメディ
アの管理が容易になり、データベースの追加購入などの
仕様の変更も簡単になります。
2001 年にデータベース ABC を購入したと想定して説
明します。
このユーザーが 2010-2011 年末までにデータベース D
を追加購入する場合、2017 年まで ABCD すべてのデー
タベースが無償アップグレードの対象となります。
2012 年までに ABC を現行フォーマットにアップグレー
ドしても、2017 年までは新フォーマットへのアップグ
レードは無償となります。さらに 2012 年以降にデータ
ベース D を追加購入する場合、発生する費用は D の価
格のみです。
しかしながら、このユーザーアップグレードせずに
2012 年以降に D を追加購入する場合、現行フォーマッ
トと新フォーマットを一つの PC で混在させることがで
きませんので、既存の ABC も新フォーマットへアップ
グレードしなければなりません。追加データベースの費
用とは別にアップグレード費用が発生します。
新しい PC や OS に対応するため、今後ソフトウェアの
アップグレードは必須となります。これに伴い、データ
ベースもアップグレードも必要となります。
早めの対応をお願いいたします。
新フォーマットデータベース導入のスケジュールの概要を下に示します。
本スケジュールは今後変更されることもありますので、ご了承願います。
2000 2001 2002 ・
・
・
・
・
・
2009
2010
移行措置期間
新フォーマット 供給開始
アップグレード
アップグレード不可
新フォーマット 無償アップグレード
旧フォーマット
現行フォーマット
お問合せ、ユーザー登録は
2012
2011
購入/アップグレード
新フォーマット 無償アップグレード
新フォーマット 有償アップグレード
[email protected]
へ
本紙に記載された会社名または製品などの固有名詞は各社の商標または登録商標です。記載内容や製品に関するお
問合せ、ご要望は下記までお願いいたします。
バイオ・ラッド ラボラトリーズ株式会社
インフォマティクス事業部
〒114-0002
東京都品川区東品川2-2-24 天王洲セントラルタワー20F
TEL 03-6361-7080 Fax 03-5463-8483
E-mail [email protected]
Sadtler Newsletter Vol.28
4