ノンブルの桁数増えたら柱の隔たり 1桁=6Q 2桁=12Q 3桁=18Q にする 薬学図書館 51(4),287-298,2006 287 PubMed と MEDLINE とその他のデータベースの比較 小 河 邦 雄 [抄録] PubMed は医学関連文献を無料で検索できるため,企業の研究所においても 用す る人は多い。しかし,その特徴を理解して うべきであり,セキュリティーの面にも注意する 必要がある。今回,PubMed の主な情報源である M EDLINE を薬学関連の調査で定評のある EM BASE と比較することにより,収録雑誌や索引の違いによって,大きく検索される件数が 異なることを確認した。また,PubM ed の検索システムや位置づけなどを 察することによ り,企業の研究部門として,どのように対応していくかを述べる。 [キーワード] MEDLINE,EM BASE,情報検索,エンドユーザー検索,情報セキュリティー ているため,新しい薬剤名が次々に追加されるこ 1. は じ め に とはない。このことから,薬剤の検索でどの程度 PubM ed は M EDLINE を 検 索 す る た め の Web ツールとして高機能化しており,無料で操 作性も良いため企業の研究者も多く利用してい る。しかし,インターネット特有のセキュリティ ー面での心配があるにもかかわらず,情報部門と して利用状況をつかんでいないのが実態である。 の再現性があるかを他の DB と比較し,その原因 を調べた。 2.1. 日本製薬情報協議会 今回の調査は,日本製薬情報協議会(Pharmaceutical Information Association of Japan:以 下 PIAJ と略す)の関東支部勉強会において,参 さらに,PubM ed は 用や秘密保持に関する契 約もなく,自己責任で 用されている。これらの 加各社(13社 17名)で 現状を踏まえ,ユーザーが適切にデータベース た。以前の勉強会で治験薬の各段階での採録状況 (以下 DB)を い けられるように,その利用 注意点について喚起する必要から,今回,PubM ed とそのデータソースである M EDLINE につ いて他の DB と比較し,その特徴を調べた。 2. 薬 剤 の 検 索 担して調査を行ったも のを基に,筆者が必要な追加調査を行いまとめ を見るために Derwent Drug File,MEDLINE, EMBASE,CA の比較を行い ,EMBASE の薬 剤検索における優位性が実証されていたので, MEDLINE で検索されずに EMBASE でのみ検 索されるケースの原因について検証した。 2.2. 調査の方法 文献が DB で検索されるためには,①収録雑誌 MEDLINE は,本来医学関連 DB であり,索 引語付与数も決まっているため,文献中のすべて であること②論文が採録基準を満たしていること の薬剤が索引されるわけではない。また,統制語 ③タイトル,抄録,キーワードの中に検索語が含 シソーラスの MeSH も全体量がある程度決まっ まれることの 3点が必要である。これらの点につ いて M EDLINE と EMBASE の検索結果を比較 Kunio OGAWA 大正製薬(株) 合研究所研究システム部 (日本製薬情報協議会会長) 〒 331-9530 さいたま市北区吉野町 1-403 E-mail: piaj21@ybb.ne.jp した。検索する薬剤は,Pharmaprojects で 2005 年以降に臨床試験に移行した 491薬剤を STN の MEDLINE,EMBASE で 一 般 名 を 用 い て 検 索 し,その件数差が 10件以内の 63薬剤を抽出し ノンブルの桁数増えたら柱の隔たり 1桁=6Q 2桁=12Q 3桁=18Q にする 288 薬学図書館 51(4),2006 図 1 調査結果記入シート記入例 図 3 EM BASE のみで検索された文献の内容解析 図 2 M EDLINE と EM BASE での治験薬検索 数 と 重複状況 た。これは,臨床試験の薬剤の収録状況に興味が 持たれることと,この段階の方が検索漏れの影響 が大きいと えられるためである。差を 10件以 内としたのは,解析する負担を調整するためであ EMBASE だけで検索されたユニークな文献数が 半 を超えるものが 15薬剤(83%)あり,EM。一 方, BASE の 優 位 性 が 確 認 さ れ た(図 2) MEDLINE だ け で 検 索 さ れ た 文 献 も 6薬 剤 (33%)あ っ た が,EMBASE の 独 自 性 に 比 べ る。次に検索ノイズの可能性がある単純な名称を MEDLINE の独自性の割合は少なかった。また, EMBASE と MEDLINE の両方で検索された文 除いて 18薬剤に 献の占める割合は,平 り,エンドユーザー検索を想 35%であり,収録雑誌 定 し て,一 般 名 の み で PubM ed と STN の M EDLINE,EM BASE を 検 索 し た。そ し て の重複率 4割より低かった 。この結果を単純化 M EDLINE 検索 を除いた EM BASE データを 出力し,所定の表にしたがって結果をまとめ, 合,EMBASE 独 自 が 6件,EM BASE と MED- 察を記入した(図 1)。 2.3. 臨床試験移行治験薬の検索結果 STN の 検 索 の 結 果,個々の 薬 剤 に お い て, すると,ある薬剤について 10件の文献がある場 LINE の 重 複 が 3件,MEDLINE 独 自 が 1件 と いう関係になる。さらに,EMBASE 独自の 6件 の文献のうち,2件が MEDLINE の収録誌では なく,残りの 4件は M EDLINE に採録されては ノンブルの桁数増えたら柱の隔たり 1桁=6Q 2桁=12Q 3桁=18Q にする PubMed と M EDLINE とその他のデータベースの比較(小河) 289 いるが,索引がないため検索できなかったことが を行い,化学物質名フィールド CN に索引があ わかった(図 3)。非収録誌では,Drugs of the Future(Prous Science)などが目立った。これ る薬剤で,件数的に 100件から 1,000件のものを は新規薬剤の研究開発情報誌で,基礎から臨床ま た。 選択し,最終的に残った 19薬剤を比較対象とし での治験薬調査に有効な雑誌であるが,M EDLINE では収録 し て い な い。ま た,PubM ed 独 2.5. 複数のデータベースでの比較の結果 こ れ ら の 薬 剤 に つ い て M EDLINE, EM- 自の論文が採録された理由は,Automatic Term M apping によって化合物の IUPAC 名が付与さ 。 BASE,CAplus で一般名検索を行った(表 1) ここでは,化学,生化学,医薬等の 野を含む れて検索されたものや,巻号頁の付いていない 9,500誌を収録対象とし,2,400万件の論文や特 Pre-M EDLINE 段 階 の Article in Press で あ っ た。これらの結果を踏まえて,さらに多くのサン 許を採録している CA を加えた。CA は,本来, プルから傾向を確認するために,市販薬について であるが,同義語の収録が多く,比較のために加 調査を行った。 えた。しかしながら,臨床論文が多い市販薬で 2.4. 市販薬での件数の比較 市販薬は Pharmaprojects を 化合物を検索する場合は CAS 番号で検索すべき は,CA の採録件数は低か っ た。M EDLINE は 用し,Novelty が Leading Compound,特許優先権が 1990年以 降,さらに M arket Rating が US$2,001milliom CN フィールドにあるキーワードを 用したので 比較的妥当な件数だと思われるが,EMBASE に 以上の 52薬剤をピックアップした。これらの一 あり,最適なキーワードでない可能性がある。し 般名から,ノイズを含みそうな短い名称を除いて か し,全 般 的 に,EM BASE は M EDLINE の 検索リストを作成した。M EDLINE で予備検索 2∼3倍検索され,全体では 2.4倍と市販薬でも ついては MEDLINE よりも件数が少ないものが 表 1 3種の DB による市販薬の一般名検索件数 No. Drug Name M EDLINE 1 TERIPARATIDE 2 BOSENTAN 3 MONTELUKAST 4 TIROFIBAN 5 EPTIFIBATIDE 6 VERTEPORFIN 7 BORTEZOMIB 8 ZANAMIVIR 9 OSELTAMIVIR 10 EZETIMIBE 11 ERLOTINIB 876 961 805 12 13 14 15 16 17 355 327 325 306 277 186 GLIMEPIRIDE REPAGLINIDE TADALAFIL VARDENAFIL GEMIFLOXACIN BEXAROTENE 18 PARECOXIB 合計 太字:最も多いもの 706 642 584 600 470 313 421 434 EMBASE 182 1,804 2,252 2,317 2,040 466 1,282 1,265 1,223 1,025 1,738 1,202 1,080 855 813 709 134 436 545 8,908 21,670 CAplus 116 795 603 565 444 245 468 335 276 353 344 587 448 270 274 366 103 307 7,002 ノンブルの桁数増えたら柱の隔たり 1桁=6Q 2桁=12Q 3桁=18Q にする 290 薬学図書館 51(4),2006 検索式を組み立てることが難しい。しかし, 薬 の研究においては,活性の作用点である受容体タ ンパク質や酵素の発見とその阻害剤などのリガン ドの情報は非常に重要である。新規の 薬テーマ 企画に関する調査においても,薬理メカニズム関 図 4 市販薬検索結果全体の重複状況 連の調査は重要で,それらを調査するためのデー タベースとして MEDLINE が適当であるか検証 した。 EM BASE の優位性が確認できた。これらの結果 から,市販薬も M EDLINE だけで検索を行うこ 3.1. 調査方法と結果 Pharmaprojects で前臨床段階の薬剤 3,867件 とは,多くの文献を見逃す結果となることが確認 の中から薬理メカニズム 351種を抽出し,その中 できた。また,これらの検索結果全体の重複状況 から,その他の市販,臨床中,中止などの段階に を調べたのが図 4である。他の DB と重複する文 もあるメカニズムを除いた 105件の集合を作成し 献は 5,000件程度あるが,DB 独自のユニークな た。この集合は,比較的新規な薬理メカニズムと 文献は,EMBASE が圧倒的に多く約 1.3万件で えられ,これらが DB でどのように検索される あった。しかし,MEDLINE も独自の文献を 3 割ほど持っているので,EM BASE の検索だけで か を 検 証 し た。検 索 式 と し て は,Pharmapro- も網羅性を確保できない。ただし,STN は電子 jects の薬理メカニズムが一般的記載で文献中の 記載に近いと想定し,そのまま検索した場合と, ジャーナルと印刷体の間では重複除去できないこ 近接演算子を 用して語順の違いを含めた漏れの とがあるので,実際のユニークな文献はもう少し 少ない検索式を組み立てて検索した場合との両方 少なくなる可能性がある。また,市販薬について で調べた。105件のメカニズムを STN で予備検 は,毒性,副作用情報や EBM のシステマティッ 索して,件数が非常に多い 11件と件数の少ない クレビューなどで漏れの少ない検索をしたい場合 もあるが,件数が多い場合は逆に目的の文献に 64件 を 除 い て 30件 と し,こ れ ら を M EDLINE,EMBASE,CAplus で 本 検 索 し た(表 り込む機能が重要となる。 3) 。以前の勉強会でリガンドを薬理作用の対象と 2.6. 市販薬が MEDLINE で検索できなかっ た理由 して調査した際,CA では独自の文献が多く見ら 次 に,EM BASE の み で 検 索 さ れ た 文 献 が を M EDLINE の収録誌かどうかを調べた。収録誌 であれば,索引に薬剤名が付与されていないこと が検索漏れの原因と えられる。MEDLINE の 2006年収録誌リストを れたので ,ここでも CA を加えた。近接演算子 用した時の個々の件数の増加率は,MEDLINE,EMBASE,CAplus でそのままの検索と 比べてそれぞれ平 29.0,26.5,16.3倍であり, 近接演算子の 用が有効であったが,これらの中 用し ,上位 35件の中 には主題と直接関係のないノイズ文献もある程度 で,M EDLINE 収録誌は 23件(66%)と多く, 薬剤名が索引されていないことが原因とわかった 含まれてしまう。3種類の DB の中で件数が多い (表 2) 。 3. 薬理メカニズムでの比較 ものを網掛けにしたが,ほとんどが CA で,次が EMBASE で,M EDLINE はどれも少なかった。 論文中でのメカニズムの記載は,… Inhibitor な 適応疾病や薬理作用などのキーワードは比較的 どの記述が Inhibitor of…などと倒置されたり, 途中の語句の順番が前後したりすることも多く, 規則性を持って詳細に索引されているが,薬理メ 近接演算子を えないとかなりの漏れが生じる。 カニズムは新しい概念も多く,統制されたキーワ STN ードがなかったり,自由語での検索も略語やキー MEDLINE では近接演算子が えるが, PubM ed では えないので,検索結果が少なく ワード表記のバリエーションが多かったりなど, な る 可 能 性 が あ る。さ ら に,PubM ed に は ノンブルの桁数増えたら柱の隔たり 1桁=6Q 2桁=12Q 3桁=18Q にする PubMed と M EDLINE とその他のデータベースの比較(小河) 291 表 2 EMBASE のみで検索された論文の収録雑誌(市販薬) 雑誌名 論文数 1 Deutsche Apotheker Zeitung 2 Pharmaceutical Journal 217 145 3 Expert Opinion on Investigational Drugs 4 Nature Reviews Drug Discovery 100 100 5 New England Journal of Medicine 6 Phamazeutische Zeitung 99 97 7 Expert Opinion on Pharmacotherapy 8 IDrugs 93 89 9 American Heart Journal 10 Drugs of the Future 11 American Journal of Cardiology 12 Seminars in Oncology 13 Pharmazeutische Industrie 85 85 14 Journal of the American College of Cardiology 15 Journal of Invasive Cardiology 80 78 16 17 18 19 Lancet Circulation Hospital Pharmacy Pharmaceutisch Weekblad 20 Chest 21 Journal of Allergy and Clinical Immunology 77 76 75 75 22 European Heart Journal 23 Formulary 24 British Journal of Cardiology 25 MMW-Fortschritte der Medizin 26 Drugs(e) 66 62 59 83 82 80 27 American Journal of Respiratory and Critical Care M edicine 28 Expert Opinion on Therapeutic Patents 29 Current Pharmaceutical Design 30 Clinical Lung Cancer 31 Drugs and Therapy Perspectives(e) 32 Journal of Antimicrobial Chemotherapy 33 Annals of Oncology 34 European Heart Journal, Supplement 35 Journal of the American Medical Association 66 66 58 56 54 53 52 52 51 49 49 49 48 太字:M EDLINE 収録対象誌 M eSH の Pharmacologic Action で 下 位 に 該 当 する薬剤を一括して検索する機能もないため,同 3.2. 薬理メカニズム検索と PubMed 収録雑 誌 じ M EDLINE を デ ー タ ソ ー ス と し て い て も, M EDLINE と EMBASE を近接演算子を 用 して検索した全 6,620件の中で,M EDLINE の STN M EDLINE と比較して,この面でも不利で ある。 みが 893件,重複が 3,518件,EMBASE のみが 2,209件であった。この EMBASE のみで検索さ ノンブルの桁数増えたら柱の隔たり 1桁=6Q 2桁=12Q 3桁=18Q にする 292 薬学図書館 51(4),2006 表 3 3種の DB による薬理メカニズム検索件数 A:そのまま検索 検索式 No. B:近接演算子(6A)を 用 MED EM CA MED 103 22 16 107 375 173 837 123 752 8 26 5 9 11 136 5 11 56 1 136 1 25 0 0 5 208 0 1 4 14 INTERFERON AGONIST? 15 TOLL-LIKE RECEPTOR ANTAGONIST? 16 UROTENSIN Ⅱ RECEPTOR AGONIST? 17 PHOSPHOFRUCTOKINASE 2 INHIBITOR? 18 PANTOTHENATE KINASE INHIBITOR? 19 SERINE RACEM ASE INHIBITOR? 0 2 0 7 2 0 1 2 6 0 2 2 4 20 21 22 23 24 0 1 0 0 0 1 THROMBOXANE A 2 ANTAGONIST? 2 PHOSPHODIESTERASE V INHIBITOR? 3 PROSTAGLANDIN AGONIST? 4 SODIUM ANTAGONIST? 5 HISTAM INE RELEASE INHIBITOR? 6 POTASSIUM ANTAGONIST? 7 GASTRIN INHIBITOR? 8 SELECTIN ANTAGONIST? 9 TESTOSTERONE AGONIST? 10 ENDOTHELIN B RECEPTOR AGONIST? 11 GLUTAMATE 3 RECEPTOR ANTAGONIST? 12 INTERLEUKIN-10 ANTAGONIST? 13 FACTOR XIA INHIBITOR? BM X TYROSINE KINASE INHIBITOR? LEUKOTRIENE D 4 ANTAGONIST? TIE-1 TYROSINE KINASE INHIBITOR? PROLACTIN RELEASE STIMULANT? EPHRIN B 2 INHIBITOR? 25 FIBROBLAST GROWTH FACTOR RECEPTOR 2 ANTAGONIST? 26 HYALURONAN SYNTHASE INHIBITOR? 27 HYALURONIC ACID AGONIST? 28 INTERLEUKIN 22 RECEPTOR ANTAGONIST? 29 INTERLEUKIN 31 ANTAGONIST? 30 PROTEASE-ACTIVATED RECEPTOR-2 960 17 64 17 100 28 55 126 584 483 407 434 EM 815 1,182 , 401 1 063 732 956 601 978 590 796 435 786 439 582 98 201 175 189 98 155 124 66 295 159 124 59 38 17 34 26 5 2 8 12 4 4 9 6 2 3 0 2 0 0 0 4 2 0 0 0 0 1 0 5 3 0 0 0 0 1 3 1 0 1 0 2 0 2 1 1 1 0 0 1 0 0 0 0 0 2 4 2 2 3 1 9 24 0 11 31 11 7 1 2 CA 5 0 5 3 218 349 72 191 206 111 176 46 15 14 9 8 11 4 15 3 6 8 5 10 7 4 5 ANTAGONIST? 太字:最も多いもの れた論文を雑誌別に集計した(表 4) 。上位 35件 中 29件が MEDLINE 収録誌で,抄録は著 者 抄 録で EM BASE と同じと 4. M EDLINE の雑誌別論文採録数 えると,薬剤名の索 ここまでの調査で検索数の差は索引が主な原因 引と同様,メカニズム索引も EMBASE の方が と思われたが,論文単位で未採録の場合もあり, 豊富と推測された。 データベースによる採録の差を確かめてみた。こ こでは,収録対象誌の選定基準に引用 析を含 み,その結果によって科学技術,生物医学 野の ノンブルの桁数増えたら柱の隔たり 1桁=6Q 2桁=12Q 3桁=18Q にする PubM ed と M EDLINE とその他のデータベースの比較(小河) 293 表 4 EM BASE のみで検索された論文の収録雑誌(薬理メカニズム) 雑誌名 No. 論文数 1 The American Journal of Physiology 2 British Journal of Pharmacology 53 50 3 International Journal of Impotence Research 4 Journal of Cardiovascular Pharmacology 46 43 5 European Journal of Pharmacology 6 Journal of Sexual Medicine 7 American Journal of Physiology―Heart and Circulatory Physiology 8 European Urology 9 Drugs of the Future 41 39 31 29 25 10 Bioorganic and Medicinal Chemistry Letters 11 Journal of Urology 12 BJU International 25 24 22 13 American Journal of Cardiology 14 Agents and Actions. 15 Journal of Pharmacology and Experimental Therapeutics 16 American Journal of Physiology―Gastrointestinal and Liver Physiology 18 17 16 17 18 19 20 21 Hypertension American Journal of Physiology―Regulatory, Integrative and Comparative Physiology Journal of Sexual Medicine(ep) Urology Urologe-Ausgabe A 16 16 16 15 14 13 22 Circulation 23 Drug Development Research 12 12 24 25 26 27 International Journal of Clinical Practice Journal of Medicinal Chemistry Journal of Labelled Compounds and Radiopharmaceuticals Japanese Pharmacology and Therapeutics 28 Expert Opinion on Therapeutic Patents 12 11 11 11 29 Urologic Clinics of North America 30 American Journal of Physiology―Renal Physiology 10 10 31 32 33 34 10 10 9 9 Journal of the American College of Cardiology Nature Clinical Practice Urology Life Sciences Tetrahedron Letters 35 European Journal of Medicinal Chemistry 11 9 太字:MEDLINE 収録対象誌 最も重要な雑誌約 4,500誌を収録する SciSearch においても,DB によってかなり採録数が違っ も加えた。比較した雑誌は,SciSearch の引用 析 か ら 作 成 さ れ る JCR(Journal Citation た。採 録 数 が 多 い の は CA,SciSearch で, Reports)の IF(インパクトファ ク タ ー)上 位 30誌である(表 5)。ISSN(印刷 体 と 電 子 体) で 2005年発行の雑誌を検索したが,著名な雑誌 MEDLINE,EMBASE は少なかったが,これは 同じ雑誌であ っ て も,MEDLINE や EM BASE は医学を中心に収録しているためと推測される。 IF の上位誌はレビュー誌が多く,また,コラム ノンブルの桁数増えたら柱の隔たり 1桁=6Q 2桁=12Q 3桁=18Q にする 294 薬学図書館 51(4),2006 表 5 4種の DB による IF 上位雑誌の論文収録数 No. MED EM CA 発行国 IF ANNUAL REVIEW OF IM M UNOLOGY CA-A CANCER JOURNAL FOR CLINICIANS USA USA NEW ENGLAND JOURNAL OF M EDICINE NATURE REVIEWS CANCER USA UK PHYSIOLOGICAL REVIEWS NATURE REVIEWS MOLECUAR CELL BIOLOGY USA UK 52.4 44.5 38.6 36.6 33.9 33.2 SCI 1 29 29 29 33 2 22 33 0 48 3 1,467 1,202 2,100 1,798 4 83 156 256 211 5 33 30 34 34 6 82 137 235 194 JOURNAL NAME 7 0 0 27 33 REVIEWS OF MODERN PHYSICS 8 78 131 228 187 NATURE REVIEWS IM MUNOLOGY 9 2,534 2,407 3,546 2,808 NATURE 10 2,409 2,314 4,373 2,698 SCIENCE 11 28 28 28 ANNUAL REVIEW OF BIOCHEMISTRY 30 12 383 398 373 456 NATURE M EDICINE 13 449 462 507 462 CELL 14 209 15 1,028 224 222 272 NATURE IMMUNOLOGY 920 2,262 1,387 JAMA-JOURNAL OF THE AM ERICAN MEDICAL 16 306 284 17 19 19 18 29 30 19 399 345 20 1,581 1,407 21 22 23 24 0 84 78 29 0 121 122 29 25 223 231 26 27 135 169 0 28 0 339 0 ASSOCIATION 350 NATURE GENETICS 19 ANNUAL REVIEW OF NEUROSCIENCE 22 28 30 PHARMACOLOGICAL REVIEWS 513 471 NATURE BIOTECHNOLOGY 160 1,738 LANCET 12 SURFACE SCIENCE REPORTS 14 261 205 NATURE REVIEWS GENETICS 244 207 NATURE REVIEWS NEUROSCIENCE 29 ANNUAL REVIEW OF PHARM ACOLGY AND TOXI33 COLOGY 264 239 NATURE CELL BIOLOGY 140 140 CHEMICAL REVIEWS 306 258 NATURE REVIEWS DRUG DISCOVERY 271 9 29 40 43 40 30 121 127 150 USA UK UK USA USA USA USA USA USA 32.7 32.2 31.9 31.5 31.2 28.4 27.6 24.8 USA USA USA USA UK 24.7 NL UK 21.4 21.3 21.2 21.1 UK USA UK USA UK 21 ANNUAL REIEW OF ASTRONOMY AND ASTRO- USA PHYSICS 55 ENDOCRINE REVIEWS 128 CANCER CELL 32.8 USA USA 23.1 22.8 22.4 21.7 20.6 20.2 19.6 18.8 18.8 18.1 太字:最も多いもの のような記事もあり,DB によって論文採録基準 が大きく異なることがわかった。ただ,M EDLINE にまったく収録されていない雑誌は 3誌 で,いかに IF 上位に医学やライフサイエンス関 連 誌 が 多 い か が わ か る。特 に 30誌 中 12誌 が れる論文の数は DB によって大きく異なり,それ が検索数の差の原因の 1つと えられた。 5. M EDLINE の収録対象雑誌の ISSN 番号 nature 系雑誌であり,ブランド力を感じた。結 2006年版リストにある 4,884誌の ISSN 表示 は冊子・電子版の併記が 1,220誌(25%) ,冊子 論として,雑誌が収録対象誌であっても,採録さ 3,564誌(73%) ,電 子 版 100誌(2%)で あ る ノンブルの桁数増えたら柱の隔たり 1桁=6Q 2桁=12Q 3桁=18Q にする PubM ed と M EDLINE とその他のデータベースの比較(小河) 295 をそのように設計しているからであるが,そのた め,文書中の単語の位置情報は保持していないの か,フレーズ検索に有効な近接演算子が えな い。そのため,単語では全文を検索できるが,フ レーズに関しては,登録されたものしか検索でき ない。フレーズが登録されるには,そのフレーズ が複数回用いられている必要があるため,比較的 新しい複数の語句で表される用語は登録されてい 図 5 MEDLINE 収録雑誌と IF 値 ない場合が多い。そのため,複数の語句を and 検索しなければならないので,多量のノイズを含 むこともあり,あまり適当とは言えない。情報担 が,STN の MEDLINE の書誌には一方の ISSN のみ付与されている。例えば nature は,2002年 当者にとっては,近接演算子が えないのは,あ までは冊子の ISSN で,2003年は冊子か電子版 視したと理解できる。しかし,全文が検索できる のどちらか一方で,2004年からは電子版のもの 場合は,エンドユーザーがたまたま入力したフレ が付与されていた。ISSN で検索する場合の検索 ーズでヒットし,それで検索を止めてしまう方が 漏れやマルチファイル検索での重複除去には注意 問題な場合もあるので,目的によって い ける が必要である。MEDLINE の収録対象全雑誌と べきであろう。 IF の 関 係 が 図 5で あ る。2,500件(51%)と 約 半 の雑誌が JCR の収録誌であるが,IF はその 収録されている雑誌 しかわからない。 6. MEDLINE で収録していない高 IF 雑誌 る意味致命的ではあるが,その ,スピードを重 8. PubMed の位置づけ PubMed は,NM L(米国国立医学図書館)内 の NCBI(国立バイオテクノロジー情報センタ ー)が作成している Entrez(アントレ)という MEDLINE の収録対象誌はメジャーなものに 関しては,地域に関係なく収録されているようで 統合型 子生物学 DB の一部として 開されてい ある。表 6は EMBASE の収録対象誌であるが が,本 来 の 目 的 は,Entrez の 中 に あ る,核 酸 M EDLINE では収録対象でない雑誌の中で,IF 値が 1以上のもの 75誌である。JCR 全体の中で DB,タンパク DB などのファクトデータと論文 を結ぶ「要」の役割にある。もちろん,米国の税 IF 値が 1以上の雑誌は 49%あ り,こ の 75誌 は 半 以上のランクにある著名な雑誌といえる。こ 金で作成している DB なので,医学情報を広く れらを見ていくと,62件(83%)は米国以外の を前提としており,企業の組織的 用は想定外と 雑誌であるが,内容的には,化学系など医学以外 言われても仕方がない。また,無料で多くの人が の雑誌が多い。しかし, 薬の構造活性相関に関 アクセスするために,PubMed 収録雑誌として リストアップされようとする出版社や学会からの 係する著名な雑誌も含まれているので,PubMed を検索する場合は,著明な雑誌でも収録されてい ない雑誌がある点も 慮して検索する必要があ る。 7. PubMed の検索エンジン る。MEDLINE のデータを中心に作られている 開するという役割も持っているが,個人での利用 マーケティング対象ともなり,情報のブランドカ タログ的な側面も見られる。また,大量のダウン ロードを行うとサーバーに負担がかかるため,そ の利用者のサーバーからは利用禁止になることも ある。実際に今年の 6月には京都大学で一時 用 PubM ed の利用は,1日 200万件以上あるとの ことであるが,検索スピードは非常に速く,瞬時 できなくなった。こうなると組織のコンプライア に検索件数が表示される。これは,検索エンジン らかの対応をとる必要がある。 ンスの面からも,情報部門はその利用に関して何 ノンブルの桁数増えたら柱の隔たり 1桁=6Q 2桁=12Q 3桁=18Q にする 296 薬学図書館 51(4),2006 表 6 EM BASE にしか収録されていない高 IF 雑誌リスト 雑誌名 1 2 3 4 5 6 Biochimica et Biophysica Acta―Reviews on Cancer European Journal of Cancer, Supplement Current Opinion in Coloid and Interface Science Biochimica et Biophysica Acta―M olecular and Cell Biology of Lipids TrAC―Trends in Analytical Chemistry M utation Reseach―Reviews in Mutation Research IP 16.12 9.02 5.27 5.00 3.89 3.67 出版国 NETHERLANDS ENGLAND ENGLAND NETHERLANDS NETHERLANDS NETHERLANDS 7 Journal of Biomedical Materials Research―Part A 3.65 UNITED STATES ― 8 Journal of Biomedical Materials Research Part B Applied Biomaterials 3.65 UNITED STATES 9 10 11 12 13 Critical Reviews in Oral Biology and Medicine Biochimica et Biophysica Acta―Bioenergetics Biochimica et Biophysica Acta―M olecular Cell Research Biochimica et Biophysica Acta―Biomembranes Biochimica et Biophysica Acta―General Subjects 3.64 3.50 3.48 3.44 3.37 14 15 16 17 Biochimica et Biophysica Acta―M olecular Basis of Disease Current Organic Chemistry 3.05 2.78 2.75 2.74 18 19 20 21 22 23 24 25 26 27 Cognitive Neuropsychology Synlett New Journal of Chemistry European Urology, Supplements Tetrahedron Analytica Chimica Acta Atmospheric Environment Tetrahedron Letters Tetrahedron Asymmetry Synthesis Psychiatry Research―Neuroimaging Biochimica et Biophysica Acta―Proteins and Proteomics 28 Journal of M embrane Science 29 Journal of Atmospheric Chemistry 2.74 2.70 2.64 2.59 2.56 2.48 2.39 2.20 2.15 2.11 UNITED STATES NETHERLANDS NETHERLANDS NETHERLANDS NETHERLANDS NETHERLANDS NETHERLANDS ENGLAND GERMANY ENGLAND NETHERLANDS ENGLAND NETHERLANDS ENGLAND ENGLAND ENGLAND GERMANY NETHERLANDS NETHERLANDS 2.11 NETHERLANDS 2.05 NETHERLANDS 30 Biochimica et Biophysica Acta―Gene Structure and Expression 31 M utation Research―GeneticToxicology and Environmental Mutagenesis 32 Chemometrics and Intelligent Laboratory Systems 33 QSAR and Combinatorial Science 34 Journal of Aerosol Science 35 Environmental Conservation 36 Helvetica Chimica Acta 2.05 NETHERLANDS 2.02 NETHERLANDS 1.90 NETHERLADS 1.88 GERMANY 1.86 ENGLAND 1.84 ENGLAND 1.83 SWITZERLAND 37 Fluoride 38 Enzyme and Microbial Technology 1.78 UNITED STATES 1.76 UNITED STATES 39 Clinical and Diagnostic Laboratory Immunology 40 M olecular Brain Research 1.72 UNITED STATES 1.71 NETHERLANDS 41 Critical Reviews in Environmental Science and Technology 42 Journal of M icrobiology and Biotechnology 43 Biochemical Engineering Journal 1.68 UNITED STATES 1.66 SOUTH KOREA 1.62 SWITZERLAND ノンブルの桁数増えたら柱の隔たり 1桁=6Q 2桁=12Q 3桁=18Q にする PubM ed と M EDLINE とその他のデータベースの比較(小河) 297 表 6 EM BASE にしか収録されていない高 IF 雑誌リスト(続き) 雑誌名 44 45 46 47 48 49 IP Journal of M olecular Catalysis B : Enzymatic Food Chemistry Colloids and Surfaces A : Physicochemical and Engineering Aspects Expert Opinion on Therapeutic Patents Bulletin of the Chemical Society of Japan Aerosol Science and Technology 1.55 1.54 1.51 1.46 1.45 出版国 NETHERLANDS ENGLAND NETHERLANDS ENGLAND JAPAN 1.43 UNITED STATES 50 Journal of Neurolinguistics 51 Neuropsychiatre 1.43 UNITED STATES 1.41 GERMANY 52 53 54 55 56 1.38 1.36 1.34 1.32 1.31 57 58 59 60 61 62 63 64 Pediatric Exercise Science Journal of the Air and Waste Management Association Basic and Clinical Pharmacology and Toxicology, Supplement European Heart Journal, Supplement Nutrition Research Reviews Advances in Environmental Research Arthropod Structure and Development 1.27 1.27 1.25 1.23 Environmental Toxicology and Pharmacology Journal of Biological Physics Hepatology Research Clinical Neuropsychologist Chromatographia Disability and Rehabilitation(ep) 1.17 1.16 1.15 1.14 UNITED STATES UNITED STATES DENM ARK ENGLAND ENGLAND ENGLAND ENGLAND NETHERLANDS NETHERLANDS IRELAND NETHERLANDS GERMANY ENGLAND 65 Colloid and Polymer Science 66 Phlebologie 1.11 GERMANY 1.10 GERMANY 67 68 69 70 1.08 1.07 1.06 1.06 Clinical Neuroscience Research International Journal of Life Cycle Assessment Water, Air, and Soil Pollution Canadian Journal of Chemistry 71 Biocatalysis and Biotransformation 72 Journal of Labelled Compounds and Radiopharmaceuticals UNITED STATES GERMANY NETHERLANDS CANADA 1.05 ENGLAND 1.05 ENGLAND 73 Comparative and Functional Genomics 1.04 ENGLAND 74 Combustion and Flame 75 Aphasiology 1.02 UNITED STATES 1.01 ENGLAND 太字:米国出版 9. PubMed のセキュリティー 報が研究トレンドの調査に われるように,検索 結果からフルテキストへのアクセス情報などは, インターネットは 道であり,ネットワーク途 注目される研究のデータとして利用可能である。 中での一般的な情報漏洩の可能性は えられる。 このプライバシーポリシーは米国内を対象とした また,プライバシーポリシーでは,利用者のドメ ものと思われ,海外については紳士協定的に期待 インや PC の OS,アクセス記録やクッキーの利 するものであり,内容の修正があっても当然連絡 用,そしてその 析のための第三者機関への情報 はなく,常にモニターすることも難しい。無料で 提供も示唆されている 。確かに,論文の引用情 契約がないのはありがたいが,半面,契約ができ ノンブルの桁数増えたら柱の隔たり 1桁=6Q 2桁=12Q 3桁=18Q にする 298 薬学図書館 51(4),2006 ないことでもある。このような点から,戦略に関 教育は,自 たちが用意した情報源について,そ 係する調査や特許性がからむ場合は,慎重に う の い方等を利用者に教えることで済んでいた。 べきである。 現代は,インターネット情報の充実で,我々の知 10. PubM ed とコンピュータ解析 膨大な医学関連情報を含む M EDLINE のデー タについては,それ自体をファクトデータとして らない所で社内ユーザーはいろいろな情報源にア クセスしている。PubMed についても,今回の 調査を行う前は知識が少なかったが,随 勉強に ゲノムとその機能,疾病との関連性を探索するた なった。PIAJ では,関東・関西の両支部でこれ ら新しい情報源についての評価や講演会などの勉 めのバイオインフォマティックス 野での 用が 強会を積極的に行っている。関心のある企業情報 進んでいる。自然言語で書かれた抄録から,キー 担当者のさらなる参加を期待したい 。 ワードの揺れを吸収しながら特定の概念に集約し ていく作業をコンピュータで行うものであるが, これは正にインデキシングの作業に似ている。実 際に,M eSH のインデキシングも本文,抄録等 をコンピュータで解析し,同義語,関連語から, 適切な M eSH タームのリストを提示する索引支 援システムを 用している 。このため,論文執 筆の際は,本文はもちろん抄録においても,それ らのコンピュータ処理を想定した記述を行うこと がその後に大きな影響を与えることがわかる。特 に近年の検索システムの開発は,従来の図書館情 報的なアプローチとは異なる研究 野から,情報 資源の多様な活用を目的として,言語学,コーパ ス,オントロジー,タクソノミー,フォークソノ ミーなどの概念を組み合わせ,目的とする情報や 知識を検索する方法が試みられている 。これら は従来,特定 野に特化して検索技術を深めてき た専門サーチャーをシステム化しようという部 も感じられて興味深い。しかし,その解析コンテ ンツが,例えば M EDLINE だけでいいのかとい う点に関しては,長年それらと格闘してきた検索 担当者としても気になる部 であろう。 11. お わ り に 参 文 献 1) 野田利章. 医学薬学データベースの比較. 薬学図 書館. 46(3), 2001, 215-221. 2) エ ル ゼ ビ ア の EMBASE.com の 説 明 画 面(EM BASE と M EDLINE を 同 時 に 検 索 で き る). http://japan.elsevier.com/products/embase com/index.html>, (参照 2006-08-07). 3) List of Journals Indexed for MEDLINE, 2006. http://www.nlm.nih.gov/tsd/serials/terms cond.html>, (accessed 2006-08-07). 4) NLM Privacy Policy. http://www.nlm.nih. gov/privacy.html>, (accessed 2006-08-07). 5) 阿部信一ほか. 図解 PubMed の い方 インター ネットで医学文献を探す 第 3版. 東京, 日本医学 図書館協会, 2003, 91p. (ISBN 4-931222-12-9) 6) M orville, P., 浅野紀予訳. アンビエント・ファイ ンダビリティ. 東京, オーム社, 2006, 241p. (ISBN 4-87311-283-4) 7) 日本製薬情報協議会 関連サイト http://piaj. sub.jp/ring/>, (参照 2006-08-07). 日本製薬情報協議会 勉強会検索参加者: 塩野邦彦:グラクソ・スミスクライン(株),石川靖 子,木村美佐子:三共(株),奥田葉子,浜崎泰嗣, 前田清人:ゼリア新薬(株),光吉久美子:(株)ツム ラ, 浦 智 佳 子:協 和 発 酵 工 業(株),本 田 直 樹: (株)三和化学研究所,加藤和夫:持田製薬(株),作 山幸由,中野敦子:大塚製薬(株),中村規子:大日 本住友製薬(株),三輪 保:第一製薬(株),村上敏 信:帝人ファーマ(株),関 英 雄:田 辺 製 薬(株), 中村文胤:日本新薬(株)(順不同) (原稿受付け:2006.8.10) 従来,企業の情報担当者によるエンドユーザー
© Copyright 2024 Paperzz