PubMedと MEDLINE とその他のデータベースの比較

ノンブルの桁数増えたら柱の隔たり
1桁=6Q 2桁=12Q 3桁=18Q にする
薬学図書館 51(4),287-298,2006
287
PubMed と MEDLINE とその他のデータベースの比較
小
河 邦
雄
[抄録] PubMed は医学関連文献を無料で検索できるため,企業の研究所においても 用す
る人は多い。しかし,その特徴を理解して うべきであり,セキュリティーの面にも注意する
必要がある。今回,PubMed の主な情報源である M EDLINE を薬学関連の調査で定評のある
EM BASE と比較することにより,収録雑誌や索引の違いによって,大きく検索される件数が
異なることを確認した。また,PubM ed の検索システムや位置づけなどを 察することによ
り,企業の研究部門として,どのように対応していくかを述べる。
[キーワード] MEDLINE,EM BASE,情報検索,エンドユーザー検索,情報セキュリティー
ているため,新しい薬剤名が次々に追加されるこ
1. は じ め に
とはない。このことから,薬剤の検索でどの程度
PubM ed は M EDLINE を 検 索 す る た め の
Web ツールとして高機能化しており,無料で操
作性も良いため企業の研究者も多く利用してい
る。しかし,インターネット特有のセキュリティ
ー面での心配があるにもかかわらず,情報部門と
して利用状況をつかんでいないのが実態である。
の再現性があるかを他の DB と比較し,その原因
を調べた。
2.1. 日本製薬情報協議会
今回の調査は,日本製薬情報協議会(Pharmaceutical Information Association of Japan:以
下 PIAJ と略す)の関東支部勉強会において,参
さらに,PubM ed は 用や秘密保持に関する契
約もなく,自己責任で 用されている。これらの
加各社(13社 17名)で
現状を踏まえ,ユーザーが適切にデータベース
た。以前の勉強会で治験薬の各段階での採録状況
(以下 DB)を
い
けられるように,その利用
注意点について喚起する必要から,今回,PubM ed とそのデータソースである M EDLINE につ
いて他の DB と比較し,その特徴を調べた。
2. 薬 剤 の 検 索
担して調査を行ったも
のを基に,筆者が必要な追加調査を行いまとめ
を見るために Derwent Drug File,MEDLINE,
EMBASE,CA の比較を行い ,EMBASE の薬
剤検索における優位性が実証されていたので,
MEDLINE で検索されずに EMBASE でのみ検
索されるケースの原因について検証した。
2.2. 調査の方法
文献が DB で検索されるためには,①収録雑誌
MEDLINE は,本来医学関連 DB であり,索
引語付与数も決まっているため,文献中のすべて
であること②論文が採録基準を満たしていること
の薬剤が索引されるわけではない。また,統制語
③タイトル,抄録,キーワードの中に検索語が含
シソーラスの MeSH も全体量がある程度決まっ
まれることの 3点が必要である。これらの点につ
いて M EDLINE と EMBASE の検索結果を比較
Kunio OGAWA
大正製薬(株) 合研究所研究システム部
(日本製薬情報協議会会長)
〒 331-9530 さいたま市北区吉野町 1-403
E-mail: piaj21@ybb.ne.jp
した。検索する薬剤は,Pharmaprojects で 2005
年以降に臨床試験に移行した 491薬剤を STN の
MEDLINE,EMBASE で 一 般 名 を 用 い て 検 索
し,その件数差が 10件以内の 63薬剤を抽出し
ノンブルの桁数増えたら柱の隔たり
1桁=6Q 2桁=12Q 3桁=18Q にする
288
薬学図書館 51(4),2006
図 1 調査結果記入シート記入例
図 3 EM BASE のみで検索された文献の内容解析
図 2 M EDLINE と EM BASE での治験薬検索 数 と
重複状況
た。これは,臨床試験の薬剤の収録状況に興味が
持たれることと,この段階の方が検索漏れの影響
が大きいと
えられるためである。差を 10件以
内としたのは,解析する負担を調整するためであ
EMBASE だけで検索されたユニークな文献数が
半 を超えるものが 15薬剤(83%)あり,EM。一 方,
BASE の 優 位 性 が 確 認 さ れ た(図 2)
MEDLINE だ け で 検 索 さ れ た 文 献 も 6薬 剤
(33%)あ っ た が,EMBASE の 独 自 性 に 比 べ
る。次に検索ノイズの可能性がある単純な名称を
MEDLINE の独自性の割合は少なかった。また,
EMBASE と MEDLINE の両方で検索された文
除いて 18薬剤に
献の占める割合は,平
り,エンドユーザー検索を想
35%であり,収録雑誌
定 し て,一 般 名 の み で PubM ed と STN の
M EDLINE,EM BASE を 検 索 し た。そ し て
の重複率 4割より低かった 。この結果を単純化
M EDLINE 検索 を除いた EM BASE データを
出力し,所定の表にしたがって結果をまとめ,
合,EMBASE 独 自 が 6件,EM BASE と MED-
察を記入した(図 1)。
2.3. 臨床試験移行治験薬の検索結果
STN の 検 索 の 結 果,個々の 薬 剤 に お い て,
すると,ある薬剤について 10件の文献がある場
LINE の 重 複 が 3件,MEDLINE 独 自 が 1件 と
いう関係になる。さらに,EMBASE 独自の 6件
の文献のうち,2件が MEDLINE の収録誌では
なく,残りの 4件は M EDLINE に採録されては
ノンブルの桁数増えたら柱の隔たり
1桁=6Q 2桁=12Q 3桁=18Q にする
PubMed と M EDLINE とその他のデータベースの比較(小河)
289
いるが,索引がないため検索できなかったことが
を行い,化学物質名フィールド CN に索引があ
わかった(図 3)。非収録誌では,Drugs of the
Future(Prous Science)などが目立った。これ
る薬剤で,件数的に 100件から 1,000件のものを
は新規薬剤の研究開発情報誌で,基礎から臨床ま
た。
選択し,最終的に残った 19薬剤を比較対象とし
での治験薬調査に有効な雑誌であるが,M EDLINE では収録 し て い な い。ま た,PubM ed 独
2.5. 複数のデータベースでの比較の結果
こ れ ら の 薬 剤 に つ い て M EDLINE, EM-
自の論文が採録された理由は,Automatic Term
M apping によって化合物の IUPAC 名が付与さ
。
BASE,CAplus で一般名検索を行った(表 1)
ここでは,化学,生化学,医薬等の 野を含む
れて検索されたものや,巻号頁の付いていない
9,500誌を収録対象とし,2,400万件の論文や特
Pre-M EDLINE 段 階 の Article in Press で あ っ
た。これらの結果を踏まえて,さらに多くのサン
許を採録している CA を加えた。CA は,本来,
プルから傾向を確認するために,市販薬について
であるが,同義語の収録が多く,比較のために加
調査を行った。
えた。しかしながら,臨床論文が多い市販薬で
2.4. 市販薬での件数の比較
市販薬は Pharmaprojects を
化合物を検索する場合は CAS 番号で検索すべき
は,CA の採録件数は低か っ た。M EDLINE は
用し,Novelty
が Leading Compound,特許優先権が 1990年以
降,さらに M arket Rating が US$2,001milliom
CN フィールドにあるキーワードを 用したので
比較的妥当な件数だと思われるが,EMBASE に
以上の 52薬剤をピックアップした。これらの一
あり,最適なキーワードでない可能性がある。し
般名から,ノイズを含みそうな短い名称を除いて
か し,全 般 的 に,EM BASE は M EDLINE の
検索リストを作成した。M EDLINE で予備検索
2∼3倍検索され,全体では 2.4倍と市販薬でも
ついては MEDLINE よりも件数が少ないものが
表 1 3種の DB による市販薬の一般名検索件数
No. Drug Name
M EDLINE
1 TERIPARATIDE
2 BOSENTAN
3 MONTELUKAST
4 TIROFIBAN
5 EPTIFIBATIDE
6 VERTEPORFIN
7 BORTEZOMIB
8 ZANAMIVIR
9 OSELTAMIVIR
10 EZETIMIBE
11 ERLOTINIB
876
961
805
12
13
14
15
16
17
355
327
325
306
277
186
GLIMEPIRIDE
REPAGLINIDE
TADALAFIL
VARDENAFIL
GEMIFLOXACIN
BEXAROTENE
18 PARECOXIB
合計
太字:最も多いもの
706
642
584
600
470
313
421
434
EMBASE
182
1,804
2,252
2,317
2,040
466
1,282
1,265
1,223
1,025
1,738
1,202
1,080
855
813
709
134
436
545
8,908
21,670
CAplus
116
795
603
565
444
245
468
335
276
353
344
587
448
270
274
366
103
307
7,002
ノンブルの桁数増えたら柱の隔たり
1桁=6Q 2桁=12Q 3桁=18Q にする
290
薬学図書館 51(4),2006
検索式を組み立てることが難しい。しかし, 薬
の研究においては,活性の作用点である受容体タ
ンパク質や酵素の発見とその阻害剤などのリガン
ドの情報は非常に重要である。新規の 薬テーマ
企画に関する調査においても,薬理メカニズム関
図 4 市販薬検索結果全体の重複状況
連の調査は重要で,それらを調査するためのデー
タベースとして MEDLINE が適当であるか検証
した。
EM BASE の優位性が確認できた。これらの結果
から,市販薬も M EDLINE だけで検索を行うこ
3.1. 調査方法と結果
Pharmaprojects で前臨床段階の薬剤 3,867件
とは,多くの文献を見逃す結果となることが確認
の中から薬理メカニズム 351種を抽出し,その中
できた。また,これらの検索結果全体の重複状況
から,その他の市販,臨床中,中止などの段階に
を調べたのが図 4である。他の DB と重複する文
もあるメカニズムを除いた 105件の集合を作成し
献は 5,000件程度あるが,DB 独自のユニークな
た。この集合は,比較的新規な薬理メカニズムと
文献は,EMBASE が圧倒的に多く約 1.3万件で
えられ,これらが DB でどのように検索される
あった。しかし,MEDLINE も独自の文献を 3
割ほど持っているので,EM BASE の検索だけで
か を 検 証 し た。検 索 式 と し て は,Pharmapro-
も網羅性を確保できない。ただし,STN は電子
jects の薬理メカニズムが一般的記載で文献中の
記載に近いと想定し,そのまま検索した場合と,
ジャーナルと印刷体の間では重複除去できないこ
近接演算子を 用して語順の違いを含めた漏れの
とがあるので,実際のユニークな文献はもう少し
少ない検索式を組み立てて検索した場合との両方
少なくなる可能性がある。また,市販薬について
で調べた。105件のメカニズムを STN で予備検
は,毒性,副作用情報や EBM のシステマティッ
索して,件数が非常に多い 11件と件数の少ない
クレビューなどで漏れの少ない検索をしたい場合
もあるが,件数が多い場合は逆に目的の文献に
64件 を 除 い て 30件 と し,こ れ ら を M EDLINE,EMBASE,CAplus で 本 検 索 し た(表
り込む機能が重要となる。
3)
。以前の勉強会でリガンドを薬理作用の対象と
2.6. 市販薬が MEDLINE で検索できなかっ
た理由
して調査した際,CA では独自の文献が多く見ら
次 に,EM BASE の み で 検 索 さ れ た 文 献 が
を
M EDLINE の収録誌かどうかを調べた。収録誌
であれば,索引に薬剤名が付与されていないこと
が検索漏れの原因と
えられる。MEDLINE の
2006年収録誌リストを
れたので ,ここでも CA を加えた。近接演算子
用した時の個々の件数の増加率は,MEDLINE,EMBASE,CAplus でそのままの検索と
比べてそれぞれ平
29.0,26.5,16.3倍であり,
近接演算子の 用が有効であったが,これらの中
用し ,上位 35件の中
には主題と直接関係のないノイズ文献もある程度
で,M EDLINE 収録誌は 23件(66%)と多く,
薬剤名が索引されていないことが原因とわかった
含まれてしまう。3種類の DB の中で件数が多い
(表 2)
。
3. 薬理メカニズムでの比較
ものを網掛けにしたが,ほとんどが CA で,次が
EMBASE で,M EDLINE はどれも少なかった。
論文中でのメカニズムの記載は,… Inhibitor な
適応疾病や薬理作用などのキーワードは比較的
どの記述が Inhibitor of…などと倒置されたり,
途中の語句の順番が前後したりすることも多く,
規則性を持って詳細に索引されているが,薬理メ
近接演算子を えないとかなりの漏れが生じる。
カニズムは新しい概念も多く,統制されたキーワ
STN
ードがなかったり,自由語での検索も略語やキー
MEDLINE では近接演算子が えるが,
PubM ed では えないので,検索結果が少なく
ワード表記のバリエーションが多かったりなど,
な る 可 能 性 が あ る。さ ら に,PubM ed に は
ノンブルの桁数増えたら柱の隔たり
1桁=6Q 2桁=12Q 3桁=18Q にする
PubMed と M EDLINE とその他のデータベースの比較(小河)
291
表 2 EMBASE のみで検索された論文の収録雑誌(市販薬)
雑誌名
論文数
1 Deutsche Apotheker Zeitung
2 Pharmaceutical Journal
217
145
3 Expert Opinion on Investigational Drugs
4 Nature Reviews Drug Discovery
100
100
5 New England Journal of Medicine
6 Phamazeutische Zeitung
99
97
7 Expert Opinion on Pharmacotherapy
8 IDrugs
93
89
9 American Heart Journal
10 Drugs of the Future
11 American Journal of Cardiology
12 Seminars in Oncology
13 Pharmazeutische Industrie
85
85
14 Journal of the American College of Cardiology
15 Journal of Invasive Cardiology
80
78
16
17
18
19
Lancet
Circulation
Hospital Pharmacy
Pharmaceutisch Weekblad
20 Chest
21 Journal of Allergy and Clinical Immunology
77
76
75
75
22 European Heart Journal
23 Formulary
24 British Journal of Cardiology
25 MMW-Fortschritte der Medizin
26 Drugs(e)
66
62
59
83
82
80
27 American Journal of Respiratory and Critical Care M edicine
28 Expert Opinion on Therapeutic Patents
29 Current Pharmaceutical Design
30 Clinical Lung Cancer
31 Drugs and Therapy Perspectives(e)
32 Journal of Antimicrobial Chemotherapy
33 Annals of Oncology
34 European Heart Journal, Supplement
35 Journal of the American Medical Association
66
66
58
56
54
53
52
52
51
49
49
49
48
太字:M EDLINE 収録対象誌
M eSH の Pharmacologic Action で 下 位 に 該 当
する薬剤を一括して検索する機能もないため,同
3.2. 薬理メカニズム検索と PubMed 収録雑
誌
じ M EDLINE を デ ー タ ソ ー ス と し て い て も,
M EDLINE と EMBASE を近接演算子を 用
して検索した全 6,620件の中で,M EDLINE の
STN M EDLINE と比較して,この面でも不利で
ある。
みが 893件,重複が 3,518件,EMBASE のみが
2,209件であった。この EMBASE のみで検索さ
ノンブルの桁数増えたら柱の隔たり
1桁=6Q 2桁=12Q 3桁=18Q にする
292
薬学図書館 51(4),2006
表 3 3種の DB による薬理メカニズム検索件数
A:そのまま検索
検索式
No.
B:近接演算子(6A)を 用
MED
EM
CA
MED
103
22
16
107
375
173
837
123
752
8
26
5
9
11
136
5
11
56
1
136
1
25
0
0
5
208
0
1
4
14 INTERFERON AGONIST?
15 TOLL-LIKE RECEPTOR ANTAGONIST?
16 UROTENSIN Ⅱ RECEPTOR AGONIST?
17 PHOSPHOFRUCTOKINASE 2 INHIBITOR?
18 PANTOTHENATE KINASE INHIBITOR?
19 SERINE RACEM ASE INHIBITOR?
0
2
0
7
2
0
1
2
6
0
2
2
4
20
21
22
23
24
0
1
0
0
0
1 THROMBOXANE A 2 ANTAGONIST?
2 PHOSPHODIESTERASE V INHIBITOR?
3 PROSTAGLANDIN AGONIST?
4 SODIUM ANTAGONIST?
5 HISTAM INE RELEASE INHIBITOR?
6 POTASSIUM ANTAGONIST?
7 GASTRIN INHIBITOR?
8 SELECTIN ANTAGONIST?
9 TESTOSTERONE AGONIST?
10 ENDOTHELIN B RECEPTOR AGONIST?
11 GLUTAMATE 3 RECEPTOR ANTAGONIST?
12 INTERLEUKIN-10 ANTAGONIST?
13 FACTOR XIA INHIBITOR?
BM X TYROSINE KINASE INHIBITOR?
LEUKOTRIENE D 4 ANTAGONIST?
TIE-1 TYROSINE KINASE INHIBITOR?
PROLACTIN RELEASE STIMULANT?
EPHRIN B 2 INHIBITOR?
25 FIBROBLAST GROWTH FACTOR RECEPTOR 2
ANTAGONIST?
26 HYALURONAN SYNTHASE INHIBITOR?
27 HYALURONIC ACID AGONIST?
28 INTERLEUKIN 22 RECEPTOR ANTAGONIST?
29 INTERLEUKIN 31 ANTAGONIST?
30 PROTEASE-ACTIVATED RECEPTOR-2
960
17
64
17
100
28
55
126
584
483
407
434
EM
815 1,182
,
401
1 063
732
956
601
978
590
796
435
786
439
582
98
201
175
189
98
155
124
66
295
159
124
59
38
17
34
26
5
2
8
12
4
4
9
6
2
3
0
2
0
0
0
4
2
0
0
0
0
1
0
5
3
0
0
0
0
1
3
1
0
1
0
2
0
2
1
1
1
0
0
1
0
0
0
0
0
2
4
2
2
3
1
9
24
0
11
31
11
7
1
2
CA
5
0
5
3
218
349
72
191
206
111
176
46
15
14
9
8
11
4
15
3
6
8
5
10
7
4
5
ANTAGONIST?
太字:最も多いもの
れた論文を雑誌別に集計した(表 4)
。上位 35件
中 29件が MEDLINE 収録誌で,抄録は著 者 抄
録で EM BASE と同じと
4. M EDLINE の雑誌別論文採録数
えると,薬剤名の索
ここまでの調査で検索数の差は索引が主な原因
引と同様,メカニズム索引も EMBASE の方が
と思われたが,論文単位で未採録の場合もあり,
豊富と推測された。
データベースによる採録の差を確かめてみた。こ
こでは,収録対象誌の選定基準に引用
析を含
み,その結果によって科学技術,生物医学 野の
ノンブルの桁数増えたら柱の隔たり
1桁=6Q 2桁=12Q 3桁=18Q にする
PubM ed と M EDLINE とその他のデータベースの比較(小河)
293
表 4 EM BASE のみで検索された論文の収録雑誌(薬理メカニズム)
雑誌名
No.
論文数
1 The American Journal of Physiology
2 British Journal of Pharmacology
53
50
3 International Journal of Impotence Research
4 Journal of Cardiovascular Pharmacology
46
43
5 European Journal of Pharmacology
6 Journal of Sexual Medicine
7 American Journal of Physiology―Heart and Circulatory Physiology
8 European Urology
9 Drugs of the Future
41
39
31
29
25
10 Bioorganic and Medicinal Chemistry Letters
11 Journal of Urology
12 BJU International
25
24
22
13 American Journal of Cardiology
14 Agents and Actions.
15 Journal of Pharmacology and Experimental Therapeutics
16 American Journal of Physiology―Gastrointestinal and Liver Physiology
18
17
16
17
18
19
20
21
Hypertension
American Journal of Physiology―Regulatory, Integrative and Comparative Physiology
Journal of Sexual Medicine(ep)
Urology
Urologe-Ausgabe A
16
16
16
15
14
13
22 Circulation
23 Drug Development Research
12
12
24
25
26
27
International Journal of Clinical Practice
Journal of Medicinal Chemistry
Journal of Labelled Compounds and Radiopharmaceuticals
Japanese Pharmacology and Therapeutics
28 Expert Opinion on Therapeutic Patents
12
11
11
11
29 Urologic Clinics of North America
30 American Journal of Physiology―Renal Physiology
10
10
31
32
33
34
10
10
9
9
Journal of the American College of Cardiology
Nature Clinical Practice Urology
Life Sciences
Tetrahedron Letters
35 European Journal of Medicinal Chemistry
11
9
太字:MEDLINE 収録対象誌
最も重要な雑誌約 4,500誌を収録する SciSearch
においても,DB によってかなり採録数が違っ
も加えた。比較した雑誌は,SciSearch の引用
析 か ら 作 成 さ れ る JCR(Journal Citation
た。採 録 数 が 多 い の は CA,SciSearch で,
Reports)の IF(インパクトファ ク タ ー)上 位
30誌である(表 5)。ISSN(印刷 体 と 電 子 体)
で 2005年発行の雑誌を検索したが,著名な雑誌
MEDLINE,EMBASE は少なかったが,これは
同じ雑誌であ っ て も,MEDLINE や EM BASE
は医学を中心に収録しているためと推測される。
IF の上位誌はレビュー誌が多く,また,コラム
ノンブルの桁数増えたら柱の隔たり
1桁=6Q 2桁=12Q 3桁=18Q にする
294
薬学図書館 51(4),2006
表 5 4種の DB による IF 上位雑誌の論文収録数
No. MED
EM
CA
発行国
IF
ANNUAL REVIEW OF IM M UNOLOGY
CA-A CANCER JOURNAL FOR CLINICIANS
USA
USA
NEW ENGLAND JOURNAL OF M EDICINE
NATURE REVIEWS CANCER
USA
UK
PHYSIOLOGICAL REVIEWS
NATURE REVIEWS MOLECUAR CELL BIOLOGY
USA
UK
52.4
44.5
38.6
36.6
33.9
33.2
SCI
1
29
29
29
33
2
22
33
0
48
3 1,467 1,202 2,100 1,798
4
83 156 256 211
5
33
30
34
34
6
82 137 235 194
JOURNAL NAME
7
0
0
27
33 REVIEWS OF MODERN PHYSICS
8
78 131 228 187 NATURE REVIEWS IM MUNOLOGY
9 2,534 2,407 3,546 2,808 NATURE
10 2,409 2,314 4,373 2,698 SCIENCE
11
28
28
28 ANNUAL REVIEW OF BIOCHEMISTRY
30
12 383 398 373 456 NATURE M EDICINE
13 449 462 507 462 CELL
14 209
15 1,028
224 222 272 NATURE IMMUNOLOGY
920 2,262 1,387 JAMA-JOURNAL OF THE AM ERICAN MEDICAL
16
306
284
17
19
19
18
29
30
19 399 345
20 1,581 1,407
21
22
23
24
0
84
78
29
0
121
122
29
25
223
231
26
27
135
169
0
28
0
339
0
ASSOCIATION
350 NATURE GENETICS
19 ANNUAL REVIEW OF NEUROSCIENCE
22
28
30 PHARMACOLOGICAL REVIEWS
513 471 NATURE BIOTECHNOLOGY
160 1,738 LANCET
12 SURFACE SCIENCE REPORTS
14
261 205 NATURE REVIEWS GENETICS
244 207 NATURE REVIEWS NEUROSCIENCE
29 ANNUAL REVIEW OF PHARM ACOLGY AND TOXI33
COLOGY
264 239 NATURE CELL BIOLOGY
140 140 CHEMICAL REVIEWS
306 258 NATURE REVIEWS DRUG DISCOVERY
271
9
29
40
43
40
30
121
127
150
USA
UK
UK
USA
USA
USA
USA
USA
USA
32.7
32.2
31.9
31.5
31.2
28.4
27.6
24.8
USA
USA
USA
USA
UK
24.7
NL
UK
21.4
21.3
21.2
21.1
UK
USA
UK
USA
UK
21 ANNUAL REIEW OF ASTRONOMY AND ASTRO- USA
PHYSICS
55 ENDOCRINE REVIEWS
128 CANCER CELL
32.8
USA
USA
23.1
22.8
22.4
21.7
20.6
20.2
19.6
18.8
18.8
18.1
太字:最も多いもの
のような記事もあり,DB によって論文採録基準
が大きく異なることがわかった。ただ,M EDLINE にまったく収録されていない雑誌は 3誌
で,いかに IF 上位に医学やライフサイエンス関
連 誌 が 多 い か が わ か る。特 に 30誌 中 12誌 が
れる論文の数は DB によって大きく異なり,それ
が検索数の差の原因の 1つと えられた。
5. M EDLINE の収録対象雑誌の ISSN 番号
nature 系雑誌であり,ブランド力を感じた。結
2006年版リストにある 4,884誌の ISSN 表示
は冊子・電子版の併記が 1,220誌(25%)
,冊子
論として,雑誌が収録対象誌であっても,採録さ
3,564誌(73%)
,電 子 版 100誌(2%)で あ る
ノンブルの桁数増えたら柱の隔たり
1桁=6Q 2桁=12Q 3桁=18Q にする
PubM ed と M EDLINE とその他のデータベースの比較(小河)
295
をそのように設計しているからであるが,そのた
め,文書中の単語の位置情報は保持していないの
か,フレーズ検索に有効な近接演算子が
えな
い。そのため,単語では全文を検索できるが,フ
レーズに関しては,登録されたものしか検索でき
ない。フレーズが登録されるには,そのフレーズ
が複数回用いられている必要があるため,比較的
新しい複数の語句で表される用語は登録されてい
図 5 MEDLINE 収録雑誌と IF 値
ない場合が多い。そのため,複数の語句を and
検索しなければならないので,多量のノイズを含
むこともあり,あまり適当とは言えない。情報担
が,STN の MEDLINE の書誌には一方の ISSN
のみ付与されている。例えば nature は,2002年
当者にとっては,近接演算子が えないのは,あ
までは冊子の ISSN で,2003年は冊子か電子版
視したと理解できる。しかし,全文が検索できる
のどちらか一方で,2004年からは電子版のもの
場合は,エンドユーザーがたまたま入力したフレ
が付与されていた。ISSN で検索する場合の検索
ーズでヒットし,それで検索を止めてしまう方が
漏れやマルチファイル検索での重複除去には注意
問題な場合もあるので,目的によって い ける
が必要である。MEDLINE の収録対象全雑誌と
べきであろう。
IF の 関 係 が 図 5で あ る。2,500件(51%)と 約
半 の雑誌が JCR の収録誌であるが,IF はその
収録されている雑誌 しかわからない。
6. MEDLINE で収録していない高 IF 雑誌
る意味致命的ではあるが,その ,スピードを重
8. PubMed の位置づけ
PubMed は,NM L(米国国立医学図書館)内
の NCBI(国立バイオテクノロジー情報センタ
ー)が作成している Entrez(アントレ)という
MEDLINE の収録対象誌はメジャーなものに
関しては,地域に関係なく収録されているようで
統合型 子生物学 DB の一部として 開されてい
ある。表 6は EMBASE の収録対象誌であるが
が,本 来 の 目 的 は,Entrez の 中 に あ る,核 酸
M EDLINE では収録対象でない雑誌の中で,IF
値が 1以上のもの 75誌である。JCR 全体の中で
DB,タンパク DB などのファクトデータと論文
を結ぶ「要」の役割にある。もちろん,米国の税
IF 値が 1以上の雑誌は 49%あ り,こ の 75誌 は
半 以上のランクにある著名な雑誌といえる。こ
金で作成している DB なので,医学情報を広く
れらを見ていくと,62件(83%)は米国以外の
を前提としており,企業の組織的 用は想定外と
雑誌であるが,内容的には,化学系など医学以外
言われても仕方がない。また,無料で多くの人が
の雑誌が多い。しかし, 薬の構造活性相関に関
アクセスするために,PubMed 収録雑誌として
リストアップされようとする出版社や学会からの
係する著名な雑誌も含まれているので,PubMed
を検索する場合は,著明な雑誌でも収録されてい
ない雑誌がある点も
慮して検索する必要があ
る。
7. PubMed の検索エンジン
る。MEDLINE のデータを中心に作られている
開するという役割も持っているが,個人での利用
マーケティング対象ともなり,情報のブランドカ
タログ的な側面も見られる。また,大量のダウン
ロードを行うとサーバーに負担がかかるため,そ
の利用者のサーバーからは利用禁止になることも
ある。実際に今年の 6月には京都大学で一時 用
PubM ed の利用は,1日 200万件以上あるとの
ことであるが,検索スピードは非常に速く,瞬時
できなくなった。こうなると組織のコンプライア
に検索件数が表示される。これは,検索エンジン
らかの対応をとる必要がある。
ンスの面からも,情報部門はその利用に関して何
ノンブルの桁数増えたら柱の隔たり
1桁=6Q 2桁=12Q 3桁=18Q にする
296
薬学図書館 51(4),2006
表 6 EM BASE にしか収録されていない高 IF 雑誌リスト
雑誌名
1
2
3
4
5
6
Biochimica et Biophysica Acta―Reviews on Cancer
European Journal of Cancer, Supplement
Current Opinion in Coloid and Interface Science
Biochimica et Biophysica Acta―M olecular and Cell Biology of Lipids
TrAC―Trends in Analytical Chemistry
M utation Reseach―Reviews in Mutation Research
IP
16.12
9.02
5.27
5.00
3.89
3.67
出版国
NETHERLANDS
ENGLAND
ENGLAND
NETHERLANDS
NETHERLANDS
NETHERLANDS
7 Journal of Biomedical Materials Research―Part A
3.65 UNITED STATES
―
8 Journal of Biomedical Materials Research Part B Applied Biomaterials 3.65 UNITED STATES
9
10
11
12
13
Critical Reviews in Oral Biology and Medicine
Biochimica et Biophysica Acta―Bioenergetics
Biochimica et Biophysica Acta―M olecular Cell Research
Biochimica et Biophysica Acta―Biomembranes
Biochimica et Biophysica Acta―General Subjects
3.64
3.50
3.48
3.44
3.37
14
15
16
17
Biochimica et Biophysica Acta―M olecular Basis of Disease
Current Organic Chemistry
3.05
2.78
2.75
2.74
18
19
20
21
22
23
24
25
26
27
Cognitive Neuropsychology
Synlett
New Journal of Chemistry
European Urology, Supplements
Tetrahedron
Analytica Chimica Acta
Atmospheric Environment
Tetrahedron Letters
Tetrahedron Asymmetry
Synthesis
Psychiatry Research―Neuroimaging
Biochimica et Biophysica Acta―Proteins and Proteomics
28 Journal of M embrane Science
29 Journal of Atmospheric Chemistry
2.74
2.70
2.64
2.59
2.56
2.48
2.39
2.20
2.15
2.11
UNITED STATES
NETHERLANDS
NETHERLANDS
NETHERLANDS
NETHERLANDS
NETHERLANDS
NETHERLANDS
ENGLAND
GERMANY
ENGLAND
NETHERLANDS
ENGLAND
NETHERLANDS
ENGLAND
ENGLAND
ENGLAND
GERMANY
NETHERLANDS
NETHERLANDS
2.11 NETHERLANDS
2.05 NETHERLANDS
30 Biochimica et Biophysica Acta―Gene Structure and Expression
31 M utation Research―GeneticToxicology and Environmental Mutagenesis
32 Chemometrics and Intelligent Laboratory Systems
33 QSAR and Combinatorial Science
34 Journal of Aerosol Science
35 Environmental Conservation
36 Helvetica Chimica Acta
2.05 NETHERLANDS
2.02 NETHERLANDS
1.90 NETHERLADS
1.88 GERMANY
1.86 ENGLAND
1.84 ENGLAND
1.83 SWITZERLAND
37 Fluoride
38 Enzyme and Microbial Technology
1.78 UNITED STATES
1.76 UNITED STATES
39 Clinical and Diagnostic Laboratory Immunology
40 M olecular Brain Research
1.72 UNITED STATES
1.71 NETHERLANDS
41 Critical Reviews in Environmental Science and Technology
42 Journal of M icrobiology and Biotechnology
43 Biochemical Engineering Journal
1.68 UNITED STATES
1.66 SOUTH KOREA
1.62 SWITZERLAND
ノンブルの桁数増えたら柱の隔たり
1桁=6Q 2桁=12Q 3桁=18Q にする
PubM ed と M EDLINE とその他のデータベースの比較(小河)
297
表 6 EM BASE にしか収録されていない高 IF 雑誌リスト(続き)
雑誌名
44
45
46
47
48
49
IP
Journal of M olecular Catalysis B : Enzymatic
Food Chemistry
Colloids and Surfaces A : Physicochemical and Engineering Aspects
Expert Opinion on Therapeutic Patents
Bulletin of the Chemical Society of Japan
Aerosol Science and Technology
1.55
1.54
1.51
1.46
1.45
出版国
NETHERLANDS
ENGLAND
NETHERLANDS
ENGLAND
JAPAN
1.43 UNITED STATES
50 Journal of Neurolinguistics
51 Neuropsychiatre
1.43 UNITED STATES
1.41 GERMANY
52
53
54
55
56
1.38
1.36
1.34
1.32
1.31
57
58
59
60
61
62
63
64
Pediatric Exercise Science
Journal of the Air and Waste Management Association
Basic and Clinical Pharmacology and Toxicology, Supplement
European Heart Journal, Supplement
Nutrition Research Reviews
Advances in Environmental Research
Arthropod Structure and Development
1.27
1.27
1.25
1.23
Environmental Toxicology and Pharmacology
Journal of Biological Physics
Hepatology Research
Clinical Neuropsychologist
Chromatographia
Disability and Rehabilitation(ep)
1.17
1.16
1.15
1.14
UNITED STATES
UNITED STATES
DENM ARK
ENGLAND
ENGLAND
ENGLAND
ENGLAND
NETHERLANDS
NETHERLANDS
IRELAND
NETHERLANDS
GERMANY
ENGLAND
65 Colloid and Polymer Science
66 Phlebologie
1.11 GERMANY
1.10 GERMANY
67
68
69
70
1.08
1.07
1.06
1.06
Clinical Neuroscience Research
International Journal of Life Cycle Assessment
Water, Air, and Soil Pollution
Canadian Journal of Chemistry
71 Biocatalysis and Biotransformation
72 Journal of Labelled Compounds and Radiopharmaceuticals
UNITED STATES
GERMANY
NETHERLANDS
CANADA
1.05 ENGLAND
1.05 ENGLAND
73 Comparative and Functional Genomics
1.04 ENGLAND
74 Combustion and Flame
75 Aphasiology
1.02 UNITED STATES
1.01 ENGLAND
太字:米国出版
9. PubMed のセキュリティー
報が研究トレンドの調査に われるように,検索
結果からフルテキストへのアクセス情報などは,
インターネットは 道であり,ネットワーク途
注目される研究のデータとして利用可能である。
中での一般的な情報漏洩の可能性は えられる。
このプライバシーポリシーは米国内を対象とした
また,プライバシーポリシーでは,利用者のドメ
ものと思われ,海外については紳士協定的に期待
インや PC の OS,アクセス記録やクッキーの利
するものであり,内容の修正があっても当然連絡
用,そしてその 析のための第三者機関への情報
はなく,常にモニターすることも難しい。無料で
提供も示唆されている 。確かに,論文の引用情
契約がないのはありがたいが,半面,契約ができ
ノンブルの桁数増えたら柱の隔たり
1桁=6Q 2桁=12Q 3桁=18Q にする
298
薬学図書館 51(4),2006
ないことでもある。このような点から,戦略に関
教育は,自 たちが用意した情報源について,そ
係する調査や特許性がからむ場合は,慎重に う
の い方等を利用者に教えることで済んでいた。
べきである。
現代は,インターネット情報の充実で,我々の知
10. PubM ed とコンピュータ解析
膨大な医学関連情報を含む M EDLINE のデー
タについては,それ自体をファクトデータとして
らない所で社内ユーザーはいろいろな情報源にア
クセスしている。PubMed についても,今回の
調査を行う前は知識が少なかったが,随 勉強に
ゲノムとその機能,疾病との関連性を探索するた
なった。PIAJ では,関東・関西の両支部でこれ
ら新しい情報源についての評価や講演会などの勉
めのバイオインフォマティックス 野での 用が
強会を積極的に行っている。関心のある企業情報
進んでいる。自然言語で書かれた抄録から,キー
担当者のさらなる参加を期待したい 。
ワードの揺れを吸収しながら特定の概念に集約し
ていく作業をコンピュータで行うものであるが,
これは正にインデキシングの作業に似ている。実
際に,M eSH のインデキシングも本文,抄録等
をコンピュータで解析し,同義語,関連語から,
適切な M eSH タームのリストを提示する索引支
援システムを
用している 。このため,論文執
筆の際は,本文はもちろん抄録においても,それ
らのコンピュータ処理を想定した記述を行うこと
がその後に大きな影響を与えることがわかる。特
に近年の検索システムの開発は,従来の図書館情
報的なアプローチとは異なる研究 野から,情報
資源の多様な活用を目的として,言語学,コーパ
ス,オントロジー,タクソノミー,フォークソノ
ミーなどの概念を組み合わせ,目的とする情報や
知識を検索する方法が試みられている 。これら
は従来,特定 野に特化して検索技術を深めてき
た専門サーチャーをシステム化しようという部
も感じられて興味深い。しかし,その解析コンテ
ンツが,例えば M EDLINE だけでいいのかとい
う点に関しては,長年それらと格闘してきた検索
担当者としても気になる部 であろう。
11. お わ り
に
参
文 献
1) 野田利章. 医学薬学データベースの比較. 薬学図
書館. 46(3), 2001, 215-221.
2) エ ル ゼ ビ ア の EMBASE.com の 説 明 画 面(EM BASE と M EDLINE を 同 時 に 検 索 で き る).
http://japan.elsevier.com/products/embase
com/index.html>, (参照 2006-08-07).
3) List of Journals Indexed for MEDLINE, 2006.
http://www.nlm.nih.gov/tsd/serials/terms
cond.html>, (accessed 2006-08-07).
4) NLM Privacy Policy. http://www.nlm.nih.
gov/privacy.html>, (accessed 2006-08-07).
5) 阿部信一ほか. 図解 PubMed の い方 インター
ネットで医学文献を探す 第 3版. 東京, 日本医学
図書館協会, 2003, 91p. (ISBN 4-931222-12-9)
6) M orville, P., 浅野紀予訳. アンビエント・ファイ
ンダビリティ. 東京, オーム社, 2006, 241p.
(ISBN 4-87311-283-4)
7) 日本製薬情報協議会 関連サイト http://piaj.
sub.jp/ring/>, (参照 2006-08-07).
日本製薬情報協議会 勉強会検索参加者:
塩野邦彦:グラクソ・スミスクライン(株),石川靖
子,木村美佐子:三共(株),奥田葉子,浜崎泰嗣,
前田清人:ゼリア新薬(株),光吉久美子:(株)ツム
ラ, 浦 智 佳 子:協 和 発 酵 工 業(株),本 田 直 樹:
(株)三和化学研究所,加藤和夫:持田製薬(株),作
山幸由,中野敦子:大塚製薬(株),中村規子:大日
本住友製薬(株),三輪 保:第一製薬(株),村上敏
信:帝人ファーマ(株),関 英 雄:田 辺 製 薬(株),
中村文胤:日本新薬(株)(順不同)
(原稿受付け:2006.8.10)
従来,企業の情報担当者によるエンドユーザー