6章後半

6.4
索引と索引法
●索引の定義と種類
(1)索引の定義
索引(index)とは、ある特定の情報を検索するためにその情報を示す語句または記号等
を取り出して一定の順序に並べ、その情報の所在を指示したもの及び並べたリストのこと
である。一般に索引語は、用語の五十音順あるいはアルファベット順に排列されるが、内
容の分類順に排列される場合もある。
索引の中で、最新の出版物や論文や新聞記事を探すことができるように資料の書誌情報
だけを索引語順に集録して定期的に刊行される資料を索引詩というが、近年、印刷物を中
止してデータベースのみを提供しているものも多い。
(2)索引の種類
(a)巻末索引、記事索引
巻末索引とは、
書物の巻末索引や百科事典などのような多巻ものの索引、雑誌の総索引などのいわゆる内
容索引、事項索引、用語索引をいう。
この場合は、一定の資料の中で必要な情報を検索するために用意された索引で、その資料
中に出てくる用語をそのまま使用し本文中の掲載ページと共に一定の排列でリストされて
いる。
記事索引とは、
雑誌記事索引や新聞記事索引など二次資料に使用される索引で文献索引ともいわれる。
この場合、索引対象の情報源が定期的に追加されていく。ここでは、情報内容を一定の規
則に基づいて主題分析し、抽出された主題要素に対して索引語を付与する。また付与した
結果を所定の順序に排列し、そこに文献の書誌情報のリストを作成して索引誌を作成する。
国内の索引詩・・・
『雑誌記事索引』
『大宅壮一文庫雑誌記事索引総目録』
『医学中央雑誌』
など。
(b)用例索引
用例索引とは、
ある特定の資料中に出てくる文章などをそのまま抜き出して作成した索引で、コンコーダ
ンスともいわれる。『聖書』や『源氏物語』などが有名で、作品の研究などに使用される。
(c)引用文献索引
引用文献索引は、
ある文献が発表後、他の文献に引用された被引用文献の索引と引用した文献の索引の両方
からなる索引である。代表的な引用索引文献として、米国の Thomson Scientific 社が作成
する Arts and Humanities Citation Index、Social Science Citation Index、Science
Citation Index がある。
(d)アクセスポイント別の索引
主題からアクセスするための索引として、主題索引、件名索引、事項索引、分類索引な
どがある。書誌事項からアクセスするための索引として、書名索引、著者名索引、誌名索
引などがある。その他、化学分野の分子式索引、化合物名索引、法律分野の判例年月日索
引などがある。
(e)KWIC索引とKWOC索引
印刷物の索引において、見出し語となるキーワード(用語)の表示方法にKWIC索引
(Keyword In Context Index)とKWOC索引(Keyword Out of Context Index)がある。
KWIC索引は、
標題から抽出したすべてのキーワードを見出しとし、元の文脈をそのまま保存した形で表
示した索引である。通常はコンピュータによって語の抽出、排列を行い、出力、印刷され
る。その場合、キーワードは索引中のほぼ中央にアルファベット順または五十音順に出力
され、キーワードの前後には字数の許す限りキーワード以外の標題を示すように作成され
る。
KWOC索引は、
キーワードをそれが本来あった文脈から取り出して見出しとし、その下に標題またはその
一部をキーワードも含めて表示した索引である。
● 索引法
(1)事前結合索引方式と事後結合索引方式
事前結合索引方式は索引語の結合(組合せ)索引作成時に行い、事後結合索引方式は索
引語の結合を検索時に行う方法である。
一般に事後結合方式の方が事前結合方式に比べて高い再現率を期待できるが、適切な検索
語を使用して検索方式を作成したとしても、回避できないノイズ(不要情報)が検索され
る場合がある。
検索時の概念合成の誤りをなくすためには、索引作業時に同一文献に付与された索引語
に共通の記号を使用して関連付けておくことが考えられ、そこで使われる記号をリンク。
「ロボットによるコンピュータの設計」と「コンピュータによるロボットの設計」に関
する文献を区別して検索するためには、各概念が文章中で述べられている役割を索引語に
も持たせる記号が必要となり、これをロールと呼ぶ。
(2)自然語と統制語
自然語は、
フリータームあるいは非統制語ともいわれ、われわれが日常使用している言葉である。文
献中で使用されている言葉をそのまま索引語として使用する。
索引者が付与するフリーターム
自然語
<
コンピュータによる自動抽出語
統制語
<
ディスクリプタ
キーワード<
非ディスクリプタ
フリーターム・・・索引者が主題解析を行って付与する。
自動抽出・・・助詞や助動詞などの不要語を除去して残ったキーワードを索引語とする。
形態素解析・・・品詞などを不要語辞書と照合しながらキーワードを抽出する方法。
統制語は、
シソーラスや件名標目表などによって概念が規定されているキーワードで、ディスクリプ
タ(優先語)と非ディスクリプタ(非優先語)に分けられる。非ディスクリプタは、シソ
ーラスや件名標目表の見出し語にはなっているが索引語としては使用できない語で参照先
のディスクリプタを索引語として使用する。
● 件名標目表とシソーラス
(1)件名標目表
図書館の件名目録を作成するために使用される統制用語集を件名標目表といい、日本で
は『基本件名標目表』が有名である。この序説には、「件名目録編成のための基準として採
択された件名標目と参照語を列挙し、標目相互間に必要な連結参照を設定して、一定の方
式に排列した表を件名標目表という。」と定義されている。
件名標目表には、標準件名標目表と一館件名標目表がある。前者は多くの図書館が共通に
採用すると予想される件名標目を採録したもので、例として『基本件名標目表』がある。
後者は特定の図書館の件名目録に使用する件名標目を採録したもので、例として『国立国
会図書館件名標目表』がある。
また『基本件名標目表』のように広い分野の標目を採録する一般件名標目表と米国国立医
学図書館(NLM)が作成するMeSH(Medical Subject Headings、医学件名標目表)のよ
うに特定の分野の件名標目を採録する専門件名標目表に分けることもできる。
(2)シソーラス
シソーラスとは、ギリシャ語で宝庫という意味。
1960年に Thesaurus of ASTIA Descriptors(米国国防総省技術情報シソーラス)が発
行され、情報検索システムの語彙を統制する目的として統制語彙集をシソーラスと呼ぶよ
うになった。現在、商用データベースの蓄積や検索時に使用目的に応じたシソーラスが作
成されているが、対象分野、収録語数、更新頻度などは様々である。
(3)シソーラスと件名標目表の構成
シソーラスは基本的に、ディスクリプタ、非ディスクリプタ、相互参照、スコープノー
ト(ディスクリプタの意味範囲や使い方を指示する注記)などから構成されている。また、
通常用意されるリストとしては五十音順あるいはアルファベット順リスト、分野別リスト、
階層リストなどがある。
教科書P83 図6−2のように同一用語に対して使用される同義語、上位後、下位語、
関連語は、各々異なっている。それは、『基本件名標目表』は図書を、
『JST シソーラス』
は自然科学分野の学術雑誌論文を、
『日経シソーラス』は新聞記事を索引対象としているか
らである。
6.5
抄録と抄録法
●抄録の定義と種類
(1)抄録の定義
SIST01『抄録作成』によれば、「抄録(abstract)とは、記事内容の概略を迅速に把握する
目的で作られた文章で、主観的な解釈や批判を加えず記事の重要な内容を簡潔かつ正確に
記述したものをいう。」と定義されている。
抄録は、主題分析した結果を文章で記述し、抄録の利用者に対して大きく3つの役割を担
っている。
① 情報を必要とする人が、その原文献の全文を読む必要があるかどうかを判断できるよう
にする。
② 自分の専門分野の周辺領域にある文献について、原文献を読む代わりに抄録から必要な
文献を入手する。すなわち、原文献の代用としてりようできるようにする。
③ 日本語のように世界的観点から読める人が限定されている言語の場合、英文抄録を作成
することにより文献内容を一応把握できる。原文献を翻訳して全文を読む必要があるか
どうかを判断できるようにする。
(2)抄録の種類
(a)情報内容による種類
ァ.指示的抄録(indicative abstract)
原文献の主題とその範囲を説明した抄録で、原文献を読む必要の有無を判断するのに役
立つように作成される。一般に、総説、解説記事やモノグラフ(専門分野の単行書)に適
している。
ィ.報知的抄録(informative abstract)
原文献の内容で結果や結論を含む抄録で、原文献を読まなくても内容の要点が理解でき
るように作成される。原文献の代用になるよう結果の数値などを含むこともある。一般に、
原著論文や短報に適している。
ゥ.報知的指示抄録(informative/indicative abstract)
字数制限から文献中の重要な要素だけを報知的に記述し他は指示的に表現している抄録
で、実際はこのタイプの抄録が多い。
(b)作成者による種類
ァ.著者抄録(author’s abstract)
文献の作成者自身によって書かれた抄録で論文や記事の本文と一緒に掲載される。内容
を一番良く知っている著者が作成し、原文献と同時に作成され作成費用がかからない。反
面、客観性に欠けたり、著者が知らせたいことだけを強調しすぎたり、書き慣れないため
文章の構成が悪い場合もある。
ィ.第三者抄録(professional abstractor’s abstract)
著者以外の人によって書かれた抄録で、多くの場合その主題の専門分野の人で抄録作成
技術を修得している人々によって作成される。
著者抄録と第三者抄録にはそれぞれ長所と短所があるため、データベース作成機関によ
ってどちらを採用するかが異なる。
[例] 科学技術振興機構(JST)
JSTPlus・・・第三者抄録主体、一部著者抄録を採用。
米国 Chemical Abstracts Service(CAS)の CA・・・すべて第三者抄録。
米国国立国会図書館(NLM)
MEDLINE・・・すべて著者抄録。
※著者抄録を採用する場合は、著作者の許諾を得なければならない。
(c)掲載場所による種類
ァ.同所抄録(homotopic abstract)
原文献と一緒に発表される抄録で、標題のすぐあとの本文の前あるいは後ろに位置する。
著者抄録が多いが、まれに編集者が作成することもある。
ィ.非同所抄録(heterotopic abstract)
原文献と切り離して掲載される抄録で、同所抄録以外のすべての抄録をいう。抄録誌や
データベース、雑誌の関係論分紹介欄、企業内や機関内で作成される抄録集などに掲載さ
れる。
(d)利用対象による種類
ァ.一般抄録(general abstract)
誰にでも公開され、不特定多数の人のために読まれる抄録で一般的な観点のもとに作成
される。学術雑誌や抄録誌、データベースに掲載される。その分野の専門家が理解できる
程度の専門用語は使用できる。
ィ.偏向抄録(slanted abstract)
特定の分野、特定の主題、特定の用途などごく限られた内容を持ち、それらに興味を持
つ限定された範囲内で読まれるために作成される抄録で、企業内や一機関内だけで使用す
ることを目的としている。したがって、その企業内あるいは機関内だけで通用する形式、
用語、記号などを使用できる。
(e)書き方による種類
ァ.構造化抄録(structured abstract)
抄録を研究や調査の目的、方法、結果、結論というように原文献の内容を項目に分けて
記載する抄録で、医学文献などで採用されている。構造化抄録は、項目別に記載されてい
るので読みやすい。また、ある薬品が方法の項目に記載されたのか、結果や結論の項目に
記載されたのかなどが明確に分かる。
ィ.非構造抄録(non-structured abstract)
内容的には、目的、方法、結果、結論というように記述されていても、項目として明確
に分けて書かれていない抄録で、一般的にはこの書き方が多い。
● 抄録法
抄録作成は、分類や索引作業と同様に原文献の記事の内容を主題分析して、主題要素を
抽出して文章形式でまとめる作業である。
抄録の書き方については、ISO に基づいて作成された『SIST 01 抄録作成』に一般的留
意事項として、以下の14項目が挙げられている。
① 客観的に書く。
② 著者が読者に伝えたい内容を重点的にとりあげる。
③ 常識的な内容は排除する。
④ 簡潔で明確な表現をする。
⑤ 標題の内容の繰り返しは避ける。
⑥ 一人称は使わない。
⑦ 主題の取り扱い方を明示する。
⑧ 図・表・数式番号の引用はしない。
⑨ 原則として、源原記事で使われている専門用語を使う。
⑩ 略語、略称、略号は、初めて出てくる箇所で説明を加える。
⑪ 単位記号、量記号は、原記事に使用されているとおりに使用する。
⑫ 商品名は、内容の理解に不可欠な場合に限り使用しても良い。
⑬ 数式、化学式は使用しても良い。
⑭ 図・表は原則として使用しない。