ascii24 ウェブニュースシステムの設計と構築 Desing and Implementation of ascii24 Web News System 中野 潔† Kiyoshi Nakano 2.が背景と用語の定義,3.が『ascii24 ウェブ』の構 成とその考え方,4.が『ascii24 タグ』の構成とその 考え方,5.が『ascii24 ウェブ』の目次体系および 『ascii24 タグ』の評価,6.が今後の課題である. ウェブと電子メールとを組み合わせたニュース サービスにおいて,XML 風のタグ体系を定めた. 必ずしも黒字になるとはかぎらないビジネスであ る中,また,出版業界の売り上げが減少する中, さらに,その中でも中堅の位置を占める程度の企 業においては,タグをもとにした完全自動処理の システムを構築する予算がなかったため,将来の 自動処理を見越した導入という段階までしか進め なかった.それでもタグ導入の効果があがり,そ の有効性が実証された. 2.背景と用語の定義 2.1 『ascii24』のサービス概要 記者によ る執筆と タグ付け オペレータによる HTMLファイル化 株式会社アスキーでは,1997 年 11 月 10 日から, ウェブを用いたコンピュータ関連のニュース配信サ 1.はじめに ービス『ascii24 ウェブ』を稼動させた.また,1998 年 6 月から,電子メールを用いたコンピュータ関連 デジタルコンテンツを,各種出力形態を想定して, のニュース配信サービス『ascii24 電子メールサービ 後工程を容易に,あるいは,後工程の手順変更を容 ス』を稼動させた.この 2 つのサービスは,2000 年 易に,あるいは,後工程のデータ形式変更を容易に, 3 月まですべて,ascii24 編集部で処理,遂行された. するために,XML を利用することが増えてきた. 筆者は,1998 年 4 月から 2000 年 3 月まで,ascii24 XML は,そうした状況に対処しやすいマーク付け言 編集部の編集長として,(1)記事内容の執筆,査読お 語である.1),2) よび編集,(2)配信のための業務フローの設計,(3)配 本論文では,株式会社アスキーの提供するウェブ 信システムの仕様策定−−などを実行した. と電子メールによるニュース配信サービス 本論文では,『ascii24 ウェブ』と『ascii24 電子メ 『ascii24』における,業務の流 れ,目次の構成,『ascii24 タ 図1 HTMLファイル作成までの業務の流れ グ』などについて論じる. 社内ア 社員記者 『ascii24 タグ』の制定に当た ルバイトオペ レータ っては,XML を強く意識した. 執筆 タグ付け 将来的には,このタグを記者が HTML化 HTML 入力することにより,ウェブペ 簡易タ ファイル 人手 グ付け ージ制作および目次制作まで, コンバー フィード 画面 タおよび 完全自動化したかったからであ バック 人手 る.しかし,必ずしも黒字にな フィードバック るとはかぎらないビジネスであ る中,また,出版業界の売り上 ascii24 ascii24 外注オペ 社員記者 外部ライター げが減少する中,さらに,その タグ付き タグ付き レータ テキスト テキスト 中でも中堅の位置を占める程度 第1次 ファイル ファイル の企業においては,タグをもと HTML化 執筆 査読 タグ付け にした完全自動処理のシステム コンバー デスク を構築する予算がなかったため, 人手 タグなし タおよび 将来の自動処理を見越した導入 テキスト 人手 簡易タ という段階までしか進めなかっ ファイル 第2次 グ付け た. 査読 画面 アスキー 社外 アス キー社内 1 デスクに よる査読 記者によ る査読と タグ付け アスキー 社内 アス キー社外 国際情報通信研究センター客員教授 オペレータによる HTMLファイル化 ライターに よる執筆 † ァイルを登録する動作の中で反映すべき事項を,オ ペレータに伝達するという役割である. 『ascii24 タグ』は,後述する目次体系のリニュー アルと同時に 1998 年 10 月に導入された.それまで 社員記者は,小見出しをその前後を 1 行あきにして 明示するなどしたタグなしテキストをデスクに渡し, デスクみずからが HTML ファイル化していた.この 2.2 用語の定義 方式には,次のような問題点があった. (1)タグなしテキストを HTML 化するには,記者との 以下では,用語を次のように定義して用いる.ウ 間の暗黙の了解と,『ascii24』流の HTML 化の作法 ェブを用いたコンピュータ関連のニュース配信サー に通じている必要がある.このため,デスクみずか ビ ス 『 ascii24 』 を 『 ascii24 ウ ェ ブ 』 と 呼 ぶ . らが HTML 化せざるを得ず,デスクが本来の業務で 『ascii24 ウェブ』と『ascii24 電子メールサービス』 ある査読以外に時間をとられることになる. とを合わせたサービスを,『ascii24』と呼ぶ.表紙 (2)タグなしテキストでは,以下のような区別をする 目次とは,ニュースサイトのトップページであって, ことができず,このため,以下のような情報をデス ニュースの目次となっているウェブページである. クに伝えるためには,電子メールによる原稿送付と 個々のニュースは,1 件 1 葉のウェブページとなって 別に電話で説明するか,帰社してデスクに会うか, いる. メモをデスクのもとに残するかしなければならない. デスクに面談で伝える方式だと,多くの場合,自分 2.3 『ascii24』の業務フローと『ascii24 の原稿の査読が始まるまで待機しなければならない. タグ』 <a>記事本文と写真のキャプションなどを明確に区 別する決まりがない.写真データのファイル名と写 図 1 は,『ascii24 ウェブ』における HTML ファイ 真のキャプションとを結び付ける記述の決まりがな ル作成までの業務の流れである.外部ライターある い. いは社員記者の執筆した原稿は,社員記者により <b>発表者とのニュース掲載時刻の約束など,読者 『ascii24 タグ』のついた ascii24 タグ付きテキストフ の読む本文には盛り込まないがデスクに伝えるべき ァイルとなる.これは,社内アルバイトオペレータ 情報について,本文と明確に区別して記す決まりが あるいは外注オペレータにより,HTML ファイルに ない. 変換される.変換処理は,大体はコンバータで実行 『ascii24 タグ』は,上記の問題点を解決し,下記 されるが,写真のトリミング,表の作成,その他, のようなメリットをもたらすであろう手法として導 コンバータで実行しきれない部分があるので,人手 入された. で仕上げる.その他とは,注記の処理などである. 『 ascii24 タグ 』は , この一連の流れの中で, 図2 HTMLファイルの登録と目次作成と電子メール作成 読者から見えるサー 3 つの役割を果たしてい 記事登録 目次生成 バーへのアップロード る.第 1 は,コンバー HTML HTML HTML HTML タ の 自 動 処理 の た め の HTML HTML HTML HTML HTMLファイ ファイル ファイル ファイル ファイル HTML HTML HTML HTML タグである.第 2 は, ファイル ファイル ファイル ファイル HTML HTML HTML HTML ル登録機能 ファイル ファイル ファイル ファイル 写真のトリミング,表, ファイル ファイル ファイル ファイル PARTファイル作成 注記 など,HTML ファ 掲載 自動検知 イ ル に 反 映す べ き で は 約束 目次作成 ファイル 人手で抽出 時刻 機能 転送機能 あ る が , コン バ ー タ で 登録時刻 は 処 理 し きれ な い 事 項 など ascii24 PART 各種目次 各種目次 PART 各種目次 各種目次 に つ い て ,オ ペ レ ー タ タグ付き 登録ランク ファイル ファイル ファイル PART 各種目次 各種目次 ファイル ファイル ファイル ファイル PART 各種目次 各種目次 など に 伝 達 す ると い う 役 割 ファイル ファイル ファイル ファイル ファイル ファイル である.第 3 は,(1)記 見出し、カ テゴリー、執 事 登 録 時 の重 要 度 ラ ン 筆者など ク,(2)ニュース発表メ HTMLファ 日付ディレクト 電子メール生 電子メールテ ー カ ー と の約 束 に よ る イル一覧 リ内HTMLファ 成プログラム キストファイル 掲載時刻の指定,(3)電 イル一覧機能 子 メ ー ル 掲載 に お け る 自動抽出 要約文 要約文の指定など, HTML ファイル 自身 に は反 映せず, HTML フ ールサービス』を中心に,システム構成,システム 構築の考え方について説明する.特に,『ascii24』 のタグ体系(『ascii24 タグ』)について説明する.ま た,『ascii24 ウェブ』の目次体系についても説明す る. 2 ブ』では,以前からアスキーがウェブニュースに利 用していたシステムを流用していた.これには,次 のような問題点があった. (1)表紙目次においてニュースの軽重にかかわらず, 扱いが同じである.正確にいうと,新聞でいうベタ 記事とそれ以外の中規模以上の扱いの記事との区分 けはあったが,中規模以上の扱いの記事がすべて同 列に扱われていた. (2)表紙画面では,ニュースの見出しが,掲載時間に そって,最新のものを最も上にして並んでいた.大 ニュースでも小さなニュースでも,最新が上で,さ らに最新のニュースが来れば,それがどんな重さの ものでも,それ以前の記事が下に下がる仕組みにな っていた. (3)ニュースの分野に応じて 4 つのカテゴリが存在す るが,表紙画面では,その区別がわからない. (4)表紙画面とは別のウェブページとして,4 つのカ テゴリごとの目次が存在するが,人手で作成してい るため,抜けが多い. [A]カテゴリの増加や重み付けの導入のように,原 稿執筆や査読における配慮事項が増えても対応でき るようにする. [B]記者がデスクと面談せずに『ascii24 タグ』によ って伝えられる事項を増やし,記者の直行直帰を容 易にしたり,編集部への戻り回数を減少したり,帰 宅時間を早くしたりする. [C]HTML ファイル化処理を外注化しても,適切に 指示が伝わるようにする. [D]『ascii24 タグ』を解釈するコンバータの開発に より,HTML ファイル化処理の半自動化を狙い,最 終的には完全自動化をめざす. 図 2 は,HTML ファイルの登録と目次作成,およ び電子メール作成の流れを説明したものである.こ の図をみてわかるように,HTML ファイル作成の後 では,『ascii24 タグ』は,決定的役割を果たしてい るわけではない.しかし『ascii24 タグ』は,登録ラ ンクの指定や電子メールにおける要約文の抽出に直 接関与し,また,カテゴリが増加しても記事登録, 目次作成において混乱が生じないように支援してい る. 3.3『ascii24 ウェブ』目次のリニューア ルの考え方 3.『ascii24 ウェブ』の構成とその考え方 1998 年 10 月に,『ascii24 ウェブ』では,大幅な リニューアルを実施した.個々のニュースのウェブ ページにおいても,デザイン変更などを実施したが, 表紙目次を中心とした目次の構造についての変更が 最もウェートが大きかった.なお,読者にとっては, まったく関係がないが,編集部員がニュースを執筆 する際に,前出の『ascii24 タグ』を埋め込んで執筆 することにした. リニューアルにおける基本的考え方は,以下のよ 3.1 『ascii24 ウェブ』の記事の状況 『ascii24 ウェブ』では,平日,月曜日から金曜日ま で,1 日あたり 20 本から 40 本のニュースを,ウェブ に掲載している.掲載は随時で,通常,10 時ごろか ら 23 時ごろまでである.ニュースの長さは,600 字 から 3000 字程度である. 画 像 の な いも の か ら , 図3 目次体系[I]=表紙画面 十 数 枚 の 画像 を 含 む も 網羅型目次へのリンク の ま で あ る. 画 像 は , 最新型目次へのリンク ほぼすべて写真であり, 画面左端の網羅型あ 図 解 の た めに 作 図 し た るいは最新型目次へ のリンク ものがわずかに,1%未 記事タイトル(記事本 満 程 度 の 割合 で , 存 在 文へのリンク) す る . 表 組み を 含 む も のが,記事全体の十数%, 存在する. 「今日のニュース一覧」 トップニュースの網 羅型と最新型の各 目次へのリンク 各カテゴリの最新型目次 へのリンク ランク順のトップニュー ス3本 「今日のニュース一覧」 (網羅型)と最新ニュース 20本(最新型) の各目次 へのリンク 最新ニュースタイトル5本 (網羅型)へのリンク 日替わり巻頭コラム 3.2 リニューア ル前の『ascii24 ウェブ』目次の 問題点 1997 年 11 月 10 日に 開始 した『 ascii24 ウェ 「バックナンバー」(網羅 型)へのリンク 「コラム一覧」(網羅型) へのリンク カテゴリごとの網羅型と 最新型の各目次へのリ ンク カテゴリごとの最新記事 1本 最新掲載コラムタイト ル3本 カテゴリごとのカテゴリタイト ル(目次へのリンクを兼用)と 最新記事タイトルのまとまり 3 (3)特定のカテゴリのみにつ いて,ニュースの目次が見 ハードウェアニュース られるようにする. 最新一覧 次に,(1)から(3)に対して, どういう目次体系で対応し [バックナンバーへ] たかについて,簡単に説明 「今月のハードウェ アニュース一覧」 し,その後で,目次体系の トップニュースの最新 20本 [バックナンバーへ] 全体について説明する(図 3, 「今月のトップニュー 図 4,図 5). ハードウェアニュース ス一覧」 の最新20本 (1)については,[a]表紙目 [バックナンバーへ] 次にトップニュース欄を設 ける,[b]登録時ランクと経 月別ハードウェアニュー 月の一覧 ス一覧 時時ランクとを分ける−− [バックナンバーへ] 2000年※月 1999年×月 2000年◇月 の 2 点で主に対応した. 月の一覧 まず,[a]である.表紙目 2000年※月 月別トップニュース一覧 2000年◇月 2000年*月 次の上部にトップニュース 1999年×月 1999年×月 欄を設けた.ここに,経時 2000年*月 1999年△月 時ランク(後述)の 1 位,2 位, 1999年×月 1999年△月 3 位のニュースタイトルを 全部で8つのカテゴリにいて、すべて同じ構造になっている 並べることにより,そのと きどきで,編集部が最重要 うなものである.このリニューアルにおいて,ニュ と考えるニュースが分かるようにした.ここには, ース以外の記事であるコラムを,目次においてどう 常時,3 本のニュースタイトルしか表示されない. 扱うかについても変更を実行したが,本論文では省 次に,[b]である.ニュースのうち,割合にして, 略する.なお,リニューアル後のカテゴリは,ハー 数本に 1 本,トップニュースの肩書きを与える価値 ドウェア,ソフトウェア,ネットワーク,サービス/ があると判断したニュースに,A(★マークが 3 つ), コンテンツ,デバイス/テクノロジー,マーケット/カ B(★マークが 2 つ),C(★マークが 1 つ)のいずれかの ンパニー,トピックス,キーパーソン−−の 8 つで ランクを付ける.表紙目次を含めて,各種目次に表 ある. 示されるニュースタイトルの末尾には,この★マー (1)表紙目次を中心とした目次において,ニュースの クが,登録時の数のまま,付き続ける.ニュースが 扱いの軽重がわかるようにする. 何日も何ヵ月もたって,ニュース価値が薄れても, (2)いろいろな階層の目次において,最新目次と網羅 この★マークは,目次中のニュースタイトルには, 目次との 2 本立てとする. 付き続ける.これが登録時ランクである. ニュースは,「登録」と コラム一覧 図5 目次体系[III]=カテゴリ別目次以外の目次 いう操作を経て,はじめて, ○○氏のコラム ◇◇氏のコラム 表紙目次をはじめとする各 「今日のニュース一覧」 **氏のコラム 種目次に登場し,読者から 「バックナンバー」 ○月×日のニュース 読める状態になる.この ○月※日 ××氏のコラム 「登録」の際,A で登録さ ○月◇日 ○月△日のニュース ○月☆日 れるニュースは,表紙目次 ○月□日 ○月*日 のトップニュース欄の 1 位 コラムごとの目次 2000年※月 の位置に表示するようにな 2000年◇月 ××氏のコラム っている.それに伴い,そ [バックナンバーへ] れまでの表示順位 1 位が 2 2000年*月 当日のニュース=深夜 位に下がる.それまでの 2 1999年×月 になれば本数がそろう ニュース最新一覧 1999年△月 が、日中は少ない 位は 3 位に下がり,それま 前日のニュース=30本 [コラム一覧へ] から40本 での 3 位はトップニュース 欄から消える. 日の一覧 日付別ニュース一覧 経時時ランクは,そのと 1999年△月 ※月◇日のニュース きどきで,トップニュース △月×日 [バックナンバーへ] △月△日 欄の 1 位に表示されている ものが 1,2 位に表示され 全ニュースの最新20本 △月☆日 図4 目次体系[II]=カテゴリ別目次 トップニュース最新一覧 △月□日 △月*日 4 ﹁エ﹂登録前 ﹁エ﹂の登録 時ランクE ﹁エ﹂の登録 時ランクC ﹁エ﹂の登録 時ランクB ﹁エ﹂の登録 時ランクA 図6 ニュースランクの推 移ロジック 経時時ランク1 ア エ 経時時ランク2 イ ア 経時時ランク3 ウ イ 経時時ランク4 ウ 経時時ランク5 ア エ イ ウ ア イ エ ウ ア イ ウ エ 登録時ランクは、A〜CおよびE(ランク外)で、 登録時についたランクのまま不変。経時時ラ ンクは新規に記事が登録されると変わっていく。 経時時ランク1〜3は1つずつ。経時時ランク4 はランク入り経験ニュースだが、現在ランク外 (多数あり)、経時時ランク5はランク入り未経験 のニュース(多数あり)を示す。「ア」や「イ」は個々 のニュースを示す。各列は、新規登録された 記事「エ」の登録時ランクが各値だったときの、 登録後の経時時ランク ているものが 2(2 位に表示されているものには,最 初から登録時ランク B だったものと,最初は登録時 ランク A で次の A に押しのけられて 2 位になったも のとがある),3 位に表示されているものが 3(これも 2 と同様,登録時ランク A,B,C の 3 つの可能性が ある),一度はトップニュース欄に登場しながら現在 はトップニュース欄から押しのけられたものが 4, 一度もトップニュース欄に登場したことがないもの が 5 である. このランクの推移ロジックを図 6 に示した. (2)については,カテゴリを問わない目次について, 最新ニュース目次と,今日の目次およびバックナン バー(網羅型)目次とを,また,カテゴリ別の目次に ついて,カテゴリ別最新ニュース目次とカテゴリ別 バックナンバー(網羅型)目次とを,それぞれ設ける ことで対処した.詳しくは,後述する. (3)については,カテゴリ別の目次を設けることで 対処した. 3.4『ascii24 ウェブ』目次の具体的な構 成 それでは,目次の体系について説明する.まず, 表紙目次の中央の上部に,トップニュース欄が設け てある(図 3).ここに,経時時ランクで 1 位から 3 位 までのトップニュースのニュースタイトルが表示さ れる.その下に,カテゴリごとの欄がある.カテゴ リごとに最新の(最後に登録された)ニュース 1 つのニ ュースタイトルが表示される. 表紙目次の右側の上部には,「最新ヘッドライ ン」と称して,トップニュースであるか否か,ある いは,カテゴリの別に無関係に,最新のニュース 5 本のニュースタイトルを新しい順に示してある(実は, ニュースでないコラムも,同一基準,すなわち新し い順でニュースに交えて表示されている). カテゴリ別では,カテゴリごとの最新 20 本を新し い順に並べたカテゴリ別最新ニュース目次を,カテ ゴリごとに設けている.これだけでは,最新 20 本に 入っていないニュースをカテゴリ別にみたいときに 不便なので,カテゴリごとに網羅型でたどるための 仕組みを設けてある. まず,カテゴリ別バックナンバー目次がある(図 4). これは,その月の,当該カテゴリのニュースタイト ルを新しい順に並べたものと,前月以前の,年月だ けを新しい順にリストにしたものとからなる.後者 リスト中の年月をクリックすると,その年月におけ る当該カテゴリのニュースタイトルが新しい順に並 んだ月別のニュース一覧が出る.どちらにしても, 各月のカテゴリ別目次を呼び出すと,そこにニュー スタイトルがそのまま掲載されているから,それを クリックして本文ページに到達する.カテゴリ別バ ックナンバー目次で直接見えるニュースタイトルの 本数,すなわち,当該月のニュースの本数は,当然 のことながら,月初にはまだ少なく,月末になれば 約 1 ヵ月分になるので多くなる. トップニュースについても,最新ニュース目次と バックナンバー(網羅型)目次とがある.後者は,そ の月の,トップニュース欄に掲載されたことのある, すなわち,登録時ランク,A,B,C のニュースタイ トルを新しい順に並べている.前月以前については, 年月だけが,新しい順にリストになっている.あと の仕組みは,カテゴリ別と同じである. カテゴリを分けない目次としては,「今日のニュ ース一覧」という目次がある(図 5).これは,当日と 前日のニュースをそれぞれ 1 日分,新しい順に並べ たものである.朝のうち,当日に登録された記事が 少ないときは,当日分がわずかで,あとは,前日分 ということになる. カテゴリを分けない目次には,バックナンバー目 次もある.バックナンバー目次では,当月分につい ては,前々日までの日付が新しい順に並び,前月以 前については,年月が新しい順に並んでいる.その 年月をクリックすれば,その年月に属する日付が新 しい順に並んだ「日の一覧」となる.日付をクリッ クすれば,その年月日のニュースタイトルが新しい 順に表示される. 3.5 『ascii24 ウェブ』目次の作成ツール それでは,これらの種々の目次を生成するための ツールについて,説明する.以下のツールは,筆者 がプログラミングしたわけではない.筆者を中心に 仕様を決定し,その仕様に基づき,編集部員の中で 5 プログラミングの能力を備えた者がプログラミング したものである.下記で述べるツールの他に,バナ ー広告表示のための仕組みがあるが,それについて は本論文では省略する.それ以外にも,株式会社ア スキーの WWW サーバ全体との連携のための仕組み があるが,それも省略する.また,読者が自由に読 める WWW サーバーまでウェブページをコピーする 際には,外部からのアクセスを制限した編集部内の サーバーから,読者が読めるサーバーまで,サーバ ーからサーバーへのコピー処理を何段階か繰り返す のだが,それについても省略する. ツールは,実装上,いくつかのモジュールに分か れるが,論理的には,次のものに分けて考えられる (図 2). (1)日付ディレクトリ内 HTML ファイル一覧機能 (2)HTML ファイル登録機能 (3)目次作成機能 コラムを除くニュースのディレクトリ構造は,以 下のようになっている. 年ディレクトリ→日ディレクトリ→HTML ファイル 年と日のディレクトリとは,たとえば,1999 年の 3 月 4 日であれば,(上位省略)/1999/0304/といった具合 に名づけられている. ニュース記事をウェブページにした HTML ファイ ルは,該当の日ディレクトリにファイル転送で送り 込む.(1)の日付ディレクトリ内 HTML ファイル一覧 機能を実行するプログラムは,呼び出されると,該 当の日ディレクトリを調査し,その HTML ファイル の中の h1 タグで囲まれたニュースタイトルと,その HTML ファイルのファイル名を用いて,日付ディレ クトリ内 HTML ファイル一覧を作成する.このうち, 既に「登録」されているものには,既登録であるこ とを示すマークが,まだ「登録」されていないもの には,未登録であることを示し,また「登録」機能 に飛ぶためのマークが,それぞれ表示される. HTML ファイルのファイル名は,ニュースのカテゴ リに対応して名づけることになっている(その日のハ ードウェアのニュースで最初のものなら hard01.html, その日のトピックスのニュースで 3 番目のものなら topi03.html)ので,ファイル名を自動チェックして, カテゴリを決める. (2)の HTML ファイル登録機能では,ニュースタイ トル,登録時ランク,掲載時刻,掲載 URL,カテゴ リなどを登録する.ニュースタイトルは,HTML フ ァイルの h1 タグで囲まれたところを自動的に切り出 す.登録時ランクは,HTML ファイル登録画面で指 示する.掲載時刻は,デフォールト値では登録機能 を呼び出した時刻の 15 分後だが,手動で入力し直す ことができる.掲載 URL は,掲載日と HTML ファ イルのファイル名により自動的に決まる.カテゴリ は,ファイル名により自動的に決まる. この HTML ファイル登録時に,各種目次を効率よ く作成するための『PART ファイル』と呼ぶパラメ 6 ータファイルが生成される.PART ファイルは,テ キストファイルであり,ニュースタイトル,掲載月 日,掲載時刻,登録時ランクを示す★の文字列, URL から構成される.PART ファイルの名称は,15 桁の 10 進数値で,各桁がカテゴリ,ランク,登録年 月日時分などを示すようになっている. (3)の目次作成機能では,PART ファイルを,それ ぞれの目次の性格に合わせて,経時時ランクやカテ ゴリや登録時刻をキーとして,ソートする.そして, パラメータファイルの内容を,並んだ順につなぎ合 わせて目次 HTML ファイルを作成する. 4.『ascii24 タグ』の構成とその考え方 4.1 『ascii24 タグ』の意図 『ascii24 ウェブ』では,1998 年 10 月から,記者 が執筆する原稿に,『ascii24 タグ』と呼ぶ独自のタ グを記者自身が入れることにした.これは,記者の 原稿を,HTML ページに割り付け,HTML ファイル を作成する際に役立つ.まず,人手で HTML ファイ ルを作成する場合には,タグを使って指示した事項 が指示書の役割を果たす.次に,自動変換で HTML ファイルを作成する場合には,タグを使って伝達さ れるパラメータが,HTML ファイルのカテゴリなど を,変換ソフトに伝える.また,記事登録における ランク付けを変換ソフトに伝えることも理論的には 可能である.なお,実際には,登録時にデスクがそ の前後に登録,掲載する他のニュースとのバランス を考えてランクを変更することが多いため,ランク は人手により入力することとした. さらに,可能性としては,記者が執筆した原稿を 自動変換でデータベースに蓄積する場合には,タグ が,原稿の各部分が蓄積されるフィールドの種類を 指定する役割を果たす.また,自動変換の場合と同 様に,データベースから HTML ファイルを自動生成 する際のパラメータを指示する役割も果たす.なお, 1998 年 10 月から 2000 年 7 月までの時点では,開発 予算や開発工数の不足もあって,記事データベース を構築することはできなかった. 4.2 『ascii24 タグ』の分類 図 7 は,『ascii24 タグ』で用いるタグを列挙した ものである(開始タグのみ,またタグのセパレータで ある < , > を付け加えて示した).タグは, < , 図8 各種目次と本文との ページビューの比率 図7 ascii24タグ 1度だけ用いるタグ [a]目次指示型 <a_category> <l_category> <type> <value> [b]レイアウト指示型 <column_tytle> <credit> <daimei> <honmon> <lead> <no> [c]部内書誌型 (続き) <reporter1> <reporter2> <reporter3> <senior> <staff_editor> [d]開始終了指示 型 (記事の最初と最 後を示す) <article> [c]部内書誌型 複数回(0回を含 む)用いるタグ <date_of_release> <date_of_source> <date_of_writing> <desk> <image_exsist> <image_reffer> <length> <reporter_attri> <alert> <cap> <hdr> <notation> <pic> <pic_credit> <renraku_name> <renraku_saki> > で挟まれている. < 語は,予約語のみである. 99年3月 99年4月 99年5月 99年6月 99年7月 99年8月 99年9月 99年10月 99年11月 , > 各種 目次 本文 27.1% 35.0% 38.5% 37.7% 38.1% 39.2% 27.3% 35.3% 34.7% 72.9% 65.0% 61.5% 62.3% 61.9% 60.8% 72.7% 64.7% 65.3% 表紙画面を除く各種目次 のページビューの合計と、 ニュース本文のページビュー の合計との比率 リニューアルの 5 ヵ月後からのデータであるが, 99 年 8 月までの間,本文ページの閲覧数に対する各 種目次の閲覧数は,ほぼ一貫して増加している.各 種目次の充実が,徐々に読者に浸透し,目次からた どっていく傾向を推進していったものと判断できる. で挟まれる用 5.『ascii24 ウェブ』の目次体系および 『ascii24 タグ』の評価 5‑2.『ascii24 タグ』の評価 『ascii24 タグ』の採用により,次のようなメリッ トがもたらされた. (1)カテゴリ数が,リニューアル前の 4 つから 8 つへ 倍増したが,特に混乱なく対応できた. (2)ランク付けによるトップニュースという概念を導 入したが,特に混乱なく対応できた. (3)『ascii24 タグ』の導入の数ヵ月後に,『ascii24 タ グ』付きテキストから HTML ファイルへのコンバー タが開発できたため,HTML ファイル制作がほぼ自 動化できるようになった. 5‑1.『ascii24 ウェブ』の目次体系の評価 図 8 は,99 年 3 月から同 11 月までの 9 ヵ月間につ いて,各月の第 1 月曜日から次の日曜日までの 7 日 間における表紙画面を除く各種目次のページビュー の合計と,ニュース本文ページのページビューの合 計との比率を示したものである.表紙画面のほか, コラム本文やコラム目次,企画広告記事,イベント カレンダーなどを集計からはずした. 『ascii24 ウェブ』の目次体系を大幅にリニューア ルしたのは,98 年 10 月であるが,98 年 10 月から 99 年 (4)『ascii24 タグ』により,原稿の中に HTML ファイ ル化と記事登録の際の指示を書き込めるようになっ たため,HTML ファイル化と記事登録の業務が外注 できるようになった. 2 月までのアクセスログはすでに削除されてしまっ ている. 7 (5)2000 年 8 月から,『ascii24 タグ』の次の XML タ グの導入により,原稿のデータベース化とデータベ ースからの HTML ファイル化が完全に自動化できる ようになった.この XML タグは,いままで記者が 『ascii24 タグ』に慣れていたため,非常にスムーズ に導入できた. HTML ファイル制作と,本論文では詳述していな いが,『ascii24 ウェブ』の記事を他社のウェブサイ トに提供する際の形式変換業務との工数を, 『ascii24 タグ』の導入前と導入後(HTML コンバータ 利用開始後)とで比較する. 導入前には,1 日約 30 本のニュースにつき, HTML ファイル化作業の時間が,1 本あたり 11 分掛 かっていた.同じく他社のウェブサイトに提供する ための形式変換作業が,1 本あたり 3 分掛かっていた. また,表紙目次とカテゴリ別目次の合計 5 種類の目 次について,表紙目次作成に 1 日合計 30 分,4 種類 のカテゴリ別目次作成に 1 日合計 15 分掛かっていた. なお,カテゴリ別目次は,1 日の最後である深夜の 時間帯に余裕があれば実行することが多く,抜けが 非常に多かった. よってニュース本文用の作業時間は,HTML ファ イル化と他社ウェブサイトへの形式変換とを加えて, 1 本あたり 14 分.目次用の作業時間は,5 種類の目 次のために,1 日合計 45 分,1 種類あたり 11.2 分. 導入後には,HTML ファイル化作業の時間が,1 本あたり 6 分になった.他社ウェブサイト向け形式 変換作業が,1 本あたり 1 分になった.また,表紙目 次,カテゴリ別目次,トップニュース目次など合計 21 種類の目次について,1 日合計 60 分掛かるように なった.一方,ニュースを執筆する記者の側では, 『ascii24 タグ』を入れるために 1 本あたり約 3 分余 計に時間が掛かる.これを便宜上,HTML ファイル 化のために 2 分,目次作成のために 1 分,費やすも のとする. ニュース本文用の作業時間は,HTML ファイル化 と他社ウェブサイトへの形式変換と記者工数とを加 えて,1 本あたり 9 分.目次用の作業時間は,21 種 類の目次のために,1 日合計 60 分,1 種類あたり 2.9 分.よって,ニュース本文用の作業時間が 1 本あた り約 3 分の 2,目次の作業時間が目次 1 種類につき約 4 分の 1 になったことになる. ところで,『ascii24 タグ』の利用者は,社員記者 など『ascii24 ウェブ』の編集,制作にたずさわる十 数名のものである.彼らにとっては,業務命令によ り利用が開始されたものであり,使わないという自 由はなかった.満足度などを社員記者に問うて,仮 に非常にスコアが悪かった場合,『ascii24 ウェブ』 の業務体制の維持そのものに問題が生じる可能性が あるため,利用者側からの評価は調べていない. 8 6.今後の課題 筆者が,『ascii24 ウェブ』の目次体系をリニュー アルし,『ascii24 タグ』を導入した 98 年秋には,ウ ェブの広告収入がまだ少なく,本格的なシステム開 発を挙行する費用が捻出できなかった.その結果, 『ascii24 タグ』付きファイルから HTML ファイルへ の変換などにおいて,完全な自動化が実現できず, 一部人手による処理が残った.その後,ウェブビジ ネスの収入に明るいきざしが見えてきたため,次の 段階のシステム開発を,筆者の後任者が進める予定 である.これにより,タグ付きテキストを解釈して 記事データベースに完全自動で読み込み,その読み 込みと同じに HTML ファイルを完全自動で作成する ことが可能になる. 文 献 [1] 村田真:XML 入門,日本経済新聞社(1998) [2] 岡部恵三:XML がビジネスを変える!,翔泳社 (2000)
© Copyright 2024 Paperzz