検索ワードによる人的ネットワークの構築 背景

GOEN
検索ワードによる人的ネットワークの構築
出原ゼミ 3 年 高林数馬
背景
図 2:専門用語辞書の作成
膨大な情報がある Web 上で必要する情報を見つ
け出すのは困難であり、また欲しい情報が Web 上
に存在するという保証もない。そこで、情報自体
を探すのではなくその情報を持ち得る人間を自動
的に探し出す方法を考えた。
アプリケーション概要
ユーザーが検索エンジンを利用し、ワードを検
索した際に、そのワードに対して専門性の高いユ
ーザーを自動で探し出し、推奨する。(図1)
図 3:評価方法
このワードに詳しい人は?
現状
この人に聞いてみたら?

入力フォームに URL を入力すると、ウェブ
サイトの情報を取得し、専門性の数値を出
力する。

ウェブサイトの情報を追加した場合、デー
タベースの情報を上書きする。
図 1:アプリケーションの概要
今後の予定
実現方法

専門用語辞書の質を高める。
ユーザーの専門性を評価するために基準となる
辞書を構築する。この辞書は Web サイトを※1
Mecab で形態素解析し、※2 TermExtract で出力
した専門性の数値をデータベースに蓄積すること

入力したワード、訪問したサイトのデータ
で作成する。(図 2)
※1 Mecab:京都大学情報学研究科−日本電信電
話株式会社コミュニケーション科学基礎研究所 共同
研究ユニットプロジェクトを通じて開発された「形態素
専門用語辞書の構築
評価方法
ユーザーが検索したワードと訪問サイトの情報
を取得する。専門用語辞書と同じように、取得し
た情報から専門性を出力する。出力された結果の
数値と、専門用語辞書の数値を比較してユーザー
の専門性を評価する。(図3)専門値の比較方法
は、いくつかの手法を検討中である。
を取得する。
注釈
解析エンジン」
※2 TermExtract:東京大学・中川裕志教授、横浜
国立大学・森辰則助教授が作成した「専門用語自動
抽出システム」