GOEN 検索ワードによる人的ネットワークの構築 出原ゼミ 3 年 高林数馬 背景 図 2:専門用語辞書の作成 膨大な情報がある Web 上で必要する情報を見つ け出すのは困難であり、また欲しい情報が Web 上 に存在するという保証もない。そこで、情報自体 を探すのではなくその情報を持ち得る人間を自動 的に探し出す方法を考えた。 アプリケーション概要 ユーザーが検索エンジンを利用し、ワードを検 索した際に、そのワードに対して専門性の高いユ ーザーを自動で探し出し、推奨する。(図1) 図 3:評価方法 このワードに詳しい人は? 現状 この人に聞いてみたら? 入力フォームに URL を入力すると、ウェブ サイトの情報を取得し、専門性の数値を出 力する。 ウェブサイトの情報を追加した場合、デー タベースの情報を上書きする。 図 1:アプリケーションの概要 今後の予定 実現方法 専門用語辞書の質を高める。 ユーザーの専門性を評価するために基準となる 辞書を構築する。この辞書は Web サイトを※1 Mecab で形態素解析し、※2 TermExtract で出力 した専門性の数値をデータベースに蓄積すること 入力したワード、訪問したサイトのデータ で作成する。(図 2) ※1 Mecab:京都大学情報学研究科−日本電信電 話株式会社コミュニケーション科学基礎研究所 共同 研究ユニットプロジェクトを通じて開発された「形態素 専門用語辞書の構築 評価方法 ユーザーが検索したワードと訪問サイトの情報 を取得する。専門用語辞書と同じように、取得し た情報から専門性を出力する。出力された結果の 数値と、専門用語辞書の数値を比較してユーザー の専門性を評価する。(図3)専門値の比較方法 は、いくつかの手法を検討中である。 を取得する。 注釈 解析エンジン」 ※2 TermExtract:東京大学・中川裕志教授、横浜 国立大学・森辰則助教授が作成した「専門用語自動 抽出システム」
© Copyright 2024 Paperzz