Rosette 日本語住所データ解析モジュール

製品
Rosette 日本語住所データ解析モジュール
住所データを正確に「分かち書き」
ローマ字変換にも対応
Rosette® 日 本 語 住 所 デー タ 解 析 モ ジュー ル (JPOST
: Japanese Postal Address Analyzer) は、 デー タ 照 合
な ど を 行 う ア プ リ ケー ショ ン に お い て、 複 雑 で 統 一 性
の な い 日 本 語 住 所 形 式 の 処 理 を 可 能 に し、 日 本 語
住 所 デー タ の 解 析、 正 規 化、 照 合 を お こ な い ま す。
日 本 の 住 所 形 式 は 地 域 に よっ て 使 用 し て い る 形 式
が 異 な り、 ソ フ ト ウェ ア に お け る 日 本 語 住 所 デー タ の
解 析、 正 規 化 お よ び 確 認・照 合 が 難 し く なっ て い ま
す。 し か し、 Rosette 日 本 語 住 所 デー タ 解 析 モ ジュー
ルは以下の機能の実現により、日本語住所データの
取 扱 を 容 易 に し ま し た。
• 日本語住所を構成要素ごとに分割
• 郵便番号による住所の特定
• 住 所 デー タ の 正 規 化
• 入 力 さ れ た 住 所 構 成 を、 JPOST 内 蔵 の デー タ ベー
スと照合
• 郵 便 番 号 や 都 道 府 県 名 な ど の 記 入 洩 れ を デー タ
に自動入力
• 日 本 語 住 所 表 記 を カ タ カ ナ (ふ り が な) ロー マ 字
に変換
• 印 刷 用 等 に 住 所 デー タ を フォー マッ ト 化
DB の グ ロー バ ル 対 応 用 に、 日 本 語 住 所 情 報 の ア ル
ファ ベッ ト 化、 都 道 府 県 等 の 分 か ち 書 き が 必 要 な 方
に お 勧 め で す。
正規化機能
• 3桁もしくは5桁の郵便番号を新しい7桁の番号に
変換
• 全 角 ロー マ 字 お よ び ア ラ ビ ア 数 字 を 半 角 に 変 換
• 半角カタカナを全角カタカナに変換
• 番 地、 建 物 名、 部 屋 番 号 の 表 記
• 漢数字をアラビア数字に変換
• 主な表記のゆれおよび建物名の省略形への対
応
仕様
• C/C++ API
• 多 く の プ ラッ ト フォー ム に 対 応
• ス レッ ド セー フ
対応プラットフォーム
以 下 の プ ラッ ト フォー ム 対 応 の SDK を 提 供 し ま す。 そ
の 他 の プ ラッ ト フォー ム の サ ポー ト も、 ご 要 望 に 応 じ
対 応 し ま す。
Linux CentOS 5.x/6.x, IA32/AMD64
Linux Debian 6.x/7.x, IA32/AMD64
Linux Red Hat 5.x/6.x, IA32/AMD64
Linux Ubuntu 12.x/13.x, IA32/AMD64
MacOS
Solaris 10/11, SPARC32/64, IA32/AMD64
Windows XP/Vista/7, IA32/AMD64
Windows Server 2003, 2008
お問合せ
さらに詳しい製品情報ならびに評価版のご利用を
ご 希 望 の 方 は 下 記 へ ご 連 絡 く だ さ い。
[email protected]
www.basistech.jp
電 話 03-3511-2947
入出力例
出力:
1. 正 し い 郵 便 番 号 に 修 正 し、 霞ヶ 関 を 霞 が 関 に 正 規
化
住所構成要素 地図形式
入力データ:
〒 100-8902 東 京 都 千 代 田 区 霞ヶ 関 1 丁 目 3 -1
出力:
住所構成要素 地図形式
郵便番号
都道府県名
区名
地区名
丁目
番地
号
100-0013
東京都
千代田区
霞が関
1
3
1
番地
フリガナ
ローマ字
100-0013
トウキョウト
チヨダク
カスミガセキ
1チョウメ
3バンチ
1ゴウ
100-0013
Tokyo-to
Chiyoda-ku
Kasumigaseki
1 choume
3 banchi
1 gou
2. 松 涛 を 松 濤 に 正 規 化 し、 郵 便 番 号 と 都 道 府 県 を
自動挿入
入力データ:
渋 谷 区 松 涛1-28-7
出力:
住所構成要素 地図形式
郵便番号
都道府県名
区名
町名
番地
150-0046
東京都
渋谷区
松濤
1-28-7
5. 郡 を 自 動 挿 入
ローマ字
600-8530
キョウトフ
キョウトシ
シモギョウク
ミナミフドンドウ
チョウ
600-8530
Kyoto-fu
Kyoto-shi
Shimogyou-ku
Minamifudondouchou
801バンチ
801 banchi
入力データ:
沖 縄 県 北 谷 町 字 砂 辺 272 番 地
出力:
住所構成要素 地図形式
郵便番号
都道府県名
郡名
町名
地区名
番地
904-0111
沖縄県
中頭郡
北谷町
砂辺
272
フリガナ
ローマ字
904-0111
オキナワケン
ナカガミグン
チャタンチョウ
スナベ
272バンチ
904-0111
Okinawa-ken
Nakagamigun
Chatanchou
Sunabe
272 banchi
住所データのローマ字変換サービス
フリガナ
ローマ字
150-0046
トウキョウト
シブヤク
ショウトウ
1-28-7
150-0046
Tokyo-to
Shibuya-ku
Shoutou
1-28-7
3. 事 業 所 の 個 別 郵 便 番 号 に も 対 応
600-8530
京都府
京都市
下京区
塩小路通堀川
東入南不動堂
町
801
郵便番号
都道府県名
市名
区名
地区名
フリガナ
入力データ:
10 万 件 以 上 の 住 所 デー タ の 変 換 に 最 適
Rosette® 日 本 語 住 所 デー タ 解 析 モ ジュー ル (JPOST)
を 利 用 し、 日 本 語 住 所 表 記 を ロー マ 字 に 変 換 す る
サー ビ ス も 提 供 し て い ま す。 JPOST を 従 来 の パッ ケー
ジ で ご 購 入 い た だ か な く て も、 そ の 都 度、 案 件 ご と に
ご 利 用 い た だ け ま す。
出 力 フォー マッ ト の カ ス タ マ イ ズ も 可 能 で す。
168-8585
出力:
東 京 都 杉 並 区 高 井 戸 東 3 丁 目 29 番 地 21 号
4. 京 都 の 「通 り 名」 住 所 に も 一 部 対 応
入力データ:
京 都 市 下 京 区 塩 小 路 通 堀 川 東 入 南 不 動 堂 町 801 番 地
詳細 www.basistech.jp
〒102-0084
東京都千代⽥区⼆番町9-6
お問合せ [email protected]
One Alewife Center
Cambridge, MA 02140
電話 03-3511-2947
2553 Dulles View Drive
Herndon, VA 20171
1 Furzeground Way
Middlesex UB11 1BD, UK
© 2014 Basis Technology Corporaon. “Basis Technology”, “Geoscope”, “Odyssey Digital Forensics”, “Rosee”, and “We put the World in the World Wide Web” are registered
trademarks of Basis Technology Corporaon. All other trademarks, service marks, and logos used in this document are the property of their respecve owners. (2014-01-24)