Rosette Unicode 対応ライブラリ

製品
Rosette Unicode 対応ライブラリ
文字コードが異なるデータを
Unicode に変換して処理したい、
外字人名漢字もきちんと表示
したい方などにお勧めのツール
ソ フ ト ウェ ア や イ ン ター ネッ ト ア プ リ ケー ショ ン を 国
際 市 場 に 対 応 さ せ る に は、 言 語 に か か わ る 事 項、
特 に 文 字 コー ド が 大 き な 課 題 と な り ま す。 先 進 的 な
Rosette® Unicode 対 応 ラ イ ブ ラ リ (RCLU) は 多 言 語
対 応 の 際 に 直 面 す る 文 字 コー ド 処 理 の 課 題 を 解 決
し ま す。
各 国 固 有 の 文 字 コー ド を 世 界 共 通 の Unicode に 変
換 す る こ と に よ り、 ど の よ う な 文 字 コー ド の テ キ ス ト
デー タ も 処 理 で き る よ う に な り ま す。 ま た デー タ 出 力
な ど で Unicode 以 外 の 文 字 コー ド の サ ポー ト が 必 要
な 場 合 に は、 そ の 文 字 コー ド へ 変 換 し て 処 理 で き ま
す。
旧来の文字コードへの対応
旧 来 の 文 字 コー ド か ら Unicode へ、 ま た そ の 逆 の 変
換 を、 確 実 か つ 効 率 的 に お こ な い ま す。
マルチプラットフォーム対応
Microsoft Windows 、 Sun Solaris 、 Linux 等、 現 行 の
主 要 プ ラッ ト フォー ム す べ て に 対 応 し ま す。
簡単なテキスト操作
デー タ の ソー ト、 正 規 化、 文 字 列 の 一 致 等 の 機 能 を
容 易 に 実 現 す る た め、 さ ま ざ ま な 文 字 変 換 及 び 文 字
属 性 分 類 の 機 能 を 備 え て い ま す。
日本語対応
ISO-2022-JP (JIS) 、 Shift-JIS 、 EUC-JP な ど と いっ た 日
本 固 有 の 文 字 コー ド で の デー タ 処 理 が 必 要 と な る 場
合、 こ れ ら 日 本 語 固 有 の 文 字 コー ド か ら Unicode へ
の 変 換、 あ る い は そ の 逆 を お こ な う た め の ツー ル と し
て も ご 利 用 い た だ け ま す。 JIS X0213 (JIS 第 1 ~ 第 4
水 準) に も 対 応 し て い ま す。
文字コード変換
Unicode 5.0 と 160 種 類 以 上 の 旧 来 の 文 字 コー ド と の
間 の 変 換 を サ ポー ト し て い ま す。
UNICODE 文字の分類と変換
176 種 類 の 文 字 属 性 お よ び 文 字 種 に よっ て Unicode
文 字 の 分 類 と 置 き 換 え を 行 い ま す。
高い実行性能
高 速 か つ 効 率 的 で、 ス レッ ド・セー フ。
文字コードテーブルのダイナミック・ロード
メ モ リー 必 要 量 を 最 小 限 に 抑 え ま す。
仕様
• 160 種 類 以 上 の 旧 来 の 文 字 コー ド に 対 応
• Unicode 対 応 エ ン コー ディ ン グ
Unicode 標 準 1.2 、 2.X 、 3.X 、 4.X 、5.X
UCS-2 (big-endian ま た は little-endian)
UTF-7 、 UTF-8 フォー マッ ト
バ イ ト オー ダー マー ク (BOM ) 有 / 無
Java 及 び SGML の 文 字 参 照
• 30 種 類 の 文 字 変 換
• コ ン パ ク ト な ラ イ ブ ラ リ サ イ ズ - 別 に 500KB –
10MB の 変 換 テー ブ ル
お問合せ
さらに詳しい製品情報ならびに評価版のご利用を
ご 希 望 の 方 は 下 記 へ ご 連 絡 く だ さ い。
[email protected]
www.basistech.jp
電 話 03-3511-2947
Basis Technology は Unicode
Consortium のメンバー企業として、
Unicode 標準の策定や普及等にも貢
献を続けています。
対応文字コード
アラビア語 ̶ CP10004
アラビア語 ̶ CP1256
アラビア語 ̶ CP20420
アラビア語 ̶ CP28596
アラビア語 ̶ CP720
アラビア語 ̶ CP864
アラビア語 ̶ ISO 8859-6
アラビア語 ̶ CP708
バルト⽂字 ̶ CP1257
バルト⽂字 ̶ CP28594
バルト⽂字 ̶ CP775
バルト⽂字 ̶ ISO 8859-4
バルト⽂字 ̶ ISO 8859-13
ケルト⽂字 ̶ ISO 8859-14
中国語(簡体字) ̶ CCSID 935
中国語(簡体字) ̶ EUC-CN
中国語(簡体字) ̶ GB2312
中国語(簡体字) ̶ HZ-GB-2312
中国語(簡体字) ̶ CP936
中国語(簡体字) ̶ MacChineseSimplified
中国語(繁体字) ̶ CCSID 937
中国語(繁体字) ̶ CNS-11643-1986
中国語(繁体字) ̶ CNS-11643-1992
中国語(繁体字) ̶ EUC-TW
中国語(繁体字) ̶ GB12345
中国語(繁体字) ̶ Big5
中国語(繁体字) ̶ CP10002
中国語(繁体字) ̶ CP950
中国語(繁体字) ̶ MacChineseTraditional
クロアチア語 ̶ MacCroatian
キリル⽂字 ̶ CP10007
キリル⽂字 ̶ CP1251
キリル⽂字 ̶ CP20866
キリル⽂字 ̶ CP20880
キリル⽂字 ̶ CP21025
キリル⽂字 ̶ CP21866
キリル⽂字 ̶ CP28595
キリル⽂字 ̶ CP855
キリル⽂字 ̶ CP866
キリル⽂字 ̶ ISO 8859-5
キリル⽂字 ̶ MacCyrillic
デーヴァナーガリー⽂字 ̶ MacDevanagari
ギリシャ語 ̶ CP10006
ギリシャ語 ̶ CP1253
ギリシャ語 ̶ CP20423
ギリシャ語 ̶ CP28597
ギリシャ語 ̶ CP737
ギリシャ語 ̶ CP869
ギリシャ語 ̶ ISO 8859-7
ギリシャ語 ̶ MacGreek
グジャラート語 ̶ MacGujarati
グルムキー⽂字 ̶ CP10010
グルムキー⽂字 ̶ MacGurmukhi
ヘブライ語 ̶ CP10005
ヘブライ語 ̶ CP1255
ヘブライ語 ̶ CP28598
ヘブライ語 ̶ CP38598
ヘブライ語 ̶ CP862
ヘブライ語 ̶ ISO 8859-8
アイスランド語 ̶ CP10079
アイスランド語 ̶ CP861
アイスランド語 ̶ MacIcelandic
⽇本語 ̶ CCSID 1027
⽇本語 ̶ CCSID 290
⽇本語 ̶ CCSID 930
⽇本語 ̶ CCSID 939
⽇本語 ̶ CCSID 942
⽇本語 ̶ CP10001
⽇本語 ̶ CP20290
⽇本語 ̶ CP21027
⽇本語 ̶ EUC-JP
⽇本語 ̶ ISO-2022-JP
⽇本語 ̶ JIS_X_0201
⽇本語 ̶ JIS_X_0208
⽇本語 ̶ MacJapanese
⽇本語 ̶ Shift-JISMS
⽇本語 ̶ Shift-JIS78
朝鮮語 ̶ CP10003
朝鮮語 ̶ CP1361
朝鮮語 ̶ CP949
朝鮮語 ̶ EUC-KR
朝鮮語 ̶ ISO-2022-KR
朝鮮語 ̶ Johab
朝鮮語 ̶ KS_C_5601-1987
朝鮮語 ̶ KS_C_5861-1992
朝鮮語 ̶ MacKorean
Latin ̶ CP10000
Latin ̶ CP10029
Latin ̶ CP10082
Latin ̶ CCSID 1047
Latin ̶ CP20261
Latin ̶ CP20269
Latin ̶ CP20273
Latin ̶ CP20277
Latin ̶ CP20278
Latin ̶ CP20280
Latin ̶ CP20284
Latin ̶ CP20285
Latin ̶ CP20297
Latin ̶ CP20833
Latin ̶ CP20871
Latin ̶ CP28591
Latin ̶ CP28593
Latin ̶ CP850
Latin ̶ CP870
Latin ̶ ISO 8859-1
Latin ̶ ISO 8859-15
Latin ̶ ISO 8859-2
Latin ̶ MacRoman
Latin ̶ NextStep
Latin ̶ Adobe-Standard
Latin, Canadian French ̶ CP863
Latin, Central European ̶ CP28592
Latin, Central European ̶ MacCentralEuropean
Latin, Eastern European ̶ CP1250
Latin, Esperanto ̶ CP20905
Latin, Portugese ̶ CP860
Latin, Southeast European ̶ ISO 8859-3
Latin, US English ̶ ASCII
Latin, US English ̶ CP037
Latin, US English ̶ CP1026
Latin, US English ̶ CP1252
Latin, US English ̶ CP20105
Latin, US English ̶ CP437
Latin, US English ̶ CP500
Latin, US English ̶ CP875
マラヤーラム語 ̶ CP10017
Nordic ̶ CP865
Nordic ̶ ISO 8859-10
ルーマニア語 ̶ MacRomanian
スラブ⽂字 ̶ CP852
シンボル ̶ Adobe-Symbol
シンボル ̶ Adobe-Zapf-Dingbats
シンボル ̶ CP10008
シンボル ̶ MacDingbats
シンボル ̶ MacSymbol
タイ語 ̶ CP20838
タイ語 ̶ CP874
タイ語 ̶ ISO 8859-11
タイ語 ̶ MacThai
トルコ語 ̶ CP10081
トルコ語 ̶ CP1254
トルコ語 ̶ CP28599
トルコ語 ̶ CP857
トルコ語 ̶ ISO 8859-9
トルコ語 ̶ MacTurkish
Ukranian ̶ MacUkrainian
Unicode ̶ BMP
Unicode ̶ Java
Unicode ̶ UCS2
Unicode ̶ Unicode Big-endian
Unicode ̶ Unicode Little-endian
Unicode ̶ Unicode11-UCS2
Unicode ̶ Unicode11-UTF7
Unicode ̶ Unicode11-UTF8
Unicode ̶ UTF7
Unicode ̶ UTF8
Unicode ̶ UTF-EBCDIC
ベトナム語 ̶ CP1258
対応プラットフォーム
以 下 の プ ラッ ト フォー ム 対 応 の SDK を 提 供 し ま す。 そ の 他 の プ ラッ ト フォー ム の サ ポー ト も、 ご 要 望 に 応 じ 対 応 し ま
す。
Linux CentOS 5.x/6.x, IA32/AMD64
Linux Debian 6.x/7.x, IA32/AMD64
Linux Red Hat 5.x/6.x, IA32/AMD64
詳細 www.basistech.jp
〒102-0084
東京都千代⽥区⼆番町9-6
Linux Ubuntu 12.x/13.x, IA32/AMD64
MacOS
Solaris 10/11, SPARC32/64, IA32/AMD64
お問合せ [email protected]
One Alewife Center
Cambridge, MA 02140
Windows XP/Vista/7, IA32/AMD64
Windows Server 2003, 2008
電話 03-3511-2947
2553 Dulles View Drive
Herndon, VA 20171
1 Furzeground Way
Middlesex UB11 1BD, UK
© 2014 Basis Technology Corporaon. “Basis Technology”, “Geoscope”, “Odyssey Digital Forensics”, “Rosee”, and “We put the World in the World Wide Web” are registered
trademarks of Basis Technology Corporaon. All other trademarks, service marks, and logos used in this document are the property of their respecve owners. (2014-01-24)