仮名漢字変換技術

連載
:
足跡
情報処理技術の
の
日本
漢字・日本語処理技術の発展:
仮名漢字変換技術
小林 龍生 ジャストシステムデジタル文化研究所
[email protected]
本稿では,日本の代表的な仮名漢字変換システム ATOK の歴史に沿いながら,仮名漢字変換技術の変遷を概観する.全
体を,黎明期(フレームワーク模索の時代)
,規範性追求期(ATOK 監修委員会の時代),多様性追求期(多様なデバイ
スへの対応と方言対応の時代)に分けて記述する.記述の順序は一部時間的に前後関係が逆になる場合と重複する場合
がある.また,仮名漢字変換技術も含め,日本語処理技術は,特に初期においては,パーソナルコンピュータ用ワード
プロセッサソフトウェアに比して,ワープロ専用機がかなり先行していた時期があるが,この点に関しては別稿で森健
一氏が論じられると思われるので,本稿では深く触れることをしない.
ATOK
年
黎明期
歴史
1983 年
字変換技術
ATOK
歴史
,1982 年 10 月
NEC
製品
「KTIS」 遡
,1983 年 10 月
換部分
嚆矢
.1979 年
最初
前
,
前史
1979
,日本語情報処理技術,仮名漢
観点
概観
.
• 1978 年 1 月:
「情報交換用漢字符号系 JIS C 6226-1978」
(現
.市場
発売
,
製品
8
• 1978 年 6 月:牧野寛・木澤誠「
設立
一般市場向
在 「7
情報交換用
2
符号化漢字集合 JIS X 0208:1997」 前身)発行
「JS-WORD」 仮名漢字変
PC-100
返
前後
発表
CP/M 用日本語処理
投入
振
書
文
分
書
仮名漢字変換」(情報処理学会論文誌)
.
事 項
備 考
1979 年 7 月 ジャストシステム創業
1981 年
最初のパソコン用日本語処理システム
の開発に着手
1982 年 10 月 8 ビットマイコンの標準 OS「CP/M」用
日本語処理システム「KTIS」をデータシ
ョウで発表
1983 年 10 月[KTIS]
ATOK の前身.KTIS とは Kana-kanji Transfer Input System の頭文字.先読み単語・熟語変換方式
(「JS-WORD」に搭載)
を採用した.
「JS-WORD」は NEC の PC-100 にバンドルされたジャストシステム開発,ASCII 販売のワー
プロソフト.
1984 年 5 月 [KTIS2]
文節仮名漢字変換システムを採用.
(「JS-WORD Ver.2」に搭載)
1985 年 2 月 [ATOK3]
初代 ATOK − ATOK .ATOK は「エイトック」と読む.Advanced Technology Of Kana-kanji transfer
(「jX-WORD 太郎」に搭載)
の頭文字.
連文節仮名漢字変換システム採用.
1985 年 8 月 [ATOK4]
MS-DOS 上の他ソフトに組み込んで使えるように FEP 化.一太郎での日本語入力環境を他
(「一太郎」に搭載)
ソフトでも実現.
1986 年 5 月 「ATOK5]
自動変換,複合連文節変換,複合単文節変換,一括変換の 4 つの変換方式を採用.
(「一太郎 Ver.2」に搭載)
1987 年 6 月 [ATOK6]
(「一太郎 Ver.3」に搭載」
)
1989 年 4 月 [ATOK7]
EMS(拡張メモリ)に対応.環境に応じた辞書(S ,M ,L) プログラムを提供.
(「一太郎 Ver.4」
「一太郎 dash」に搭載)
表 -1 黎明期の ATOK
IPSJ Magazine Vol.43 No.10 Oct. 2002
−1−
1099
日本の情報処理技術の足跡
• 1978 年 9 月:森健一
開発
日本最初
日本語
特
,ATOK5
,文節
JW-10 発売
• 1979 年 3 月:NEC
PC-8001 発表
• 1979 年 10 月: 森健一・河田勉「
漢字変換」
(情報
二文節最長一致法
見
PC-9801 発売
16
文
区切
漢字変換」
言及
始
,特定分野用
整
向
専用
利用
個人利用
,
時期
研究室
,一気
分野
続
,研究
一部
分野
適応
最長一致法
採用
見
取
獲得
,
創業
時代
空気
中
浮川初子
用
,
6226-1978
用
話
,
合
,
前
準拠
漢字
,
用
字
簡単
入出力
OS(MS-DOS) 登場
名漢字変換
,16
同時
「KTIS」 ,市場
以 後, 表 -1
投入
,1989 年
毎年
繰
漢字変換機能
,進化発展
年表
,
最初
重要
指摘
仮名
1
環境
上
,
.
製品
実装
,
,結果的
高
,市場生命
加味
文節区切 (形態素解析)
1985 年
進展
.
Processor
用
,二
ATOK
上
製品
市販製品
後
,非常
)
考
一般
,
.
FEP : Front-End
流
中
呼
出
利用
構造
,使
慣
名漢字変換
利用
43 巻 10 号 情報処理 2002 年 10 月
−2−
重
.MS-DOS 上
自由
環境
逆
進展
上
市場
役立
呼
共通
OS
「KTIS」
MS-DOS 環境
ATOK
化(後
転機
汎用的
挙
,最初
高
単語・熟語変換
変換,一括変換
長
変換
開発
,
競争力
1986 年:ATOK5 自動変換,複合連文節変換,複合単文節
,
N 文節最長一致法
時代
1984 年:KTIS2 文節仮名漢字変換
1100
)
,現在
発展形
稼働
要
超
,最初期
CP/M
1985 年:ATOK3 連文節仮名漢字変換
見
.
.8
,仮名漢字変換
早
,CPU
入
.
用
段階
1983 年:KTIS 先読
大
解析手法
,
.
可能
最初
,
考慮
市場競争力
文節最長一致法
,仮名漢字変換
技術的,市場的発展
読
返
,
製品
進歩,価格低下
.
ATOK7
.
注目
,市販
効果
仮
取
間
開発手法
汎用的
最初
,他
採用
表示,印
長足
,同社
,
,若干限界
利用
CPU
一
性能限界
製品
上
,
学界
市販
.
背景
時代
,ATOK5 以前
1)
,二文節
辞書容量
(場合
作
,漢字指定式
.
,漢字
漢字
書
,
時点
,JIS C
専用
,自
見
,
仮名漢字変換
手
書
同時
二文節最長一致法
制約
1人
,単語分
開発担当者
.
創業者
区切
検討対象
段階
文節
1986 年
評価
有効
,牧野 「
.ATOK5
.
書
自動的
,文節分
,仮名漢字変換方式
入力方法
広
文
方法
定
一般企業
書
書
列挙
,
,一方
方式
方法
進展,実
特殊
,
論文
,非常
.
2)
立語・付属語分
,
研究開発
,大学
栗原
研究室
連綿
仮名漢字変換研究
装環境双方
1967 年
,主
採用
牧野・木澤
方法
示
入力
森・河田
挙
,1979 年時点
文節
改正版)
俊彦
,先
取
• 1983 年 9 月:
「情報交換用漢字符号系 JJIS X 0208-1983」
(JIS
上述
推論
.
処理 解説)
C 6226-1978
位置
,二文節最長一致法
8
• 1982 年 10 月:NEC
区切
伴
面
実現
捉
,仮名漢字変換
.
,仮名漢字変換
自体
,
仮
日本の情報処理技術の足跡
1992 年 1 月 ATOK 監修委員会発足
辞書編纂から変換候補の順位付け,AI 変換用例など,日本語をコンピュータで扱うためのさまざま
なテーマを時代を見据えながら議論し,製品に反映していくための組織として発足.ATOK8 の AI 用例
は,この委員会の議論が反映されている.
AI 変換(共起)機能搭載.
1993 年 4 月 [ATOK8]
(「一太郎 Ver.5」に搭載)
1995 年 1 月 [ATOK9]
(「一太郎 Ver.6.3」に搭載)
1996 年 9 月 [ATOK10]
(「一太郎 7」に搭載)
1997 年 2 月 [ATOK11]
(「一太郎 8」に搭載)
1998 年 9 月 [ATOK12]
(「一太郎 9」に搭載)
1999 年 11 月[ATOK13]
(「一太郎 10」に搭載)
ローマ字入力時のアルファベットの入力ミスや,仮名入力時の濁点・半濁点などの入力ミスを自動
修正する自動入力補正機能「JAC」を搭載.
慣用句や仮名遣いの誤り,ら抜き表現などを入力変換時にリアルタイムで校正する「JUST MEDDLER」
を搭載.
変換確定した単語の意味情報を元に,現在入力中の話題(分野)を抽出し,話題にあった最適な同
音語を使い分ける文脈解析変換を搭載.
日本語変換の基本性能を見直し,
“SuperATOK エンジン”を新たに開発.文脈解析処理をさらに強化し,
文中の「それ」や「これ」の指す意味を理解し,より適切な変換候補の提示を可能とした.
漢字や記号のマウスによる手書き入力が可能な「手書き文字入力」,文脈から判断が難しい同音語の
使い分けを変換候補窓に表示する「同音語選択支援」機能を搭載.さらに,
変換履歴データを参照し,
入力する単語を予想してポップアップ提示する「推測変換機能」,指定したファイルやフォルダ,ク
リップボードから未登録語や AI 用例を抽出してユーザ辞書に自動的に学習させる「AI 辞書トレーナ」
機能等により,変換効率・速度が向上.
また,
「ことば」を入力するだけで目的のホームページにアクセスできる「ATOK Direct」,サーバ上に
設定されたさまざまな辞書やコンテンツを参照できる「ATOK Channel」,インターネットに個人の辞書
を保存して,異なるパソコンからも常に自分の ATOK 環境が利用可能な「ATOK Sync」の 3 つから構成
される「iATOK」により,インターネットとの融合をさらに強化.
2001 年 2 月 [ATOK14]
(「一太郎 11」に搭載)
表 -2 規範追求期の ATOK
切
善 悪
含
離
,
,独立
組
評価
言
状況
,
込
種徒花的
.
書
文
状況
,
現在
漢字変換
消
期
形作
考
,
,多
覇
挙
列挙
1992 年 1 月,
,ATOK
市場
3)
時
.
時期
名漢字変換
規範追求期
仮名
,
競
仮
.参考
調査対象仮名漢字変換
座長
條治
国語学者,教育者
.
)
,ATOK((株)
満
程度
)
,DANGO((株)
),DFJ(
(株)
)
,
E1(
(株)
)
,EGBridge(
(株)
)
,FIXER(
(株)
),JJ(
(株)
((株)
NECAI(日本電気(株)
)
,OMAC(
(株)
独立性
,一時的
多様
高
・
( 入力支援
・
・
,汎用的
(株))
3)
OS
見
普及・寡占化
世上
不
.
,「ATOK 監修委員会」座長
以前「
」1990 年 5 月号(大修館書店刊)
下記
記
.
OS
現況
理能力
不満
(中略).辞書
.
充実度
面
,普及機種
感
多 .
必要
後,
編者
限
,漢字処
辞書
貧弱
要因
左右
辞書 編者 明
.
人格性(思想
,言語生活
見
達意 日本語入力 不足
言語生活
定見 有
恣意的 既成 紙辞書 孫引
仮名漢字変換
Input Method)
残 .1
関係
種
取
「OA 文具
対応
仮名漢字変換
形成
Microsoft Windows
)
,
VJE((株)
)
,WPFEP(
)
,WX(
仮名漢
対
)
,Katana
)
,松茸(
(株)管理工学研究所),
)
,WAVE((株)
固
変換用辞書
,紀田順一郎
就任
,
枠組
全般,特
要求
「ATOK 監修委
背景
観点
)
,ASK((株)
紀田
,近藤泰弘,栗岩英雄,矢澤真人,高本
員会」 設置
.
ACE(
(株)大塚商会)
,AJIP(
(株)
教育
批評家・作家
順一郎
字変換
繚乱期
背景
仮名漢字変換
実行
,時代
繚乱期
.
独立
,箭内
,
辞書編纂
体系) 存在
係員 ,
抜粋
弊害 一向 改
標準
IPSJ Magazine Vol.43 No.10 Oct. 2002
−3−
」4)
1101
日本の情報処理技術の足跡
,箭内
前掲書
「電脳辞書
,
気
編集責任 必
電脳辞書 作成
気配
明確
(中略)
.
,国語学者
.
参画
辞書
技術者 作
上
,紙幅
語処理
関係
,
夫 ,各社
電脳国語学者箭内敏
仮名漢字変換
観点
縦横
分析
変換辞書
,
一貫性
共通
,仮名漢字変換
一定
,
変換用辞書
構築
水準
一貫
,事務文書用途
,
恣意的
当時
状況
,
基
偏
成熟
大
持
程度
手法
限界 達
人格性(思想
定見
持
専門家
辞書
編纂
当
工学的
排除
,
規範性
」
由 ,
上記
,1993 年 4 月発売
成果
提供
含
都合 8 回
徹底的
紀田自
,
ATOK8
委員会
見直
検討
義語
行
術的達成度
課題
名漢字変換
,理論
語彙
開発
招
伴
仮名漢字
仮名漢字変換
変換表記
種
社会的責務
持
.
,
多
語彙
方言
展開
動
,多
,実用化
同音異
自由
ATOK
ATOK 監修委員各氏
入
,
可能
意味
.多
人
人々
,
一 方,1993 年
OS
論文 6) ,郡司隆男 「仮
世界
」
置
Macintosh 対 応
,
.
力
換
皮切
,ATOK
,
,
,最近
,PDA 用
,
機 至
ATOK
環境
傾注
分
対応
携帯電話,
謂
7)
否
自己表現
,
Windows ,Solaris ,hp-ux
推進
受
.
時期(規範追求期) 技
」
.
共通
言語文化的背景
飛躍
1
第一
,
ATOK
日本人
多様
入
思
方言対応
計画
,
ATOK
,
ATOK
日本人
満足
「話
持
使用状況
」
関係
感
「力
,
.2003 年以降
規範性
.
,
実用化
1102
,
『
鳴
情報) 取
協力
,
「
拡大
,
脱皮
共起情報(
「蝉
前後
浮川初子,阿望博喜
引用
多様
.
共起辞書
並々
種
,
」 搭載
出
担当
通読
踏
間
片手
」
判別処理
,
.
選定
言葉関西
5)
,技術的
,
状況
対
求
歩
開
中
行
.
,
行
,百科語彙
常住坐臥,電車
泣
側
規範性
,
.
,社会全体
日本語
仮
理
如実 現
間
国際大百科事典』 全目次項目
坊
記述
6)
2002 年 2 月,ATOK15
1992 年 10 月
,変換用辞書
「赤
辞書
求
考
.
1992 年 1 月
ATOK8
「記述性
普及
」仮名漢字変換
「ATOK 監修委員会」 設立
要不要
認識
多様性追求期
座長
求
変換
,
初期出荷仕様
要件
論文
名漢字変換
.
委員会
浮川・阿望
「
必要
重要
個性
.
体系) 言語生活
恣意性
個々人
,製品
日本語文書生産
,
紀田 述
言語生活
,自然言
目的
上
変換精度,
,
日本
含
,文書
,
.
向上
,膨大
,当然
非常
先
仮名漢字変換
中
持
決定
,
時間
製
充
表現
語彙選択
批判
多
構築
作業過程
語一般
達
方針
.
仮名漢字変換
例外処理
辞書
割
.
批判
要
膨大
批判
.
時期
収集吟味,多
記述
用例数」
,
「同音
項目
実装開発作業
語事象
.
辞書」「弊害対策」
「変換
整備」
品
,市井
「同音語処理
洗練,日本語
」
.
多
表記法」「表記法
3)
記述
」6) 受
整
目
対応
43 巻 10 号 情報処理 2002 年 10 月
−4−
,
使用
.
多様
,
OS
意味
,
,現今
装置
日
日本の情報処理技術の足跡
2002 年 2 月 [ATOK15]
(「一太郎 12」に搭載)
多彩な日本語表現への対応第一弾として「話し言葉関西モード」を搭載.「ATOK LAN Extension」は,
LAN 環境内で公開された他のパソコンの辞書を利用して,社内の専門用語や社員名簿,商品リスト等
が共有でき,ATOK からデータベースへのアクセスが可能となる.また,
言葉で関数を入力できる「Excel
関数入力支援」なども搭載,単なる日本語変換を超えた機能を付加.
多様な方言への対応,古文への対応などを計画.
2003 年∼
表 -3 多様性追求期の ATOK
1993 年 11 月
1994 年 4 月
1994 年
1994 年
1998 年 10 月
1999 年 4 月
1999 年 7 月
2000 年 9 月
2000 年 9 月
2001 年 3 月
2001 年 10 月
2002 年 4 月
ATOK8 for Macintosh
ATOK8 for Windows
ATOK8 for Solaris
ATOK8 for hp-ux
Voice ATOK
ATOK Pocket for WindowsCE
ATOK12 SE for Linux
ATOK X for Linux
ATOK Pocket for Palm OS(ATOK for Palm OS)
ATOK Pocket for Mobile Phone(ATOK for Mobile Phone)
ATOK for SONY Airborad
ATOK for PS2
表 -4 ATOK の環境,OS への対応
本語利用
電話
拡
,
電子
捉
可能
機能
.携帯
本語
言葉
変
使
.
新
日本語
方,立
,2001 年 2 月発売
現
,日
,
方
,
生
切
利用
携帯電話用 ATOK
,推測変換
呼
,
新
書
同様
入力
参照
,類似
限定
方式
PC 用
,限
入力
目的
定型的
有効
,PDA
展開
文変換
知
得
多
併用
氏
始
,途
引
刊
出
際
特
適応
.
日本語文書入力需要
増大
発展
文節最長一致法(
書
ATOK
機器
,新
多様
.21 世紀
能 歴史
ATOK
進展
展開
兆
歴史
,多様
中
,
始
利用状況
多様
歴史
文変換,二
発展型)
,携帯電話
相対化
当事者
提供
.浦城恒雄
「情報処理」編集関係者,bit 編集部,月
,過去
論文
記事
掲載
目
通
仮名漢字変換
便
図
.
開発
入力
情報
編集部
機能
,
携帯電話
期待
先
ATOK
情報
処理
阿南康
試
,
樋浦秀樹氏,
,仮名漢字変換技術
,入力効率
.
歴代 ATOK 監修委員会委員諸氏,
宏氏
方法
入力履歴
始
換
変換方式
.
,
方々,紀
米国
.
PDA 用 ATOK
中
田順一郎氏
,利用
,仮名漢字変換辞書
始
ATOK 開発
専
用意
機会,利用目的
謝辞 浮川和宣氏,浮川初子氏
.
ATOK14 以降,
門辞書
.
参考文献
1) 篠原 一 : 電脳日本語論,月刊アスキー,Vol.24, No.7 (2000).
2) 牧野 寛 : カナ漢字変換,ワープロと日本語処理,bit 別冊,共立出版
(1985).
3) 箭内敏夫 : 電脳辞書の国語学,おうふう (1994).
4) 紀田順一郎 : コンピューターと漢字,月刊しにか,Vol.1, No.2 (1990),
p9ff.
5) 紀田順一郎 : 日本語の歴史と現実に根ざして̶初期 ATOK 委員会の思い
出,ATOK 監修委員会 10 周年記念シンポジウム[ケータイ言葉から方
言まで̶デジタル時代の日本語],ジャストシステム(非売品)(2001).
6) 浮川初子,阿望博喜 : 仮名漢字変換の実用化技術と今後の課題,人工
知能学会誌,Vol.11, No.6 (1996).
7) 郡司隆男 : 二円と煮えん,言語,Vol.17, No.1 (1988).
(平成 14 年 9 月 10 日受付)
現
,仮名漢字変換機
日本語入力,日本語
語
IPSJ Magazine Vol.43 No.10 Oct. 2002
−5−
1103
−6−