日本語の入出力と処理

連載
:
足跡
情報処理技術の
の
日本
漢字・日本語処理技術の発展:
日本語の入出力と処理
浦城 恒雄 東京工科大学メディア学部
[email protected]
■ 1970 年代:
1970 年代半
漢字・日本語処理の変遷
入
高速漢字
一部
民間企業
,保険業界
今日,
度
数千種以上
PC
漢字変換技術
輪郭
用
鍵盤
入力
中心
,一般
47 ∼ 63 字
,
度 文字種
国
,
頃
改良
取
機
終
商用機
電信系
,
径
大
主体
続
補助的
表記
漢字仮名混
語表記
本質的
必要
分野
観
立場
広
語機能
発展
.
) 普及
,社内文書
利用
個人文書
.PC
漢字
実現
取
持
ROM
,国際仕様
普及
PC/AT
始
日本
互換性
.
.
■ 1990 年代:
1991 年
分野
英数
換
時代
入
文
,漢字
,日本
取
一般企業
組
変遷
共通仕様
発表
国産主要 PC
参入
吸収
PC
PC/AT 互
NEC
(1997 年
始
個人
次第
処理
DOS/V 路線
,企業
端末
概
的
日本市場
進
先
広
漢字・日本語処理
漢字
DOS/V
PC
転向)
転向
.海外
,PC
低価格化
普及
進
,日本語処理
.
担
主役
本格化(1980 年代以降)
以
.
PC
.
■ 1950 ∼ 1960 年代:
1950 年代
終
送受信装置
利用
外郭団体
業界
PC 機能
含
機能
呼
必要
使
日本語
.利用
,
前
国産 PC
除
,1980 年代
扱
日本語処理
読
.
始
)
端末
作成
文字
処理
行的
(
(以下
穿孔
印刷
一般
文字
利
,
文字
半
,
漢字
込
市場
機能
.高速印刷
採用
英数字
容易
,
光電式
(48 字) 扱
端末
当
入出力
以来 1970 年代
漢字
加
前提
入出力装置
代表的
方式
汎用的
.
1950 年代
始
.
始
88 ∼ 94 字程
.
開発
始
■ 1980 年代:
記号
処理
扱
入出力装置
出
大文字 26 字
応用
住民
.1950 年
商用化
処理
用
1990
実現
米国
我
,
住所,氏名,
漢字
地方自治体
,多種
用
入
代 入
会社名,品名,項目名
高
多種
出力
年代
漢字
登場
新聞社
.1960 年代
半
官庁
一部
日本語情報処理
始
,印刷
漢字自動写植
利用
始
日本語処理
前
振
歴史
入力
日本語文 電信
始
本稿
組
返
,漢字仮名混
出力(主
述
文
日本語
)
取
.
.
IPSJ Magazine Vol.43 No.10 Oct. 2002
−1−
1093
日本の情報処理技術の足跡
文字位置キー
文字群キー
亜阿哀
愛挨晃
悪握芦
圧扱或
1
2
3
4
5
6
7
8
9
10
11
12
右手で文字群キー
を打つと「愛」
左手で文字位置キー
夜(ヨル)
山(ヤマ)
読み
母(ママ)
髪(ヘ a)
意味,外来語
公(ハム)
化(i ヒ)
字の形
皮(ヒフ)
意(i ミ)
熟語
図 -2 連想コードの例
図 -1 多段シフト方式の原理
漢字・日本語の入力
■ドラム ( 漢字表 ) 方式
1965 年
漢字
扱
入出力装置
.通称,漢
1954 年
)
行
始
広
.
新聞業界
後沖電気
漢
参入
用
,
24 列× 8 行配置
望
,右手
文字
練者
位置
,左手
選択
TTS 化
式
12 文字
入力
,全国
字盤上
,文字
入
疲労
.1960 年
発生
方式
使
機構
,
機械的移動
伴
手
30 ∼ 50 字/分
字位置
生
,位置
活字
取
機
読
取
方式
考案
力
,打鍵速度
議
活
関係
表
付加
付
軽
比
,1972 年
,
社
)
多
作
)
,
)
,光電
.後
組合
,2
圧
.
1対1
打鍵
日米
入
会
川上晃(裁判用速記
発明者)
覚
用
.
開発
開催
使
.
30 ∼ 70
遅
用
体系
効率
−2−
,
2 文字
方法
広
43 巻 10 号 情報処理 2002 年 10 月
可能
,入力速度
感圧導電
対応
.
片手操作
入
漢字入力装置
,三菱
選択
.文字
発生
付与
1094
疲
速
機械的
読
腕
発生
文字
代表的
方式(日電漢字
漢字
文字
時代
,沖電気,富士通
■和文タイプ方式
方式
,1970 年代
電磁結合方式(日立,東芝
2 ストローク方式
.
電子
持
方式
一段選択方式
和文
文
軽
静電結合方式(
電
付加
60 列 35 行程度並
素人向
多段
.
機構
開発
製品化
文字
方式
少
字/分
1)
従来
沖電気
状
開発
.
所
角
発生
各社
記事配信
新聞社
数
(図 -1).熟
可能
発
東芝
1 字
的
中
加盟地方通信社
始
方式
扱
文字群
打鍵
70 ∼ 100 字/分
共同通信社
多段
2,304 字
文字群
押
■タブレット(ペンタッチ)方式
原型
3 列× 4 行
,右手
文字
新興
,1958 年
漢
入力方法
,所望
.
.
.1
可能
発注
発表
使
.類似
,左手
移動
式漢字鍵盤送信機
防衛
1955 年朝日新聞社
試作機
左右
持
生
.読売新聞社
.続
共同研究
製品化
針
TTS(Tele-
,日本飛行機製作所
完成
製作所
新聞社
漢字電信印字機(漢字
Typesetting System)
庁 共同研究
巻
回
多段シフト方式
漢字
表
最初
連想的
発
対応
(図 -2).
法
入力
可能
左
日本の情報処理技術の足跡
右 手
交互打鍵
考慮
独自
高
各指
負荷
合理的分配
配列
入力速度
社
利用
.
教則法
非公開
開
入力方式
方式
鍵盤
用
,
,新興製作所,
開発
,大量
.
持
漢字入力
法
推進
,初期
採用
,誰
利用
強
漢字変換
支
単漢字変換
手軽
,一致
法
,最長
,
使
辞書
最長
候補
方式
立語
付属語
問題
見出
語
今日最
栗原
願
.
漢字変換方式
研究
文
最初
文節分
書
入力
文字列
可能
接続条件
提案
総当
沖電気
試作
藤井
外電
作成
実験
問題
同音異義語
,自立語
利用
大学
企業
河田
文
効率
精度
向上
学習的構成法
対象
向
提案
,分野
母体
.1978 年 9 月
漢字変換方式
日本語
必要
自動的
自動化
.
録
文字列
数詞
不可能
変換
.変換
漢字単位
単漢字変換方式
取
漢字
辞書
,同音異字
扱
地名
接
,
分
先処理
辞書
案
用
速
,漢字部
字表記
単語分
付
付
考
程遠
高
重要
処理
特殊文節処理
接頭語,接尾語
作
能力
接辞(数
接
「円」,人
「市」
)付
語
接辞
富
接
必要
「様」
,
登
.
含
連結関係
,1974 年沖電気
加
単語辞書
処理
特殊処理
単語
自立語
.
次
扱
方式
入
法
複合語
方法
書
.制限
課題
処理
標準
,入力者
,特殊
,選択
対応
加
方式
,誤入力率
固有名詞
,
.
入力速度
,
熟語
.複合語
各社
漢字仮名混
完全
修正
皮切
製品化
漢字文字列
変換
以上
2
3)
書
.日本語
,引
意味的
行
入
提案
限
開発
単語
研究
容易
落
同音異義語
利用)
.文節単位
必要
.1976 年東芝
文法
規則性
間
方式
変換処理
難
JW-10(価格 630 万円) 発表
正
書
研究
実験
開発
文字列
分
付属語
入力速度
本格化
日本語
方
限定
高性能化
単語辞書
東芝
判断
対象
挿入
打鍵
研究所
一般文章
人
.
入
,変換
,扱
相沢
.
検討
漢字指定方式
漢字変換
試作
1970 年代後半
[ ]
単語単位
併記
自
変更
入力
文節分
変換
.1973 年 NHK
文節
方法
挿入
.1971 年日本
次
.変換処理
工夫
1967 年
一
中心的課
接続関係
精度向上
悪
対象
絞
2
変換率
字電文
.
関
式
黒崎
長
法
優先順位
書
力段階
次
調
付属語
文
必
.
研究
漢字変換
漢字変換
接続条件(動
一致語
使用状況
利用)
方
選択
意味論的処理(複数
,単語辞書
照合,構文解析,意味解析
要 基礎的手法
原型
比
候補
) 不適当
対
,頻度
,1963 年 特許出
入力文字列
変換
次
必要
.
的処理(自立語
使
九州大
上
.最長一致
語
見
見
致語
,文法的
数万語
同音異義語
カナ漢字変換方式
字分
少
照合方式
活用変化
題
行
平均 2.3 語) 低
精度
方式
較
.
続
同音異義語
辞書
詞
併用
使
高性能化
場合
合
.
行
一部
変換方式
,熟語辞書
入力
熱心
熟語単位
調査
法
熟練者
.
公
.
覚
成功率
前提
組
,九段
教育訓練
適
体系
,自動化
選択
出現頻度(
処理
13.6 字) 高
,入力者
対
,自社以外
.
通常
対
低
2)
鍵盤
1字
,100 ∼ 125 /分
可能
体系
調査
.接辞
強弱
松下
優
提
.
数千
出現頻度(
IPSJ Magazine Vol.43 No.10 Oct. 2002
−3−
1095
日本の情報処理技術の足跡
フラッシュランプ
文字盤
レンズ
ターレット
フィルム
プリズム
図 -3 移動文字盤方式の原理
パターン認識入力
文字認識
アナログフォント方式
音声認識
研究
終
認識技術
進
特定話者
.音声認識
装置
単語登録方式
実用化
,特殊
限定的応用
遠
文字
書
筆順
1,000 ∼ 2,000 字
認識
可能
再入力
印字
文
字
入力
活字
実用
力
文字
1970 年代
比重
占
発生装置
国産最初
,
1967 年日立
圧縮
方式
字母型
大別
130 ∼ 160 字/分
米国 ITEK 社
索業務
主流
43 巻 10 号 情報処理 2002 年 10 月
−4−
技術導入
多字種
持
開発
文字
,
縮小
収容
代
導
光学的
非常
使用
能力
式
使用
低価格
300 字/分
原理的
当時
文字盤
(図 -3).
閃光
表現
配列
.
穴
自動写植機
用紙
開発
電子的
,35mm
代
.
1096
共
写真植字機
,2,304 字種
文字
用
.半導体
,次第
方式
H-8247 型
.文字
漢字
印
文字
漢字
方法
方式
化 伴
漢字出
大
(複数台
) 共用
持
形式
印字
写植
重要
文字
印字位置
SAPTON-N
種類
漢字処理
.
漢字
発生
,文字
発生法
加算機構
12 列同心円上
,回転中
複雑
,
使
.印字速度
点火
,1 文字
4 段 24 列入
■移動文字盤方式プリンタ
漢字・日本語の出力
多
印字位置
差動歯車
選択
方式
漢字
非常
活字
立
1966 年写研
比
回転
活字
対
.
漢字
一定速度
,所定
文字
.
,誤認識
CAD 図面
持
組
約 2,500
沖
.沖製
各々復帰
所定
通常
,比較的簡単
.新興製
手書
新興製作所
,
(活字輪) 使用
進
把握
漢
商品化
放射状
研究機関
容易
場
扱
認識
認識
化
入力
盤上
研究
書
字認識
電気
漢字入出力装置
程
入
的
文字認識方式
最初
認識
環境
直
.文字
100 語程度
印刷文字認識
,1970 年代
■活字方式プリンタ
1970 年代
,日本語入力
.文字認識
文字認識
入力
印刷
方式
高速
,外務省
.
4)
.180 行/分
納入
情報検
日本の情報処理技術の足跡
フィルムなど
フライング
スポットCRT
固定文字盤
光電増倍管
整形増幅器
プリントCRT
図 -4 固定文字盤方式の原理
主流
■固定文字盤(フライングスポット)方式プリンタ
文字盤
文字
可能
発
選択
電子化
速度
上
開
用
文字
(高解像度写真乾板
御
文字
,CRT
光信号
800mm 角
CRT 上
増幅
1字
系
可能
文字
増設
拡大,縮小,回転
高速
展開
比
演算処理
必要
容
不向
蓄積管
機構
持
.
■静電式プリンタ
形
経
1967 年富士通
開発
朝日新聞社
FACOM6501A
1 文字
15 × 18
磁気
方式
,2,688 字
制
,
紙
方式
方
用
,整形回路
記録
記憶
文字
選択
光電増倍管
行
,
X – Y 偏向回路
操作
集合
記憶容量
,文字
易
直線
,
対応
選択
採
文字
,1 文字
文字
使用) 収容
文字
CRT
盤上
式
少
方式
.400 ∼ 1000 種
方式
(JICST) 納入
JEM-3800 漢字
.
,1967 年日本電子産業(JEM)
,日本科学技術情報
方式
固定記憶装置
.
文字種
1列
増
最大 3
可能
並
与
潜像
,粉末
(図 -4) .
作
.2,688 字
5)
,270 本
対応
絶縁処理
扱
表現
記憶
,
状高電圧
納入
施
,15 字/行
細
各
特殊用紙上
現像
,
電荷
,熱定着
方式
93.7 行/分
速度
.
1967 年共同通信社
ディジタルフォント方式
文字
的
方式
方式
年代半
写植機
広
記憶
使
,1990 年代
表現
,文字
格子状
,当初
記憶装置
,何
漢字
横×縦
15 × 18
当用漢字
表現
一部
文字
数
用
.
略式表現
得
許容
最終文書
太
鷹
画数
.24 × 24 以上
多
字
表現
変化
32 × 32
64 × 64 以上
十分
,活字
必要
,2,592 字
固定記憶装置
入
方式
当時普及
始
分
.
24 × 24
記憶
,静電
電子印刷
200bit /秒
,
■ワイヤドットプリンタ
,
複数本
,
出力
問題視
1 文字
製品
伝送
行
,速度
対応
500 字/
高価
最小限
16 × 18
,1969 年東芝
漢
表現
1980
.
方式
曇
化
.輪郭方式
用
方法
試作
駆動
文字
表
.一般
使
近
得
用
入
印刷
用
入
米国 Centronics 社
Model101
.
成功
文字
刺激
場合
速度
急速
印字
18 本
IPSJ Magazine Vol.43 No.10 Oct. 2002
−5−
発
7本
165 字/秒
国産各社
,
採用
分野
.英数字
,5 × 7
方式
機構
式
表現
.1970 年代
電磁
IBM
,1970 年代
,明朝
金属製
,
1960 年代初
用
品質
細
1097
日本の情報処理技術の足跡
用
16 × 18
数枚
複写
漢字
開発
取
.
,比較的低価格
字
漢字・日本語処理
.
12 本
2列
普及
千鳥状
印字
40 字/秒程度
漢
大
貢献
配列
,
24 × 24
1970 年代
終
広
使
.
■インクジェットプリンタ
1976 年 IBM
発表
46/40 型
,
流
粒子
字
描
荷電量
方式
一定電界中
制御
通
流
,77 字/秒
偏向
印刷
騒音
製品
開発
連続
粒子流
噴射
,印字
,東
採用
.引
立,東
必要
方式
,速度
後
続
日
.荷電量制御方式
遅
回収
質
小型
開発
湿式
回収機構
化
文
高速高品質低
注目
機構
,
不要
速度向上
,
図
用
開発
,引
道 開
,多色印刷
主流
続
用
方式
.
組
,1976 年
高品質機(288
低価格機
狙
/
)
半導体
製品化
LBP-10
分野
OA
取
,
乾式
後端末
小型
広
.
おわりに
■レーザ(電子写真式)プリンタ
1975 年 IBM
電子写真技術
印刷
発表
引
世界
金
,
古
光
後
潜像
紙 転写
熱定着
超
高性能
,帯電
体系化
年代以前
/
容易
,1977 年
漢字機構 付加
日立工機
共同
.
刺激
,1977 年
1979 年
日電
日立
7,000 行/分(英数字
15,000 行/分
出荷
西独 Siemens 社
導入
高速漢字
理 分野
漢字
導入
着手
印刷可),
.富士通
漢字化
登場
行
.
,事務処
本格的
一方
1098
開発
場合.漢字
用紙
始
.
扱
低速高品
43 巻 10 号 情報処理 2002 年 10 月
−6−
画
年
普及
.
向
,最
文
入力
紹介
.
出力
年
.
漢字・日本語処理
歩
年
出
.漢字・日本語処理
漢字
1978 年
「JW-10」 発表
発表
1 万行
拡大
漢字
返
,JIS「情報交換用漢字符号系」 制定,東芝
代以降本格的
,英数字
,文字
振
主要
吸着
240
歴史
日本語
.
利用
横方向
年
感光
.発表当時
印刷
期的
,強度
走査
方式
連続普通紙
持
複写機
用
作
同様
印字密度
漢字・日本語処理
実用化
回転鏡
上 文字
/分
3800
.電子写真
Xerox
変調
用
機
,今日
1980 年
至
大
揺籃期
問題
課題
1980
漢字仮名混
先人
取
組
参考文献
1)安田寿明 : 我が国の新聞社における漢字情報処理,情報処理,Vol.10,
No.5, pp.340-347 (Sep. 1969).
2)川 上 晃 他 : タ ッ チ 法 に よ る 漢 字 入 力, 情 報 処 理,Vol.15, No.11,
pp.863-867 (Nov. 1974).
3)森 健 一 他 : か な 漢 字 変 換, 情 報 処 理,Vol.20, No.10, pp.911-916 (Oct.
1979).
4)長井 担 : 漢字入出力装置の動向と技術的問題点,情報処理,Vol.10,
No.5, pp.320-332 (Sep. 1969).
5)長谷川実郎 : 高速漢字プリンタ,情報処理,Vol.10, No.5, pp.279-284 (Sep.
1969).
(平成 14 年 9 月 9 日受付)