連載 : 足跡 情報処理技術の の 日本 漢字・日本語処理技術の発展: 日本語の入出力と処理 浦城 恒雄 東京工科大学メディア学部 [email protected] ■ 1970 年代: 1970 年代半 漢字・日本語処理の変遷 入 高速漢字 一部 民間企業 ,保険業界 今日, 度 数千種以上 PC 漢字変換技術 輪郭 用 鍵盤 入力 中心 ,一般 47 ∼ 63 字 , 度 文字種 国 , 頃 改良 取 機 終 商用機 電信系 , 径 大 主体 続 補助的 表記 漢字仮名混 語表記 本質的 必要 分野 観 立場 広 語機能 発展 . ) 普及 ,社内文書 利用 個人文書 .PC 漢字 実現 取 持 ROM ,国際仕様 普及 PC/AT 始 日本 互換性 . . ■ 1990 年代: 1991 年 分野 英数 換 時代 入 文 ,漢字 ,日本 取 一般企業 組 変遷 共通仕様 発表 国産主要 PC 参入 吸収 PC PC/AT 互 NEC (1997 年 始 個人 次第 処理 DOS/V 路線 ,企業 端末 概 的 日本市場 進 先 広 漢字・日本語処理 漢字 DOS/V PC 転向) 転向 .海外 ,PC 低価格化 普及 進 ,日本語処理 . 担 主役 本格化(1980 年代以降) 以 . PC . ■ 1950 ∼ 1960 年代: 1950 年代 終 送受信装置 利用 外郭団体 業界 PC 機能 含 機能 呼 必要 使 日本語 .利用 , 前 国産 PC 除 ,1980 年代 扱 日本語処理 読 . 始 ) 端末 作成 文字 処理 行的 ( (以下 穿孔 印刷 一般 文字 利 , 文字 半 , 漢字 込 市場 機能 .高速印刷 採用 英数字 容易 , 光電式 (48 字) 扱 端末 当 入出力 以来 1970 年代 漢字 加 前提 入出力装置 代表的 方式 汎用的 . 1950 年代 始 . 始 88 ∼ 94 字程 . 開発 始 ■ 1980 年代: 記号 処理 扱 入出力装置 出 大文字 26 字 応用 住民 .1950 年 商用化 処理 用 1990 実現 米国 我 , 住所,氏名, 漢字 地方自治体 ,多種 用 入 代 入 会社名,品名,項目名 高 多種 出力 年代 漢字 登場 新聞社 .1960 年代 半 官庁 一部 日本語情報処理 始 ,印刷 漢字自動写植 利用 始 日本語処理 前 振 歴史 入力 日本語文 電信 始 本稿 組 返 ,漢字仮名混 出力(主 述 文 日本語 ) 取 . . IPSJ Magazine Vol.43 No.10 Oct. 2002 −1− 1093 日本の情報処理技術の足跡 文字位置キー 文字群キー 亜阿哀 愛挨晃 悪握芦 圧扱或 1 2 3 4 5 6 7 8 9 10 11 12 右手で文字群キー を打つと「愛」 左手で文字位置キー 夜(ヨル) 山(ヤマ) 読み 母(ママ) 髪(ヘ a) 意味,外来語 公(ハム) 化(i ヒ) 字の形 皮(ヒフ) 意(i ミ) 熟語 図 -2 連想コードの例 図 -1 多段シフト方式の原理 漢字・日本語の入力 ■ドラム ( 漢字表 ) 方式 1965 年 漢字 扱 入出力装置 .通称,漢 1954 年 ) 行 始 広 . 新聞業界 後沖電気 漢 参入 用 , 24 列× 8 行配置 望 ,右手 文字 練者 位置 ,左手 選択 TTS 化 式 12 文字 入力 ,全国 字盤上 ,文字 入 疲労 .1960 年 発生 方式 使 機構 , 機械的移動 伴 手 30 ∼ 50 字/分 字位置 生 ,位置 活字 取 機 読 取 方式 考案 力 ,打鍵速度 議 活 関係 表 付加 付 軽 比 ,1972 年 , 社 ) 多 作 ) , ) ,光電 .後 組合 ,2 圧 . 1対1 打鍵 日米 入 会 川上晃(裁判用速記 発明者) 覚 用 . 開発 開催 使 . 30 ∼ 70 遅 用 体系 効率 −2− , 2 文字 方法 広 43 巻 10 号 情報処理 2002 年 10 月 可能 ,入力速度 感圧導電 対応 . 片手操作 入 漢字入力装置 ,三菱 選択 .文字 発生 付与 1094 疲 速 機械的 読 腕 発生 文字 代表的 方式(日電漢字 漢字 文字 時代 ,沖電気,富士通 ■和文タイプ方式 方式 ,1970 年代 電磁結合方式(日立,東芝 2 ストローク方式 . 電子 持 方式 一段選択方式 和文 文 軽 静電結合方式( 電 付加 60 列 35 行程度並 素人向 多段 . 機構 開発 製品化 文字 方式 少 字/分 1) 従来 沖電気 状 開発 . 所 角 発生 各社 記事配信 新聞社 数 (図 -1).熟 可能 発 東芝 1 字 的 中 加盟地方通信社 始 方式 扱 文字群 打鍵 70 ∼ 100 字/分 共同通信社 多段 2,304 字 文字群 押 ■タブレット(ペンタッチ)方式 原型 3 列× 4 行 ,右手 文字 新興 ,1958 年 漢 入力方法 ,所望 . . .1 可能 発注 発表 使 .類似 ,左手 移動 式漢字鍵盤送信機 防衛 1955 年朝日新聞社 試作機 左右 持 生 .読売新聞社 .続 共同研究 製品化 針 TTS(Tele- ,日本飛行機製作所 完成 製作所 新聞社 漢字電信印字機(漢字 Typesetting System) 庁 共同研究 巻 回 多段シフト方式 漢字 表 最初 連想的 発 対応 (図 -2). 法 入力 可能 左 日本の情報処理技術の足跡 右 手 交互打鍵 考慮 独自 高 各指 負荷 合理的分配 配列 入力速度 社 利用 . 教則法 非公開 開 入力方式 方式 鍵盤 用 , ,新興製作所, 開発 ,大量 . 持 漢字入力 法 推進 ,初期 採用 ,誰 利用 強 漢字変換 支 単漢字変換 手軽 ,一致 法 ,最長 , 使 辞書 最長 候補 方式 立語 付属語 問題 見出 語 今日最 栗原 願 . 漢字変換方式 研究 文 最初 文節分 書 入力 文字列 可能 接続条件 提案 総当 沖電気 試作 藤井 外電 作成 実験 問題 同音異義語 ,自立語 利用 大学 企業 河田 文 効率 精度 向上 学習的構成法 対象 向 提案 ,分野 母体 .1978 年 9 月 漢字変換方式 日本語 必要 自動的 自動化 . 録 文字列 数詞 不可能 変換 .変換 漢字単位 単漢字変換方式 取 漢字 辞書 ,同音異字 扱 地名 接 , 分 先処理 辞書 案 用 速 ,漢字部 字表記 単語分 付 付 考 程遠 高 重要 処理 特殊文節処理 接頭語,接尾語 作 能力 接辞(数 接 「円」,人 「市」 )付 語 接辞 富 接 必要 「様」 , 登 . 含 連結関係 ,1974 年沖電気 加 単語辞書 処理 特殊処理 単語 自立語 . 次 扱 方式 入 法 複合語 方法 書 .制限 課題 処理 標準 ,入力者 ,特殊 ,選択 対応 加 方式 ,誤入力率 固有名詞 , . 入力速度 , 熟語 .複合語 各社 漢字仮名混 完全 修正 皮切 製品化 漢字文字列 変換 以上 2 3) 書 .日本語 ,引 意味的 行 入 提案 限 開発 単語 研究 容易 落 同音異義語 利用) .文節単位 必要 .1976 年東芝 文法 規則性 間 方式 変換処理 難 JW-10(価格 630 万円) 発表 正 書 研究 実験 開発 文字列 分 付属語 入力速度 本格化 日本語 方 限定 高性能化 単語辞書 東芝 判断 対象 挿入 打鍵 研究所 一般文章 人 . 入 ,変換 ,扱 相沢 . 検討 漢字指定方式 漢字変換 試作 1970 年代後半 [ ] 単語単位 併記 自 変更 入力 文節分 変換 .1973 年 NHK 文節 方法 挿入 .1971 年日本 次 .変換処理 工夫 1967 年 一 中心的課 接続関係 精度向上 悪 対象 絞 2 変換率 字電文 . 関 式 黒崎 長 法 優先順位 書 力段階 次 調 付属語 文 必 . 研究 漢字変換 漢字変換 接続条件(動 一致語 使用状況 利用) 方 選択 意味論的処理(複数 ,単語辞書 照合,構文解析,意味解析 要 基礎的手法 原型 比 候補 ) 不適当 対 ,頻度 ,1963 年 特許出 入力文字列 変換 次 必要 . 的処理(自立語 使 九州大 上 .最長一致 語 見 見 致語 ,文法的 数万語 同音異義語 カナ漢字変換方式 字分 少 照合方式 活用変化 題 行 平均 2.3 語) 低 精度 方式 較 . 続 同音異義語 辞書 詞 併用 使 高性能化 場合 合 . 行 一部 変換方式 ,熟語辞書 入力 熱心 熟語単位 調査 法 熟練者 . 公 . 覚 成功率 前提 組 ,九段 教育訓練 適 体系 ,自動化 選択 出現頻度( 処理 13.6 字) 高 ,入力者 対 ,自社以外 . 通常 対 低 2) 鍵盤 1字 ,100 ∼ 125 /分 可能 体系 調査 .接辞 強弱 松下 優 提 . 数千 出現頻度( IPSJ Magazine Vol.43 No.10 Oct. 2002 −3− 1095 日本の情報処理技術の足跡 フラッシュランプ 文字盤 レンズ ターレット フィルム プリズム 図 -3 移動文字盤方式の原理 パターン認識入力 文字認識 アナログフォント方式 音声認識 研究 終 認識技術 進 特定話者 .音声認識 装置 単語登録方式 実用化 ,特殊 限定的応用 遠 文字 書 筆順 1,000 ∼ 2,000 字 認識 可能 再入力 印字 文 字 入力 活字 実用 力 文字 1970 年代 比重 占 発生装置 国産最初 , 1967 年日立 圧縮 方式 字母型 大別 130 ∼ 160 字/分 米国 ITEK 社 索業務 主流 43 巻 10 号 情報処理 2002 年 10 月 −4− 技術導入 多字種 持 開発 文字 , 縮小 収容 代 導 光学的 非常 使用 能力 式 使用 低価格 300 字/分 原理的 当時 文字盤 (図 -3). 閃光 表現 配列 . 穴 自動写植機 用紙 開発 電子的 ,35mm 代 . 1096 共 写真植字機 ,2,304 字種 文字 用 .半導体 ,次第 方式 H-8247 型 .文字 漢字 印 文字 漢字 方法 方式 化 伴 漢字出 大 (複数台 ) 共用 持 形式 印字 写植 重要 文字 印字位置 SAPTON-N 種類 漢字処理 . 漢字 発生 ,文字 発生法 加算機構 12 列同心円上 ,回転中 複雑 , 使 .印字速度 点火 ,1 文字 4 段 24 列入 ■移動文字盤方式プリンタ 漢字・日本語の出力 多 印字位置 差動歯車 選択 方式 漢字 非常 活字 立 1966 年写研 比 回転 活字 対 . 漢字 一定速度 ,所定 文字 . ,誤認識 CAD 図面 持 組 約 2,500 沖 .沖製 各々復帰 所定 通常 ,比較的簡単 .新興製 手書 新興製作所 , (活字輪) 使用 進 把握 漢 商品化 放射状 研究機関 容易 場 扱 認識 認識 化 入力 盤上 研究 書 字認識 電気 漢字入出力装置 程 入 的 文字認識方式 最初 認識 環境 直 .文字 100 語程度 印刷文字認識 ,1970 年代 ■活字方式プリンタ 1970 年代 ,日本語入力 .文字認識 文字認識 入力 印刷 方式 高速 ,外務省 . 4) .180 行/分 納入 情報検 日本の情報処理技術の足跡 フィルムなど フライング スポットCRT 固定文字盤 光電増倍管 整形増幅器 プリントCRT 図 -4 固定文字盤方式の原理 主流 ■固定文字盤(フライングスポット)方式プリンタ 文字盤 文字 可能 発 選択 電子化 速度 上 開 用 文字 (高解像度写真乾板 御 文字 ,CRT 光信号 800mm 角 CRT 上 増幅 1字 系 可能 文字 増設 拡大,縮小,回転 高速 展開 比 演算処理 必要 容 不向 蓄積管 機構 持 . ■静電式プリンタ 形 経 1967 年富士通 開発 朝日新聞社 FACOM6501A 1 文字 15 × 18 磁気 方式 ,2,688 字 制 , 紙 方式 方 用 ,整形回路 記録 記憶 文字 選択 光電増倍管 行 , X – Y 偏向回路 操作 集合 記憶容量 ,文字 易 直線 , 対応 選択 採 文字 ,1 文字 文字 使用) 収容 文字 CRT 盤上 式 少 方式 .400 ∼ 1000 種 方式 (JICST) 納入 JEM-3800 漢字 . ,1967 年日本電子産業(JEM) ,日本科学技術情報 方式 固定記憶装置 . 文字種 1列 増 最大 3 可能 並 与 潜像 ,粉末 (図 -4) . 作 .2,688 字 5) ,270 本 対応 絶縁処理 扱 表現 記憶 , 状高電圧 納入 施 ,15 字/行 細 各 特殊用紙上 現像 , 電荷 ,熱定着 方式 93.7 行/分 速度 . 1967 年共同通信社 ディジタルフォント方式 文字 的 方式 方式 年代半 写植機 広 記憶 使 ,1990 年代 表現 ,文字 格子状 ,当初 記憶装置 ,何 漢字 横×縦 15 × 18 当用漢字 表現 一部 文字 数 用 . 略式表現 得 許容 最終文書 太 鷹 画数 .24 × 24 以上 多 字 表現 変化 32 × 32 64 × 64 以上 十分 ,活字 必要 ,2,592 字 固定記憶装置 入 方式 当時普及 始 分 . 24 × 24 記憶 ,静電 電子印刷 200bit /秒 , ■ワイヤドットプリンタ , 複数本 , 出力 問題視 1 文字 製品 伝送 行 ,速度 対応 500 字/ 高価 最小限 16 × 18 ,1969 年東芝 漢 表現 1980 . 方式 曇 化 .輪郭方式 用 方法 試作 駆動 文字 表 .一般 使 近 得 用 入 印刷 用 入 米国 Centronics 社 Model101 . 成功 文字 刺激 場合 速度 急速 印字 18 本 IPSJ Magazine Vol.43 No.10 Oct. 2002 −5− 発 7本 165 字/秒 国産各社 , 採用 分野 .英数字 ,5 × 7 方式 機構 式 表現 .1970 年代 電磁 IBM ,1970 年代 ,明朝 金属製 , 1960 年代初 用 品質 細 1097 日本の情報処理技術の足跡 用 16 × 18 数枚 複写 漢字 開発 取 . ,比較的低価格 字 漢字・日本語処理 . 12 本 2列 普及 千鳥状 印字 40 字/秒程度 漢 大 貢献 配列 , 24 × 24 1970 年代 終 広 使 . ■インクジェットプリンタ 1976 年 IBM 発表 46/40 型 , 流 粒子 字 描 荷電量 方式 一定電界中 制御 通 流 ,77 字/秒 偏向 印刷 騒音 製品 開発 連続 粒子流 噴射 ,印字 ,東 採用 .引 立,東 必要 方式 ,速度 後 続 日 .荷電量制御方式 遅 回収 質 小型 開発 湿式 回収機構 化 文 高速高品質低 注目 機構 , 不要 速度向上 , 図 用 開発 ,引 道 開 ,多色印刷 主流 続 用 方式 . 組 ,1976 年 高品質機(288 低価格機 狙 / ) 半導体 製品化 LBP-10 分野 OA 取 , 乾式 後端末 小型 広 . おわりに ■レーザ(電子写真式)プリンタ 1975 年 IBM 電子写真技術 印刷 発表 引 世界 金 , 古 光 後 潜像 紙 転写 熱定着 超 高性能 ,帯電 体系化 年代以前 / 容易 ,1977 年 漢字機構 付加 日立工機 共同 . 刺激 ,1977 年 1979 年 日電 日立 7,000 行/分(英数字 15,000 行/分 出荷 西独 Siemens 社 導入 高速漢字 理 分野 漢字 導入 着手 印刷可), .富士通 漢字化 登場 行 . ,事務処 本格的 一方 1098 開発 場合.漢字 用紙 始 . 扱 低速高品 43 巻 10 号 情報処理 2002 年 10 月 −6− 画 年 普及 . 向 ,最 文 入力 紹介 . 出力 年 . 漢字・日本語処理 歩 年 出 .漢字・日本語処理 漢字 1978 年 「JW-10」 発表 発表 1 万行 拡大 漢字 返 ,JIS「情報交換用漢字符号系」 制定,東芝 代以降本格的 ,英数字 ,文字 振 主要 吸着 240 歴史 日本語 . 利用 横方向 年 感光 .発表当時 印刷 期的 ,強度 走査 方式 連続普通紙 持 複写機 用 作 同様 印字密度 漢字・日本語処理 実用化 回転鏡 上 文字 /分 3800 .電子写真 Xerox 変調 用 機 ,今日 1980 年 至 大 揺籃期 問題 課題 1980 漢字仮名混 先人 取 組 参考文献 1)安田寿明 : 我が国の新聞社における漢字情報処理,情報処理,Vol.10, No.5, pp.340-347 (Sep. 1969). 2)川 上 晃 他 : タ ッ チ 法 に よ る 漢 字 入 力, 情 報 処 理,Vol.15, No.11, pp.863-867 (Nov. 1974). 3)森 健 一 他 : か な 漢 字 変 換, 情 報 処 理,Vol.20, No.10, pp.911-916 (Oct. 1979). 4)長井 担 : 漢字入出力装置の動向と技術的問題点,情報処理,Vol.10, No.5, pp.320-332 (Sep. 1969). 5)長谷川実郎 : 高速漢字プリンタ,情報処理,Vol.10, No.5, pp.279-284 (Sep. 1969). (平成 14 年 9 月 9 日受付)
© Copyright 2026 Paperzz