TeraStream概要書 - YDC Digital Corporation

TeraStream概要書
Data Transformation & Integration beyond limit!
株式会社ワイディーシーディジタル
COPYRIGHT © YDC Digital Corp. ALL RIGHTS RESERVED.
TeraStreamとは?
大量データのバッチ処理の作業時間を大幅に短縮するETLツールである。
TeraStream
大量データ
Designer (GUI)
Source
Data Base
Fact
高速抽出処理
Sort
Target
Data Base
高速ソート処理
Convert
•
•
•
•
•
Oracle
Sybase
DB2
Imformiy
Tera Data
高速変換処理
Jopa/Merge
高速結合処理
•
•
•
•
•
Oracle
Sybase
DB2
Imformiy
Tera Data
※ ETL : Extract Transform and Load
---< 2 >--COPYRIGHT © YDC Digital Corp. ALL RIGHTS RESERVED.
ETL ツールの種類
種類
パフォーマンス
日本語処理
カスタマイズ
価格
Informatica
普通
可能
不可
高価
DataStage
普通
可能
不可
高価
TeraStream
迅速
可能
可能
安価
※ カスタマイズは顧客要求に合わせて対応する。
※ 特にTeraStreamはオンライン状態でもデータ抽出が可能。
(他製品はオフラインでのみ可能)
---< 3 >--COPYRIGHT © YDC Digital Corp. ALL RIGHTS RESERVED.
主要納品実績
(金融機関)
企業名
金融決済院
プロジェクト概要
収納帳票、VAN事業、払込通知書 情報化システム構築
外換銀行
次世代バンキングシステム (基幹系、外換、与信)
新韓銀行
次世代システム
国民銀行
O-CRM ダウンサイジング
ハナ銀行
カードシステム移転設置、請求作業
農協中央会
SK生命
データウェアハウス ETT、 控除、 ALMシステム改善作業
アカウント情報処理 システム DB 前の処理
プリデンシャル
投資証券
元帳移管や情報系 ETT
韓国信用情報
NICE 次世代 CBシステム
国民カード
EDW、 ETT 転換
現代カード
データウェアハウス、ETT
興国生命
次世代システム
教保自動車保険
パフォーマンス改善、データウェアハウス
---< 4 >--COPYRIGHT © YDC Digital Corp. ALL RIGHTS RESERVED.
主要納品実績
企業名
(公共)
情報通信部
パフォーマンス改善事業
財政経済部
財政情報化、統合システム構築
国税庁
データウェアハウス構築
統計庁
ホストデータ移転設置や統計作業
健康保健管理公団
健康保健審査評価院
(その他)
プロジェクト概要
データウェアハウス、 健康保健配置業務
医療保健診察費請求審査情報システム構築
勤労福祉公団
データウェアハウス
企画予算処
デジタル予算会計
国防部
国防財政システム
大韓剤保険
保険業務配置作業改善
LGテレコム
CSBS 用配置作業、 CRM
KTF
ビーリングシステム
ハナロ通信
ビーリングシステム
外語大学
配置処理作業
ウンジンコーウェイ
データウェアハウス
クムガン企画
媒体戦略システム
LG AD
広告視聴率関連統計情報抽出処理
LG流通
データウェアハウス
LG電子
関税払い戻し処理
---< 5 >---
COPYRIGHT © YDC Digital Corp. ALL RIGHTS RESERVED.
TeraStreamTM パフォーマンス比較
ソートパフォーマンス BMT (Fixed-key ASCII Sorting)
Input Source Size:
Sorted by:
Target :
26、848、200 bytes
6-byte key
154、300 records
268、482、000 bytes
6-byte key
154、300 records
2、684、820、870 bytes
6-byte key
154、300 records
Informatica 'nSort1
8s
1m 48s
20m 35s
TeraStream (CoSORT AEP)
3s
16s
2m 1s
TeraStream (CoSORT SortCL)
1s
7s
1m 19s
ソートパフォーマンス BMT (Variable-key、 ASCII Sorting with Unique and Stable)
Sorted by:
Target: :
6-byte key
424 records
14-byte key
2、233、343 records
23-byte key、 2.6GB
15、237、170 records
Informatica 'nSort' w/Aggregator
2m 10s
14m 37s
1h 43m 46s
TeraStream (CoSORT AEP)
1m 3s
1m 32s
3m 24s
27s
38s
2m 15s
TeraStream (CoSORT SortCL)
DataStageとのパフォーマンス比較 (SORT、 JOIN、 SUM、 Type Conversion and Business Logic)
Task
TeraStream
Datastage
Records
Volume
A data (Company Profile)
3h
21h 10m
84、209、420
18GB
B data (Income Tax Report)
1h
8h 20m
16、134、908
10GB
C data (VAT Report)
7h
15h 20m
17、155、262
10GB
D data (Income/Area)
45m
10h 40m
10、278、870
6GB
---< 6 >--COPYRIGHT © YDC Digital Corp. ALL RIGHTS RESERVED.
TeraStreamTM パフォーマンス 比較
- DBMSとバッチ作業比較結果
Processing Time
区分
DBM
S
7分
30秒
File Processing
25万件
既存プログラム
(SQL)
変更プログラム
(TeraStreamTM)
Data Volume
件数
2004.3.15
Run Time
4、072
3分22秒
496、784
26分57秒
993、568
1時間22分41秒
2、500、000
3時間17分31秒
4、072
7分23秒
496、784
7分24秒
993、568
11分30秒
2、500、000
16分14秒
 限界を超えた負荷を処理する場合、DBMSの負荷は急激に増加する。
ファイル処理によるバルク処理の場合、対応処理範囲が増え、データ処理の増加に対応可能となる。
システム容量や処理時間がライン型(Linear)で増加する。
---< 7 >--COPYRIGHT © YDC Digital Corp. ALL RIGHTS RESERVED.
TeraStreamTM使用の際の期待効果
区分
システム
顧客
期待効果
負荷分散
費用削減
顧客満足度アップ
生産性の向上
業務担当チーム
費用削減
投資対効果(ROI)分析
-大量処理負荷データベースと業務分離が自然と行なわれ、
システム負荷を軽減し、システム投資費用削減が可能。
-現在使用中のシステムを基準に、データ量が20%多くなった場合でも、
システム全体増設は不要、20%増加したデータの保存ディスク追加の
みで対応可能。
-バッチ作業の周期を削減し、顧客満足度をアップすることができる。
-オンライン作業やバッチ作業の分離により、安定したオンライン環境を
保障し、バッチ作業をスピーディーに行なうことが出来る。
-既存の業務プロセスの50%程度の投資費用で100%以上の効果が
期待できる。
-システム資源の効率的な利用によりシステム投資費用削減、既存のプ
ロセスの課題である維持保守問題を解決し、費用削減が可能。
---< 8 >--COPYRIGHT © YDC Digital Corp. ALL RIGHTS RESERVED.
TeraStreamTMの適用範囲
 TeraStreamは、フラットファイル処理により作業時間を短縮、システムの効率を増加させる
ツールで基幹系、情報系の各種配置作業のみならず、データウェアハウス/CRM、債権管理、
資産負債管理(ALM)、クレジットカード決済作業などに活用出来である。
適用分野
適用内容
• データ移行
基幹系
• 精算や決算業務
• データ保存
• データ抽出
• テーブル生成配置作業
情報系
-債権管理 / 資産負債管理(ALM) / リスク管理(RM) / 総合収益管理
• DW/DM/CRM ETL
クレジットカードシステム
常時監視システム
その他
• 請求業務
• 決済業務
• 大容量情報系データとの連携
• システム間のリアルタイム、または周期的なデータ移行による統合
---< 9 >--COPYRIGHT © YDC Digital Corp. ALL RIGHTS RESERVED.
TeraStreamTMの適用範囲: 基幹系
 TeraStreamはシステム構築の為の移行業務、決算業務、データ 抽出、データ保存に活用出来る。
業務内容
作業の流れ
IBM
1. データ転送
Unix
Unix
2. コード変換
• EBCDIC
• Pack
• Bit
TeraStream
• ASCII
• Unpack
• Byte
Reformat
TeraStream
3. マッピングによる変換作業
ASCIIで変換されたファイル
• Sort / Merge
• Join
• Convert
最終目的ファイル
4. 検証や保存作業
TeraStream/FASを
利用した検証
SQLを利用した検証
---< 10 >--COPYRIGHT © YDC Digital Corp. ALL RIGHTS RESERVED.
TeraStreamTMの適用範囲: 情報系
 DW/CRMの為のETL、 DM用テーブル生成、 債権管理、 ALM(資産負債管理)、 RM(リスク管理)などは
基幹系や情報系、外部機関などから大容量データを抽出、加工し、目的データベースに積載する業務が
多く発生するが、TeraStreamはこのような業務をスピーディに処理できる。
受信
与信
外換
DW/DM/CRM、 債権、 監査、 ALM
カード
自動振込み
大容量 資料 加工 作業
(TeraStream)
人事
会計
給与
顧客
実績
---< 11 >--COPYRIGHT © YDC Digital Corp. ALL RIGHTS RESERVED.
TeraStreamTMの適用範囲:クレジットカードシステム
 TeraStreamはクレジットカードシステムから決済業務の請求内容、請求明細、商品別集計、顧客別集計
作成と対照業務などに利用できる。
対照業務
精算業務
業務内容
作業の流れ
カードDB
1. TeraStreamのFACT
機能を利用した該当
資料を迅速に作成
する。
当月一括払い対照内容や集計
TeraStream/FACT
売上(24ヶ月)
当月分割対照内容や集計
TeraStream
顧客
2. TeraStreamを利用し
取消や先払いを反
映した商品別/顧客
別集計と売上件別
売上額、該当月の
決済明細内容など
を作成する。
取引内容 取消、 先払い
TeraStream
商品別集計
顧客別集計
当月キャッシュ対照内容や集計
• SORT / JOIN
• MERGE
• SUMMARY
請求(24ヶ月)
• SORT /JOIN
• MERGE
• SUMMARY
当月請求対照内容や集計
当月決済明細
---< 12 >--COPYRIGHT © YDC Digital Corp. ALL RIGHTS RESERVED.
TeraStreamTMの適用範囲: 与信監査システム
 アカウント系データベース、情報系データベースで発生されるデータを与信監査データベースに
適用する作業で、FASはデータがリアルタイムアップデートしないところを利用できる。
アカウント系ファイル
抽出
10MB
10MB
10MB
10MB
Select
Insert/
Update
アカウント系
FAS
データベース
Select
FTP 転送
1GB
1GB
1GB
与信監査
データベース
情報系ファイル(お客様情報、 流動性、調合与信)
情報系
データベース
業務
DBMSを活用した業務
TeraStreamのFASを活用した業務
会員組合
還元業務
00:32:11.70
00:00:55.54
---< 13 >--COPYRIGHT © YDC Digital Corp. ALL RIGHTS RESERVED.
TeraStreamTMの応用範囲

データのリアルタイム、バッチ処理

ビーリング(Billing)、統計作業

ウェブログ整理

24*365オンライン(E-Business)環境からオンラインに与える影響を最小化しビーリング/
締切りなどを高速処理

システム統合

迅速且つ効率的なデータベース運用 ( Load/Reorg/Restructure )

大量バックアップデータの整理や照会
---< 14 >--COPYRIGHT © YDC Digital Corp. ALL RIGHTS RESERVED.
TeraStreamTM 応用 (続き)
 データレベルのリアルタイム処理、一括処理
様々なシステムで発生するデータをリアルタイム、又は一括処理することが出来る。
スケジューラー (TS_Admin)
ローカルシステム1
ビジネスロジック適用
Bulk
ローカル資料
Deferred
抽
出
적
재
ローカルシステム2
加工
統合システム
Sort / Join / Merge
ローカル資料
---< 15 >--COPYRIGHT © YDC Digital Corp. ALL RIGHTS RESERVED.
TeraStreamTM 応用 (続き)
 ビーリング、統計業務
KTF
構築例
統計庁人口総調査統計情報構築例
総合データ
基本データ
抽出
Mainframe
抽出データ
プロセス
データ移行
件数
Unix Server
マスターファイル
TS System
Meta
Batch
Precess
Process
SAM
データエラー値
データ 検証結果値
データ 品質 Rule Set
Sort / Merge Join
Distribute
TeraStream
JukeBox
Backup
Data
各サマリーファイル
市、道別
サマリーファイル
データ標準化
データ結果値
総合データ集計関連データ データ標準用語
データコード
データ品質管理
人口移動
総合集計関連データ
サマリーファイル
市、群、区別
サマリーファイル
経済活動
サマリーファイル
洞別
サマリーファイル
通勤通学
サマリーファイル
調査区別
サマリーファイル
賃借料金
サマリーファイル
WEB
TS Systemの搭載機能利用
SAM (結果
物)
GP7000
Search Engine
照会
Single View画面提供
KOSIS DB
ユーザ Query
国民に対するサービス
統計庁内エンドユーザ
---< 16 >--COPYRIGHT © YDC Digital Corp. ALL RIGHTS RESERVED.
TeraStreamTM 応用 (続き)
 システム統合
 ウェブログ整理
ウェブ環境ではオンラインのパフォーマンスと共にマーケティ e-Business拡大、企業内システムの統合が新しい課題とし
ング戦略の為のデータ分析は重要である。
て浮上する。(業務のシステム化)
ウェブ環境は毎日膨大なデータを発生する。同データ処理に
データ連携がないシステムを統合する為、迅速且つ確実な
TeraStreamを利用し整列、抽出、集計することにより、情報整
データ加工方法が必要となる。
理、集計等が迅速になる。
スケジューラ
Web
Log
Reference
HTS
運用システム1
Query
Web
Server
Web Analysis Server
TeraSTream
DB Server
TeraStream
運用システム3
Business Logic
適用
原始資料
運用システム2
Internet
原始資料
抽
出
加工
保
存
整列/join/merge
目的資料
運用システム4
目的資料
---< 17 >--COPYRIGHT © YDC Digital Corp. ALL RIGHTS RESERVED.
TeraStreamTM 応用 (続き)
 24時間*365日業務
24hr.
On-Line 構築例
24hr.
On-Line & Batch 作業構築例
Legacy DBに負荷がかかる統計性(join、整列同時作業
可能)照会は TeraStreamを利用する。
TeraStreamは開発環境であるPro*CとTuxedoの互換
に優れ、自由にデータ交換することが可能である。
今日のインターネット環境では「24時間ショッピング」が一般化されて
いるが、同サービスの機能を完全に提供できるソリューションはない。
TeraStreamを利用し、一つのシステムをオンライン(DBMS)から分離
し運用することにより、二つのシステムを構築することなく、データ整
合性を管理することなく、24時間オンラインサービス中に精算、請求
資料作成などの作業が可能である。
Clients
Pro C Program
Legacy
Web Server
24時間
オンライン
サービス
On-Line Server
Insert/Update
Load/update
DBMS
Oracle
Tuxedo
結
果
TeraStream
Separate I/O
Channel
Select
Query
Window
SAM
Query
Button
Load
TeraStream
Report to display
---< 18 >--COPYRIGHT © YDC Digital Corp. ALL RIGHTS RESERVED.
TeraStreamTM 応用(続き)
 RTI & ETL 構築戦略
スケジューラーにより全てのデータ処理過程のモニタリングやコントロール管理
構成図
外部連携システム
RTI & ETL システム(連携システム)
転送
DB
DB
DB
Data
Data
Data
UnLoad
リアルタイム
ログ 抽出
(RTI-Agent)
配置転送
Cache領域
(SHM)
TeraStream_RTI
Server Engine
並列処理
Agent
Engine
データ Routing Field
の定義
ターゲットシステム
転送
Load Utility
DB
サーバ
TeraStream_RTI
Server Engine
Log
DBMS
SAM
ETT
Server
分散ファイル
処理要請/応答
WAS
Server
SAM
構築方向
•
•
•
•
•
コードや文字の自動コンバージョン機能提供、開発生産性向上の為のGUIやScript方式提供によるプログラム開発機関の最適化を維持
スケジューラによる全過程の開始、終了管理を実行
RTI_ServerからRTI Serverや RTI Agentとの通信の為のAdaptorを開始、終了管理を実行
RTI ServerでMessage送受信プロセス管理
RTI Agentでは変更分データのリアルタイム抽出や転送が可能、RTI Serverではデータのコンバート、マッピングなどのビジネスロジックを実行することで、
構築するシステムへ転送
---< 19 >--COPYRIGHT © YDC Digital Corp. ALL RIGHTS RESERVED.
韓国国内における導入企業
企業
農協
適用 業務
•データウェアハウス
•ALM
•カード
•控除システム
金融決済院

•基幹系システム

•払込通知書、金融
EDI、 VAN
•収納帳票情報化
ハナ銀行
KTF
(旧ハンソル
M.COM)
日立メインフレームと情報系システムで、データをロード/変換過程を経て
運用テーブルの生成部分のTeraStream利用
 TeraStreamは全体ETT工程の約70%程度作業を担当し、C/SQLの依存度を下げ、
維持保守を簡素化した。

•情報系システム(DW)
国民カード
KoreanRe
作業 内容
•新カードシステム
•システム統合
•照会機能を持つ
バックアップシステム
データ量の多い作業の場合、TeraStreamを利用し作業
•SQL処理で1時間30分かかった作業を15分に短縮し、実行時間削減やDB負荷減少効果
を得た。



既存のシステムは、一度に一つのソートのみを対応したが、TeraStream適用後は月
間作業の多重処理を可能にした。
複数の銀行や企業の払込通知書データをソート/Mergeし、用途により分類
(distribute)する作業を毎日実行可能にした。
バッチサーバは DBMS代わりに TeraStreamで全てのバッチ作業を3時間以内に
処理することで全体業務の要求事項を満足させた。
既存テーブルの加工を含め、12時間以内の移行業務を実現した。
•メインフレームでバッチ処理をUnixサーバに移管処理し、スピード向上や低定価ハ
ードウェア資源を利用し経費削減を実現した。
•3TBのデータバックアップと照会サービス領域を、TeraStream適用後はファイルを
日付別に分類し、照会キーでソート後、光ディスクに保存、サーチプログラム(FAS)
で照会ができるようにした。
---< 20 >--COPYRIGHT © YDC Digital Corp. ALL RIGHTS RESERVED.
韓国国内における導入企業(続き)
企業
適用 業務
国民健康
保険公団
•データウェアハウス
•システム 統合
健康保健
審査評価院
•データウェアハウス
•請求/評価システム
評価業務の月作業データを(明細内容 20G、 詳細内容40G) 業務サーバからFTPで受信
し TeraStreamを利用してバッチ処理
•TeraStreamは迅速なファイル検索のAPIを支援し、updateのないテーブルはファイル
で管理する為、ハードディスク容量を大幅に減らし経費節減効果を得る

•テーブル数は約700個(700GB~1TB)程度で、これはバッチサーバ(IBMP660)により加
工し、データウウェアハウスサーバであるIBM SP(10 node)に積載する。
• TeraStreamは全体作業の中で、大量データを処理(10GB/14min for sort)、 ETT時間
の短縮、工程の遅れを解消し、システム負荷を大幅に下げる。
•データウェアハウス
•全体処理作業時間を大幅短縮し、維持保守を簡単にする。
•Unloadされたデータの中から有効データのみ選別、変換過程を経て、テーブルを生成
する過程をTeraStreamが担当。
•データウェアハウス
•毎日3時間以内にバッチ処理を締め切るが、これを満足させるソリューションは
TeraStreamが唯一であった。
•毎日発生される多次元データベースのテーブル生成作業を高速に処理する。
LG流通
財政経済部
•ソートやファイル加工作業、データウェアハウス構築
•各事務所のシステムのデータを単一のシステムにて処理
•データウェアハウス
国税庁
ウンジン
コーウェイ
作業 内容
•財政情報化システム
•財政統合システム
複数のバッチ作業にて機関別に転送される税入り、税支出の会計システム作業
•バッチ作業そのものが複雑でSQL実行時間が非常にかかる為、TeraStreamに適用し
バッチ作業を実行

---< 21 >--COPYRIGHT © YDC Digital Corp. ALL RIGHTS RESERVED.
韓国国内における導入企業(続き)
企業
LG Telecom
適用業務
•基幹系システム
•ビーリング配置業務(CDR、 請求書など) に必要な膨大なデータのソート作業に
TeraStreamを適用した。
•ビーリングシステム
•データベース依存業務プロセッサーを改善し、大量データ処理のスピードや方法向
上(2倍~14倍)DBMS負荷の減少を実現した。
•課金、売上、 精算、料金に適用した。(72時間 → 1時間 処理時間節減)
•一日通話料集計処理にTeraStreamを利用し時間を短縮した。(35分 → 18分)
ハナロ通信
国民銀行
作業内容
•O-CRM ダウンサイジ
ング
•次世代システム
新韓銀行

M/F CRM データ(総1TB)を4時間でマイグレーションし、CRM バッチ業務をUNIX
サーバに再構築した。
•次世代システムの為のITアップグレード事業に TeraStreamを標準データ移行ツール
やコアバンキングパフォーマンス向上方法として適用した。
•新カードシステム
•現代カードのダイナスクラブ合併や既存のダイナスブランド以外に Visa/Masterカ
ード提携、現代[M]カード、 KIAノブレスカードの出資で入会者の増加により、会員詳
現代カード
細情報を構築した。
•パフォーマンス改善
情報通信部
•Pro*Cで構築されたバッチ処理の非効率性で、システム負荷や莫大な作業時間の問題
を克服する為、パフォーマンス改善作業にTeraStreamを適用し平均65%以上のパフォ
ーマンス改善効果を得た。
---< 22 >--COPYRIGHT © YDC Digital Corp. ALL RIGHTS RESERVED.
韓国外換銀行の次世代システムや新情報系システム
韓国外換銀行次世代バンキングシステム構築事業や新情報系システムで TeraStreamが、標準 ETT、 ソート、
データロードツールとして採用され、メインフレームダウンサイジングを構築した。
適用範囲
既存のシステム
新システム
2005年 2月 稼動停止
 メインフレームデータをUNIX環境の
データに完璧移行
2005年 2月 OPEN
BATCH
TSを利用
情報系
アカウント
Flat
File
IBM M/F
 新勘定系システムでのバッチ処理実行
HDB、 DB2
Conversion
 既存の情報系業務と新情報系業務のサービ
スを停止させることなく、完璧なデータ
の整合性を保障し、新しいシステムへ
データ移行
Fla
t
Fil
e
ETL
SAS
DB1
DB3(New ODW)
ORACLE 9i
 全システムでデータの抽出が必要な部分
にFACTをインストールし利用
システム移行後、情報系データベースの運用
を2日から1日に短縮、費用削減を実現
ETL
ETL
Flat File
24時間
DB
SPLIT
 新しい情報系で複数のMARTでデータ加工、
転送
BATCH
TSを利用
EDW
BATCH
SPを利用
batch
BATCH
TSを利用
ETL
Extract
ODW
BATCH
SPを利用
Old ODW
ORACLE 9i
DB2
DATA MART
(SUB システム)
Profit ManagementRISK
Fla
t
New EDW
Fil
e Sybase ASIQ 12.5
Extract 後
FTP 転送
KPI
---< 23 >--COPYRIGHT © YDC Digital Corp. ALL RIGHTS RESERVED.
EUC
国民(クンミン)銀行 O-CRM マイグレーション
▶ 6週間の短期間でTeraStreamを利用しM/F CRMデータ(計1TB)を4時間でマイグレーションし、
(EBCDIC→ASCII)、 CRM 配置業務をUNIXサーバで再構築した。
適用範囲
既存
CRM 配置 プロセス
Input
Flat File
 メインフレームデータをUNIX 環境のデータに変換
Error
Yes
基準Table
 新O-CRM システムでの配置業務を実行
No
Match
1 Record
read
 データのハングル変換など様々なデータ変換や加工
ターゲットTable
No
Match
 既存CRM 業務の中断を最小化し、システム移転を実行
Insert
Update
Yes
業務名
M/F作業
Pro*C
T/S
効果
KB STAR CLUB 関連情報
変更
2:30
プラチナカード更新作業
0:10
0:55
0:15
73%
カード債権管理お客様
抽出
0:30
16:00
0:50
95%
滞納者お知らせ口座リス
トロード作業
0:30
6:30
2:00
TeraStream 適用 CRM 配置 プロセス
Input
Flat File
基準 Table
70%
ターゲット
Table
Unload
Unload
Flat File
Flat File
Join
Not Match
Flat File
Match
Flat File
Join
Not Match
Flat File
1:25
0:25
71%
Insert
Match
Flat File
Update
ターゲットTable
# T/S: TeraStream™ M/F: Main Frame 의 약어임.
---< 24 >--COPYRIGHT © YDC Digital Corp. ALL RIGHTS RESERVED.
LG-Telecom パフォーマンス改善
パフォーマンス改善作業により業務プロセスの作業時間を短縮し、システム負荷軽減や生産性を向上させた。
平均56%の作業時間の短縮効果を得た。再作業の際、Contingency確保やデータ提供、遅延によるIMPACTを
最小化し、システムリソース使用の効率性を向上させた。
既存プロセス方式
ソースシステム(MPS)
TeraStreamTM
を利用したプロセス
方式
ソースシステム(MPS)
ETT システム (ODS)
EDW システム
ETTシステム (ODS)
ファイ
ル
業務
周期
営業売上
月
課金通話詳細
日
ERP配置作業
月
着信 CDR (NMS)
月
発信 CDR (NMS)
ERP 提供 BATCH
月
月
OLAP MART システム
区分
EDW システム
OLAP マートシステム
EDW システム
OLAP マートシステム
EDW システム
EDW システム
OLAPマートシステム
EDW システム
EDW システム
InfometicaTM 時間
12:50
18:35
5:50
8:00
11:20
5:00
11:40
8:20
16:20
EDW システム
OLAP MART システム
TeraStreamTM 時間
5:00
8:20
3:00
4:00
3:15
2:15
2:20
4:50
5:15
---< 25 >--COPYRIGHT © YDC Digital Corp. ALL RIGHTS RESERVED.
改善率
61%
55%
49%
50%
71%
55%
80%
42%
68%
統計庁人口住宅総調査構築
統計庁人口住宅総調査事前環境
2005年調査資料
伝授전 標本표
수
본
外国人
特別
….
 データベースやファイルの整合性を維持しなければならない。
BACH
非
定
形
分
析
 ウェブベースによるデータや集計ファイル、分析ファイルにアク
セスを容易にする。
統合ファイル
BACH
BACH
流形別Summary
BACH
暫定集計表
流形別Summary
BACH
最終集計表
バ
ッ
チ
統計庁人口住宅総調査 TeraStreamの適用効果
BACH
最終集計表
集
計
表
Pro*C開発より開発期間の短縮
SQL より高パフォーマンスの演算処理実行
演算作業をマルチプロセスにて作業
分
析
CPUの占有率を全体的に低く維持
リソース節減による効率性のアップ
統計報告統合ソリューション適用による効率アップ
---< 26 >--COPYRIGHT © YDC Digital Corp. ALL RIGHTS RESERVED.
国税庁データウェアハウス
▶ 国税庁データウェアハウス構築でTeraStreamは、大量データのETCLを検索されるよう設計した。
適用範囲
 事業期間 : 2002年3月~2003年12月 (22ヶ月)
 システム構成 : ETCLサーバ(IBM P660/6CPU/8GB MEM)、
DWサーバ(IBM SP 10node)
 Source Data (初期分/変更分) : 650GB/50GB
 Target Data (初期分/変更分) : 2TB/150GB (IBM DB2に
積載)
FTP
大量データ
作業 Tool
少量データ
総作業時間
TeraStream
27時間 42分 43秒
DataStage
181時間 7分 39秒
74%の作業時間を短縮することができた。
---< 27 >--COPYRIGHT © YDC Digital Corp. ALL RIGHTS RESERVED.
健康保険審査評価院データウェアハウス
▶ 健康保険審査評価院データウェアハウスのETCLや評価業務分析の為、TeraStreamは大量データのETCLや
データマートを検索するよう設計構築した。
適用範囲
 事業期間 : 2002年8月~2003年7月 (12ヶ月)
HP V2500
本社支援運用系システム
 システム構成 : DWサーバ(HP Superdome/40CPU/104GB
MEM)
Superdome CPU=40
EDW Server
 Source Data (初期分/変更分) : 12TB
大量データ
 Target Data (初期分/変更分) : 84TB
(Sybase ASIQ 積載)
Flat File
少量データ
TeraStream
Sort/Join/reformat
 特長 : 大容量データ処理ツールとしてTeraStreamが
採用された。
Infomatica
CoSORT
Conversion/sum/logic
積載
受付/審査調整/明細
書/診療内容/処方箋
交付内容/療養機関
Sybase IQ
OLAP
---< 28 >--COPYRIGHT © YDC Digital Corp. ALL RIGHTS RESERVED.
情報通信部/郵政事業本部:金融システムパフォーマンス改善
郵政事業本部の金融システムを改善し、全システムの配置業務や抽出業務に TeraStreamが採用され、
システムの構築をした。
既存(Pro*C) Batch プロセス
Target System
Source System
適用範囲
 現在運用システムである Numa-QからFACTを利用して
データを抽出、変換、加工、積載
 新しい勘定系システムでの配置業務 を実行
 新しい勘定系システムで新しい情報系にデータを抽出、 加工、
転送
Table
Table
Table
Table
Table
Table
Insert/Update
Fetch
SQLクエリー
パフォーマンス比較
区分
既存のプログラム
(SQL)
変更プログラム
(TeraStream)
件数
TeraStream 適用 Batch プロセス
Run Time
4、072
3分22秒
496、784
26分57秒
993、568
1時間22分41秒
2、500、000
3時間17分31秒
4、072
7分23秒
496、784
7分24秒
993、568
11分30秒
2、500、000
16分14秒
Source System
Target System
Table
Table
Table
Unload
FACT
Table
Table
Table
TeraStream
CoSORT
Load
LOAD
Sort. Join、 Sum
Unload
Sam File
Sam File
---< 29 >--COPYRIGHT © YDC Digital Corp. ALL RIGHTS RESERVED.
農協中央協会:新カードシステム
農協中央協会で進めている新カードシステム構築事業にTeraStreamが採用された。
既存データの各種変更、データ加工業務構築後、日常業務で使用されている。
カード部署
IBM P690
適用業務
一括払い、分割、現金サービス、海外お取引に関するデータを
抽出し、顧客の手続番号、決済日付別に作業を行い、顧客住民
番号にアクセスし請求テーブルに作成
Oracle
高速抽出
上記業務をSAMファイル上で迅速に実行させ、作業時間を短縮
するよう再設計、再構築
パフォーマンス資料
作業分類
実行時間
処理件数
データ読み込み
01:15:27
9、100万件
データの加工
00:42:13
データの結合
00:01:08
データのロード
00:02:00
410万件
全体実行時間
02:00:48
9、100万件→410万件
お客様
一括払い
一括払い
先に決済
…
住民
番号
Sort/Join
Aggregation/
加工
一括払い
分割
キャッシング
海外
請求
積載
請求テーブル
---< 30 >--COPYRIGHT © YDC Digital Corp. ALL RIGHTS RESERVED.
農協中央会:データウェアハウス
農協中央会データウェアハウス構築にTeraStreamが採用された。
一般的なETTツールでは実現不可だったが、既存の大容量データ処理をTeraStreamが実現可能にした。
勘定系
情報系
適用業務

農協中央会のデータウェアハウスシステムは、既存の
日立ホストと情報系運用システムにおけるデータを 読
み込み、有効データに変換/選別プロセスを含む DWで
運用するテーブルの生成プロセスに TeraStreamを利
用した。

TeraStreamは全体ETT工程中に約70%程度の作業を担
当し、全工程の大幅の時間短縮した。

C、 SQLに依存しない為、維持保守が簡単。
勘定系
情報系、受信与信総合
抽出/移動
抽出/移動
Conversion
Cleansing and Filtering
Sort
パフォーマンス資料
Join
TeraStream適用後
既存方式
全体配置
3~5時間
4日
変更された分の 配置
1~2時間
24~48時間
Merge
Summary
Calculation
Load
DW Server
---< 31 >--COPYRIGHT © YDC Digital Corp. ALL RIGHTS RESERVED.
金融決済院:払込通知書処理
金融決済院は銀行や企業からの払込通知書、振込用紙データを元に、様々なバッチ処理を迅速に処理した。
旧運用系
照会
適用業務


金融決済院は銀行や企業の払込通知書、振込用紙データを
ソート、集計し、用途によって分類する業務を日々実行。
同業務は翌日早朝まの完了が必須だが、データの増加により
メインフレームバッチ作業のスピードでは同要求事項は処理で
きなかった。

TeraStreamは同業務を簡易スクリプトにて高速処理した。

TeraStream利用により、新サーバの追加購入の削減、既存の
サーバを充分活用することができる。
Tandem Mainframe
作業終了後
結果転送
臨時作業
作業移動
SAM
データ 変換
臨時 UNIX Server
SAM
パフォーマンス資料
TeraStream 未使用や使用の際の環境
移動 / 積載
作業所要時間
Tandem M/F
9 時間
Tandem M/F & UE5000 & CoSORT
3 時間
新運用系
配置業務
Sun UE6500
---< 32 >--COPYRIGHT © YDC Digital Corp. ALL RIGHTS RESERVED.