SmartSQM edge のご紹介

The easiest way to improve service visibility
SmartSQM edgeのご紹介
ユーザ、ネットワーク、サーバ(仮想/実)、アプリケーションを
総合的にリアルタイム・モニタリングする装置
NTTアイティ株式会社
マジックコネクト事業部
1. 製品背景
サービス利⽤者中⼼の性能管理が必要
効率的なサービス運⽤と共にユーザに⾼品質のサービスを提供するためにはエンドユーザ視点での性能管理が必要です。
• 既存のインフラリソースを監視する性能管理システムだけではユーザのサービス品質が把握にくい。
ユーザ環境(国/地域/ISP)によるサービス応答速度の格差が深刻化している。
コンテンツ伝送過程の複雑化により性能が低下したり、障害原因の把握が困難になったりしている。
50%
90%
80%
Performance
100%
90%
Real User
Service (IT Infrastructure + Application)
?
70%
NMS
SMS
• インフラリソースの性能がエンドユーザのサービス品質向上へ効果的に反映されない。
無分別な投資発生、インフラ投資に対する費⽤対効果が低くなる。
• インターネット接続⽅式の多様化により性能管理が困難になった。
多様なデバイス(モバイル、タブレットetc..)に対するサービス品質の管理が必要になる。
• ユーザの不満に対し迅速な対応をとることが困難になった。
サービス環境の複雑・多様化による障害や処理遅延が増加している。
1
APM
1. 製品背景
ユーザ視点の性能管理のためのEnd-to-Endモニタリングが必要
サービスに関するユーザの不満を事前に知得し、問題を迅速に解決するため、サービス伝送の全⾏程における可視性と透明
性を向上させる必要があります。
End-to-End モニタリング
Load Balancer
Web
Application
Database
Router
Dela
y
User Monitoring
誰がどのくらい使ってる?
遅くなっているユーザは?
どこで接続している?
Network Monitoring
リクエストはどのくらい出ている?
どこで問題が発生している?
なぜ遅延が発生している?
Service Monitoring
何をリクエストしているのか?
どのアプリケーションが遅いのか?
どのサービスが遅いのか?
期待効果
サービス可視性向上
• モニタリング領域をユーザまで拡張
• 性能低下部分の迅速な判断/分析
• 迅速な障害検知および対応
サービス透明性向上
サービス可⽤性分析
• アプリケーションの提供状態を把握
• ユーザがリクエストしているアプリケーションの
• ユーザ/ネットワーク/サーバ/アプリケーション
の性能分析
現状を把握
• ユーザのサービスへの接続状態を把握
• サーバの可⽤性分析
• 投資時期の予測
2
2. 製品概要
SmartSQM edge概要
本システムはネットワークパケットをリアルタイム解釈して、ユーザからサーバまでのサービス状態を総合的にモニタリングする
システムとして、サービスの可視性と透明性を画期的に向上させ、効率的なサービス運⽤と管理を可能にします。
“サービス状態を直観的に一目で把握できるEnd-to-Endリアルタイムモニタリングソリューション”
ユーザ/ネットワーク/サーバ/アプリケーションの
応答速度モニタリング
パケット収集/分析/管理/モニタリング機能が統合された
ハードウェア一体型システム
収集
分析
管理
サービスの性能低下診断/分析
性能統計データ提供
モニタリング
多様な閾値の設定&警告
3
2. 製品概要
SmartSQM edgeのEnd-to-Endモニタリング
ネットワークスイッチを通過する全てのパケットをリアルタイム解釈してユーザ、ネットワーク、サーバ、アプリケーションに対する
サービス性能をリアルタイムでモニタリングします。
既存モニタリング領域(NMS, SMS, APM)
ユーザ区間(モニタリング領域の拡張)
Wait (waiting applications)
韓国 ソウル
アメリカ
ニューヨーク
日本 東京
L4/7 switch
Load Balancer latency
Network time
(Client RTT/Server RTT)
複製した
パケット
中国 北京
ユーザ環境別の性能モニタリング
WAS
Web latency
(Static content)
DB
App latency
(Dynamic content)
SmartSQM edge
アプリケーション認知ネットワークモニタリング
• OS/ブラウザ/デバイス別の応答速度
• 国/地域別のネットワーク速度(RTT)
• ユーザトランザクションの追跡分析
• ISP(回線)/通信会社別のネットワーク速度(RTT)
• ユーザ応答待機(wait)状態および応答速度
• URLアプリケーションを認知したBPS, CPS, TPS,
• ユーザのURLアプリケーションリクエスト状態
Web
Session, PPS, RTTを測定
• パケットサイズ、使⽤帯域幅、プロトコル使⽤量分析
4
仮想サーバ/物理サーバ/APPモニタリング
• サーバ/アプリケーションの応答遅延時間および
応答待機(wait)
• ロードバランサの応答遅延時間
• Web/Appサーバ別の応答遅延時間
• 可⽤性分析および性能指数算出
2. 製品概要
モニタリング領域別のポイントソリューションとの⽐較
区分
End-to-End モニタリング
(SmartSQM edge)
NMS
SMS
APM
分類
End-to-End モニタリングソリューション
ネットワーク統合管理ソリューション
システム統合管理ソリューション
アプリケーション性能管理ソリューション
概要
サービス全区間に対するサービス状態と性能
モニタリング
ネットワークリソースに対する統合管理
システムリソースに対する統合管理
ウェブアプリケーションの性能モニタリング
管理内容
• ユーザの接続現況及び分布、応答速度
• ユーザ別ネットワークリソース使⽤量及び⾏為
追跡
• ロードバランサー、ウェブサーバのサービス応答
速度及び状態など
• アプリケーション別の応答速度、エラーなどの
サービス状態
• サーバCPU、Memory占有率
• ディスクI/O、ファイルシステムモニタリング
• サービスデーモン状態の監視
• WASとDB間にアプリケーション呼出
の件数及び性能
• JDBC/SQLクエリ統計
• システム及びJVMプロセスのメモリ使⽤
量
使⽤目的
• サービス全区間の可視性及び透明性の
確保によるサービス品質モニタリング
• 障害対応及び性能低下の迅速な問題
診断、分析
• サービス現況の包括的性能モニタリング
• サービス区間別の性能診断(ユーザ、ネット
ワーク、サーバ)
• ネットワークトラフィック管理によるネット
ワークリソースの統合管理
• ネットワーク装備の状態及び異常
有無の把握
• システムの物理的リソース管理による
サーバの性能資源統合管理
• サービスデーモン及びサーバ状態の
監視によるサービス異常有無の
把握
• アプリケーション性能モニタリング
(Class/method/SQL別の内部
実⾏ロジック)
• JVM, JDBC リソースモニタリング
• アプリケーションの内部SQL及びトラン
ザクション分析
• アプリケーション負荷量及び障害のモニ
タリング
データ収集
Agentless方式(パケットミラーリング)
SNMP, syslog, flow data
収集
Agent, SNMP, syslog 収集
など
Agent 方式
モニタリング
サイクル
リアルタイム(1秒単位モニタリング)
5分
5分
リアルタイム
• ネットワークトラフィック及びポート状態
• ネットワーク応答時間
• ネットワーク装備のリソース及び状態
5
3. 主要機能 - モニタリング
End-to-Endリアルタイムモニタリング
ユーザ、ネットワーク、サーバ、アプリケーションの状態を1秒単位でモニタリングする総合ダッシュボードを提供します。
End-to-EndモニタリングのためのE-Dashboard
ネットワークトラフィック
アプリケーション
サービス品質
サーバ/サービス状態
プロトコル別使⽤状況
同時接続数、コネクション、
トランザクション推移
ユーザ接続分布、状況&速度
パケットサイズ
6
3. 主要機能 - モニタリング
ユーザ、ネットワーク性能モニタリング
現在のユーザ接続分布及びネットワーク性能、ユーザ別のアプリケーション応答速度などをリアルタイムにモニタリングします。
ISP
Country
Browser
Region
OS
Mobile
Click
ユーザリクエストに応答遅延されているアプリケーション
Click
該当ユーザセッションのアプリケーションリクエスト状態
7
3. 主要機能 - モニタリング
サービス・サーバ別性能モニタリング
サービスの応答遅延が発生する箇所、遅延を誘発するアプリケーションをリアルタイムにモニタリングすることでサービス性能
が診断できます。
Request time
Web(µ) latency
App(µ) latency
Static Content
Dynamic Content
Switch
Wait
Sessions
WAS
WEB
Network RTT
DB
SmartSQM edge
Download (Response) time
接続
地域
現在
接続者数
トランザクション
処理量
サービス
応答遅延状態
トランザクション数
(毎秒)
ネットワーク
使⽤量
アプリケーション
遅延時間
ウェブサーバ
遅延時間
WASとDB間の
トランザクション性能問題
性能が低下する
アプリケーション&サーバ負荷問題
ネットワーク
速度
ネットワーク遅延問題
ウェブサーバの処理遅延問題
8
サービス
エラー
3. 主要機能 - モニタリング
仮想サーバ、実サーバ別の視覚化モニタリング(1/2)
ロードバランサとサーバの構成を⾒える化してサービス状態を視覚的にモニタリングできます。
ロードバランサのサービス構成を⾒える化したFlow Dashboard
仮想サーバ
同時セッション数
仮想サーバ応答速度
仮想サーバ(Virtual IP)別処理性能
実サーバ(Real IP)別処理性能
実サーバ同時セッション数
サービス応答待機時間の秒単位区分
実サーバ応答速度
仮想サーバの負荷、性能低下時
仮想サーバ
実サーバの負荷、性能低下時
応答遅延時間
実サーバ
実サーバのサービスダウン時
9
3. 主要機能 - モニタリング
仮想サーバ、実サーバ別の視覚化モニタリング(2/2)
One-Clickで現在のサービス状態を詳細にモニタリングします。
“ユーザトランザクション
リアルタイムトレース”
(処理トレース、性能分析)
ユーザ別使⽤量、品質、接続者環境
ユーザトランザクショントレース
• ユーザ別リクエスト状態、
ネットワーク使⽤量
ユーザIP別リクエスト状態
アプリケーション別サービス遅延状態
Click
遅延しているアプリケーション
• 遅延しているアプリケーション
モニタリング
ユーザセッション別サービスリクエスト状態
• 連結されたユーザセッションのリクエスト状態
セッションのリクエスト状態
10
各Column別ソート、項目追加
3. 主要機能 - 分析
ユーザトランザクションのリアルタイム追跡分析
特定ユーザのトランザクションをトレースして性能が低下している原因や有害⾏為を直ちに分析できます。
ユーザトランザクショントレース
Client RTT
Server RTT
トランザクションエラー確認
Request Time
応答遅延速度測定
Latency Time
Response Time
性能低下箇所分析Time Bar
Request Time
Client RTT
Latency
time
Response
Time
性能低下を誘発するコンポーネント
• 特定ユーザの不満解決
• 怪しいユーザのトレース
HTTPヘッダー分析
• 無意味なリクエスト送信の把握
• 性能低下を招くURLコンポーネントの確認
• 応答遅延箇所の確認
11
3. 主要機能 - 分析
サービス性能分析(1/2)
サービス推移、関係⽐較分析を通じて期間別のサービスの品質低下現象を分析できます。
• 期間別サービス性能推移分析(分/時/日/月)
サービス推移分析
• サーバ別負荷分散推移比較
• 各サーバー別接続者数、応答速度、使⽤量分析
Excel Export
• 相互比較分析を通した影響分析によるサービス変更
前・後の性能比較など
各測定要素別の⽐較相関分析
User
Session
RTT
Wait
12
3. 主要機能 - 分析
サービス性能分析(2/2)
サーバ性能とアプリケーション別性能を診断して性能改善のためのデータとして使⽤できます。
サーバ、URLアプリケーション別の性能分析
サーバの最終性能指数
仮想サーバ/実サーバ性能測定
サービス応答遅延速度
遅延が発生した⽐率
URLアプリケーション別の性能測定
• サーバ/アプリケーション別にサービス遅延が発生した⽐率を分析
• サーバ/アプリケーション別に提供サービスの性能指数を算出
• 性能指数からサーバ性能やアプリケーション品質改善の判断
13
3. 主要機能 - 警告
サービス危険レベル警告
サービス別に閾値を設定することで障害の兆候を事前に察知し、障害を未然に防ぎます。
危険レベルに対する閾値設定および警告
応答速度
遅延警告
ネットワーク
過負荷警告
100%
モニタリングと統計を通じた閾値範囲の把握
閾値
ルールに基づいた管理領域別の閾値条件設定
• モニタリング項目に対する閾値設定(セッション、応答待機、
0%
遅延時間、同時コネクション、同時トランザクション、
セッション
ネットワーク帯域幅、HTTPエラーなど)
帯域幅
コネクション
ネットワーク担当者
• 項目間AND,OR条件設定
エラー
応答速度
Wait
サービス/APP担当者
• 持続時間設定
• E-mail発送およびSMS連動
閾値条件設定
サービス異常の兆候発生
リアルタイム警告及び担当領域別にEメール発送
14
リアルタイム警告
3. 主要機能 - 統計
統計
ユーザ環境別、サーバアクセス別の性能統計データを提供するので、ビジネスの基礎データとして活⽤することができます。
ユーザ環境別の性能統計(応答速度、使⽤量、接続数)
• 国
• 地域
• ISP
• OS
• ブラウザー
• モバイルデバイス
• ユーザ
サーバアクセスの性能統計(応答速度、使⽤量、接続数)
• URL
• ファイルタイプ
• 流⼊経路
• 応答コード
15
3. 主要機能 - レポート(オプション)
レポート(オプション提供)
統計データをベースに日/月別で多様な形態の報告書を生成して業務に活⽤できます。
強⼒なレポート機能
• 14種類のレポートファイルフォーマット支援
(pdf, xls, doc, ppt, html, csv等)
• データExport機能
• 要素別ユーザ指定レポート生成
16
4. 活⽤分野
#
活⽤シーン
診断内容
確認情報
1
サービス性能低下の原因把握に
時間がかかる。
サービス性能低下が発生する区間に対する応答遅延
状態を分析、診断する。
Web latency, App latency, Wait, RTT,
Time Bar(Request・ Latency・
Response Time)
2
サービスオープンの場合、サービス
可⽤性を測定したい。
サービスの負荷テスト時にSmartSQM edgeからの統
計データ及び推移比較データなどを活⽤、接続者の
増加によるサービスの応答速度を確認する。
仮想サーバの応答速度、 実サーバの応
答速度, 負荷分散, Web latency, App
latency, Wait
3
提供サービスに対して実際ユーザ
視点からのサービス品質を管理し
たい。
ユーザ別のサービス利⽤状況に関する統計情報で診
断する。
サービス状況に関する統計情報、
性能分析、ユーザIP別の利⽤状況
4
グローバルサービス及び地域別
サービスの性能を管理したい。
国別・地域別のサービスアクセス分布を確認、RTT
colorによってネットワーク速度を確認する。
国別・地域別のサービス状況に関する統
計情報 (Transaction, Error, CPS Avg, T
PS Avg, RTT Avg, Wait Avg, Latency
Avgなど)
5
システム容量増設に備えて客観
的な統計データがほしい。
ユーザ接続量の増加推移によってシステム容量増設
可否を診断する。
Wait, Latency, BPS, Sessionなど
6
システムの増設や⼊替えの前・後
を比較し、性能向上の効果を確
認したい。
統計データと推移分析を通じてイベント前・後時点の
性能向上の効果を比較、検証する。
User, Transaction, Wait, Latency, Out
Bound N/W Traffic
7
頻繁に発生するサービス障害に
対して事前に対応したい。
サービスの性能を監視するしきい値を設定してサービス
障害兆候を事前に検知する。
サーバ状態(サービスダウンやサーバダウ
ン), Session, Wait, Latency, CPS, TPS,
BPS, HTTP Error
17
5. 製品構成
設置・構成⽅法
Agentless⽅式で既存サービスへの影響なく、簡単に設置・設定が可能です。
スイッチのパケットミラーリングを利⽤した構成
構成の特徴 (Agentless)
• 既存サービスに影響を与えない
• サーバOSに制約がない
• 運⽤と管理が容易(システム障害時、サービスに影響がない)
Data center
スイッチポートのミラー設定
ミラーリングは最大4portまで対応
• UplinkポートとRealサーバポートに対する全てのパケットをミラーリング
非対称ネットワーク環境構成対応
Uplink
(Active-Active環境, Active-Standby環境)
SmartSQM edge
収集ポート
サービス(ドメイン)単位適⽤
Packet
Mirroring
Servers
SmartSQM
edge
Mirror ポート
動作原理
L4/7switch
MGMT(管理ポート)
パケット
TCP, HTTP, HTTPS
18
L4/7 switch
複製した
パケット
6. 製品仕様、保守サービス
ハードウェア規格及び仕様
Categories
SmartSQM
Product image
edge
CPU type
1xQuad core
Memory
16GB
Disk Drive
1TB
Chassis
1U size(19” rack mountable)
Interface
6 port(Gigabit Copper)
支援機能
リアルタイムモニタリング、トランザクショントレース、しきい値設定、
Webサービス/性能分析ツール、統計
オプション(別途提供)
(製品裏⾯)
レポーティングツール
製品保守サービス (必須)
・お問い合わせ対応: 電話、電子メール (平日9時〜17時)
・故障対応: 平日9時〜19時、 当日オンサイト対応
・バージョンアップ時パッチファイル提供
※本体のHW仕様は製品提供時期により異なる場合があります。
19