PDF

Cisco ASR 1000 シリーズ アグリゲーション サービス ルータ
クラッシュのトラブルシューティング
目次
概要
前提条件
要件
使用するコンポーネント
表記法
Cisco ASR 1000 シリーズ アグリゲーション サービス ルータのクラッシュ
クラッシュのタイプ
クラッシュ情報の取得
Crashinfo ファイル
コアダンプファイル
IOSD クラッシュ
SPA ドライバークラッシュ
Cisco IOS XE プロセスクラッシュ
Cisco Quantum Flow Processor マイクロコードクラッシュ
Linux カーネルクラッシュ
TAC のサービスリクエストをオープンする場合の情報の収集
関連情報
概要
この文書は、Cisco ASR 1000 シリーズ アグリゲーション サービス ルータにおけるクラッシュのトラブルシューティングについ
て説明しています。
前提条件
要件
この文書に関する特別な要件はありません。
使用するコンポーネント
この文書の情報は、以下のソフトウェアおよびハードウェアバージョンに基づいた情報です。
ASR 1002、1004、1006 を含む全ての Cisco ASR 1000 シリーズアグリゲーションサービスルータ
Cisco ASR 1000 シリーズ アグリゲーション サービス ルータをサポートする全ての Cisco IOS XE ソフトウェアバージョ
ン
この文書の情報は、特定のラボ環境にあるデバイスに基づいて作成されています。この文書内で使用されているデバイスはすべ
て、クリアな状態(デフォルト)から設定作業を始めています。対象のネットワークが実稼動中である場合には、すべてのコマン
ドによる潜在的な影響について確実に理解しておく必要があります。
表記法
文書表記の詳細は、『シスコテクニカルティップスの表記法』 を参照してください。
Cisco ASR 1000 シリーズ アグリゲーション サービス ルータのクラッシュ
クラッシュのタイプ
Cisco ASR 1000 シリーズ アグリゲーション サービス ルータは、ソフトウェア アーキテクチャとして Cisco IOS XE ソフトウ
ェアを導入しています。Cisco IOS XE ソフトウェアは、Cisco IOS ソフトウェアをベースとして Route Processor(RP; ルート
プロセッサ)、Embedded Services Processor(ESP; エンベデッド サービス プロセッサ)、SPA Interface Processor(SIP;
SPA インターフェイス プロセッサ)に搭載された Linux カーネル上で動作するモジュラー型オペレーティングシステムです。
IOS デーモン(IOSD)および他の IOS XE プロセスは、その Linux カーネル上で動作しています。そのため Cisco ASR 1000 シ
リーズアグリゲーションサービスルータでは、『表1』 に示されるようにいくつかのクラッシュのタイプがあります。
表1
クラッシュのタイプ
クラッシュのタイプ
モジ
ュー
ル
説明
IOSD クラッシュ
RP
Cisco IOS ソフトウェアが IOSD として
RP の Linux カーネル上で動作していま
す。
SPA ドライバークラッシ
ュ
SIP
SPA を制御するために、SIP 上で限定され
た Cisco IOS ソフトウェアが動作してい
ます。
RP
Cisco IOS XE プロセスク
ESP
ラッシュ
SIP
Cisco Quantum Flow
Processor(QFP)マイク
ロコードクラッシュ
ESP
いくつかの Cisco IOS XE プロセスが
Linux カーネル上で動作しています。例え
ば、シャーシマネージャー、フォワーディ
ングマネージャー、インターフェースマネ
ージャーなどが RP 上で動作しています。
マイクロコードが QFP 上で動作していま
す。QFP は ESP 上で動作するパケットフ
ォワーディング ASIC です。
RP
Linux カーネルクラッシ
ュ
ESP
Linux カーネルは、RP、ESP、SIP 上で動
作しています。
SIP
クラッシュ情報の取得
期待されないモジュールの再起動に遭遇した場合、コンソール出力や Crashinfo ファイルディレクトリやコアダンプファイル デ
ィレクトリがトラブルシューティングに有効であるかを確認する必要があります。原因を特定するための最初のステップは、可能
な限り問題に関する十分な情報を集めることです。以下の情報は問題の原因を特定するために必要となります。
Console ログ 詳細については 『コンソール接続用ターミナル エミュレータの正しい設定』 を参照してください。
Syslog 情報 syslog サーバへログを送信する設定にしている場合は、クラッシュ時に何が発生したかに関する情報を取得す
ることができます。詳細については 『Resource Manager Essentials と Syslog Analysis:手引き』 を参照してください。
show platform show platform コマンドは、RP、ESP、SIP、SPA、電源に関する状態を表示します。
show tech-support show tech-support コマンドは、show version および show running-config を含む多くの異なるコマ
ンドを集めたものです。ルータが問題に遭遇したとき、シスコ テクニカルアシスタンスセンター(TAC)エンジニアは通常
問題解決のためにこの情報を求めます。再起動もしくは電源 OFF/ON を実施する前に show tech-support の出力を収集する
必要があります。なぜならこれらの行為は問題に関する情報の不足を引き起こす原因になりうるからです。
注:show tech-support コマンドは show platform と show logging コマンドを含みません。
ブートシーケンスの情報 ルータがブートエラーに遭遇した場合の完全なブートシーケンス。
Crashinfo ファイル(ファイルがある場合) Crashinfo ファイル セクションを参照してください。
コアダンプファイル(ファイルがある場合) コアダンプファイル セクションを参照してください。
トレースログファイル(ファイルがある場合) Cisco ASR 1000 シリーズアグリゲーションサービスルータでは、Cisco IOS
XE プロセスのトレースログが RP上の harddisk:tracelogs(ASR 1006 または ASR 1004)もしくは bootflash:tracelogs
(ASR 1002)配下に生成されます。Cisco IOS XE プロセスがクラッシュした場合、Cisco TAC エンジニアは通常、問題解決
のためにこの情報の取得を求めます。
Crashinfo ファイル
IOSD もしくは SPA ドライバーがクラッシュした場合、Crashinfo ファイルは 『表2』 に示す場所に生成されます。
表2
Crashinfo ファイルの生成場所
モデル
ASR 1002
ASR 1004
クラッシュのタイプ
IOSD クラッシュ
SPA ドライバークラッシュ
Crashinfo ファイルの生成場所
bootflash:
IOSD クラッシュ
bootflash:
SPA ドライバークラッシュ
harddisk:
ASR 1006
『表3』 は Crashinfo ファイル名を示しています。
表3
Crashinfo ファイル名
クラッシュ
のタイプ
Crashinfo ファイル名
例
IOSD クラッ crashinfo_RP_SlotNumber crashinfo_RP_00_00_20080807シュ
_00_Date-Time-Zone
063430-UTC
SPA ドライ
バークラッ
シュ
crashinfo_SIP_
SlotNumber_00_DateTime-Zone
crashinfo_SIP_00_00_20080828084907-UTC
コアダンプファイル
プロセスがクラッシュした時、コアダンプファイルは『表4』に示す場所で確認できます。コアダンプファイルはプロセスのメモ
リイメージの完全なコピーです。トラブルシューティングが完了するまでコアダンプファイルを保存しておくことが推奨されま
す。これはコアダンプファイルが Crashinfo ファイルよりもクラッシュの問題についてより多くの情報を含んでいるためです。
そしてそれはより深い調査に必要とされます。Cisco ASR 1002 ルータの場合は、harddisk デバイスを持たないため、コアダンプ
ファイルは bootflash:core/ に生成されます。
表4
コアダンプファイルの生成場所
モデル
ASR 1002
ASR 1004
ASR 1006
コアダンプファイルの生成場所
bootflash:core/
harddisk:core/
RP 上のプロセスのコアダンプファイルだけでなく、ESP や SIP 上のプロセスのコアダンプファイルも同じ場所に生成されます。
Cisco ASR 1006 ルータの場合は、スタンバイ RP の同じ場所も確認する必要があります。なぜならば、RP スイッチオーバーのた
めに、現在のスタンバイ RP は問題が発生した時はアクティブ RP であった可能性があるためです。
表5
コアダンプファイル名
クラッ
シュの
タイプ
コアダンプファイル名
IOSD
hostname_RP_SlotNumber_ppc_linux_iosd-_
クラッ
ProcessID.core.gz
シュ
例
Router_RP_0_ppc_linux_iosd_17407.core.gz
SPA ド
ライバ hostname_SIP_SlotNumber_mcpcc-lc-ms_ProcessID Router_SIP_1_mcpcc-lcークラ .core.gz
ms_6098.core.gz
ッシュ
IOS
XE プ
Router_RP_0_fman_rp_28778.core.gz
hostname_FRU_SlotNumber_ProcessName_ProcessID
ロセス
.core.gz
クラッ
Router_ESP_1_cpp_cp_svr_4497.core.gz
シュ
Cisco
QFP ク hostname_ESP_SlotNumber_cpp-mcplo-ucode_ID
ラッシ .core.gz
ュ
Router_ESP_0_cpp-mcploucode_042308082102.core.gz
Linux
カーネ
hostname_FRU_SlotNumber_kernel.core
ルクラ
ッシュ
Router_ESP_0_kernel.core
IOSD クラッシュ
IOS デーモン(IOSD)は RP 上で Linux プロセス(ppc_linux_iosd-)として動作します。デュアル IOS モード(Cisco ASR
1002 ルータおよび Cisco ASR 1004 ルータのみ)では、2 つの IOSD が 1 つの RP 上で動作します。
IOSD のクラッシュと特定するためには、コンソール上の以下の例外出力を確認してください。デュアル IOS モードを用いない
Cisco ASR 1002 ルータもしくは Cisco ASR 1004 ルータのクラッシュの場合、その機器は再起動されます。デュアル IOS モード
を用いた Cisco ASR 1002 ルータもしくは Cisco ASR 1004 ルータのクラッシュの場合、IOSD はその RP 上でスイッチオーバー
します。Cisco ASR 1006 ルータの場合、RP はスイッチオーバーされ、新しいスタンバイ RP は再起動されます。
Exception to IOS Thread:
Frame pointer 2C111978, PC = 1029ED60
ASR1000-EXT-SIGNAL: U_SIGSEGV(11), Process = Exec
-Traceback= 1#106b90f504fce8544ce4979667ec2d5d
:10000000+29ED60 :10000000+29ECB4 :10000000+2A1A9C
:10000000+2A1DAC :10000000+492438 :10000000+1C22DC0
:10000000+4BBBE0
Fastpath Thread backtrace:
-Traceback= 1#106b90f504fce8544ce4979667ec2d5d
c:BC16000+C2AF0 c:BC16000+C2AD0
iosd_unix:BD73000+111DC pthread:BA1B000+5DA0
Auxiliary Thread backtrace:
-Traceback= 1#106b90f504fce8544ce4979667ec2d5d
pthread:BA1B000+95E4 pthread:BA1B000+95C8
c:BC16000+D7294 iosd_unix:BD73000+1A83C
pthread:BA1B000+5DA0
PC
CTR
R0
R4
R8
R12
R16
R20
R24
R28
=
=
=
=
=
=
=
=
=
=
0x1029ED60
0x0BD83C2C
0x00000000
0x000000B4
0x12B04780
0x22442082
0x00000000
0x00000000
0x00000001
0x00000001
LR
XER
R1
R5
R9
R13
R17
R21
R25
R29
=
=
=
=
=
=
=
=
=
=
0x1029ECB4
0x20000000
0x2C111978
0x0000003C
0x00000000
0x13B189AC
0x00000001
0x00000000
0x34409AD4
0x00000000
MSR = 0x0002D000
R2
R6
R10
R14
R18
R22
R26
R30
=
=
=
=
=
=
=
=
0x2C057890
0x2C111700
0x2C05048C
0x00000000
0x00000000
0x00000000
0x00000000
0x3467A0FC
R3
R7
R11
R15
R19
R23
R27
R31
=
=
=
=
=
=
=
=
0x00000034
0x00000000
0x00000050
0x00000000
0x00000000
0x00000001
0x2CE88448
0x2C1119B8
Writing crashinfo to bootflash:crashinfo_RP_00_00_20080904-092940-UTC
Buffered messages: (last 4096 bytes only)
IOSD がクラッシュした場合、Crashinfo ファイルとコアダンプファイルが RP 上に生成されます。
Router#dir bootflash:
Directory of bootflash:
bootflash:crashinfo_RP_00_00_20080904-092940-UTC
Router#dir harddisk:core
Directory of harddisk:core/
3620877 -rw10632280
Sep 4 2008 09:31:00 +00:00
Router_RP_0_ppc_linux_iosd-_17407.core.gz
SPA ドライバークラッシュ
SPA ドライバーは SPA を制御するために限定された IOS の機能を持ちます。そして SPA ドライバーは SIP 上で mcpcc-lc-ms
プロセスとして、Cisco IOS XE プロセスの一つとして動作します。もし mcpcc-lc-ms プロセスのダウンを確認した場合、それは
SPA ドライバーのクラッシュと特定できます。SPA ドライバーがクラッシュした後は、SPA は再起動します。
Aug 28 08:52:12.418: %PMAN-3-PROCHOLDDOWN: SIP0:
pman.sh: The process mcpcc-lc-ms has been helddown (rc 142)
Aug 28 08:52:12.425: %ASR1000_OIR-6-REMSPA:
SPA removed from subslot 0/0, interfaces disabled
Aug 28 08:52:12.427: %SPA_OIR-6-OFFLINECARD:
SPA (SPA-1X10GE-L-V2) offline in subslot 0/0
Aug 28 08:52:13.131: %ASR1000_OIR-6-INSSPA:
SPA inserted in subslot 0/0
Aug 28 08:52:19.060: %LINK-3-UPDOWN: SIP0/0:
Interface EOBC0/1, changed state to up
Aug 28 08:52:20.064: %SPA_OIR-6-ONLINECARD:
SPA (SPA-1X10GE-L-V2) online in subslot 0/0
SPA ドライバーがクラッシュした時、Crashinfo ファイルとコアダンプファイルが RP 上に生成されます。
Router#dir harddisk:
Directory of harddisk:/
14 -rw224579 Aug 28 2008 08:52:06 +00:00
crashinfo_SIP_00_00_20080828-085206-UTC
Router#dir harddisk:core
Directory of harddisk:/core/
4653060 -rw1389762 Aug 28 2008 08:52:12 +00:00
Router_SIP_0_mcpcc-lc-ms_6985.core.gz
Cisco IOS XE プロセスクラッシュ
Cisco IOS XE プロセスは RP、ESP、SIP の Linux カーネル上で動作します。『表6』 は主な Cisco IOS XE プロセスをリストし
たものです。クラッシュが発生した場合、そのモジュールは再起動する可能性があります。
表6
主な Cisco IOS XE プロセス
タイトル
プロセス名
モジュール
cmand
RP
cman_fp
ESP
cmcc
SIP
emd
RP, ESP, SIP
fman_rp
RP
fman_fp_image
ESP
hman
RP, ESP, SIP
imand
RP
imccd
SIP
Logging Manager
plogd
RP, ESP, SIP
Pluggable Service
psd
RP
QFP Client Control Process
cpp_cr_svr
ESP
QFP Driver Process
cpp_driver
ESP
QFP HA Server
cpp_ha_top_level_server
ESP
QFP Client Service Process
cpp_sp_server
ESP
Shell Manager
smand
RP
Chassis Manager
Environmental Monitoring
Forwarding Manager
Host Manager
Interface Manager
cpp_cp_svr プロセスが ASR 1006 ルータの ESP 上でクラッシュした場合、以下のメッセージがコンソール上に表示されます。
Jan 24 23:37:06.644 JST: %PMAN-3-PROCHOLDDOWN:
F0: pman.sh: The process cpp_cp_svr has been helddown (rc 134)
Jan 24 23:37:06.727 JST: %PMAN-0-PROCFAILCRIT: F0: pvp.sh:
A critical processcpp_cp_svr has failed (rc 134)
Jan 24 23:37:11.539 JST: %ASR1000_OIR-6-OFFLINECARD:
Card (fp) offline in slot F0
harddisk:core/ 配下にコアダンプファイルを確認することができます。
Router#dir harddisk:core
Directory of harddisk:/core/
1032194 -rw38255956 Jan 24 2009 23:37:06 +09:00
Router_ESP_0_cpp_cp_svr_4714.core.gz
プロセスのトレースログは有用な出力を含んでいる可能性があります。
Router#dir harddisk:tracelogs/cpp_cp*
Directory of harddisk:tracelogs/
4456753 -rwx
24868 Jan 24 2009 23:37:15 +09:00
cpp_cp_F0-0.log.4714.20090124233714
Cisco Quantum Flow Processor マイクロコードクラッシュ
Cisco Quantum Flow Processor は、ハードウェアとソフトウェアの両方を包括するアーキテクチャとして設計されました。現バ
ージョンの QFP では、2 つのシリコンが使用されています。今後のバージョンでは、ここで説明する同じソフトウェア アーキテ
クチャに基づき、シングル チップ ソリューションが採用される可能性があります。「Cisco Quantum Flow Processor」という呼
称自体が、ネットワーク プロセッサのハードウェアおよびソフトウェアを包括するアーキテクチャを表しています。
QFP マイクロコードがクラッシュした場合 ESP は再起動します。QFP マイクロコードのクラッシュを特定するために、以下のコ
ンソール上の出力もしくは cpp-mcplo-ucode のコアダンプファイルを見つけてください。
Dec 17 05:50:26.417 JST: %IOSXE-3-PLATFORM: F0:
cpp_cdm: CPP crashed, core file /tmp/corelink/
Router_ESP_0_cpp-mcplo-ucode_121708055026.core.gz
Dec 17 05:50:28.206 JST: %ASR1000_OIR-6-OFFLINECARD:
Card (fp) offline in slot F0
harddisk:core/ 配下にコアダンプファイルを確認することができます。
Router#dir harddisk:core
Directory of harddisk:core/
3719171 -rw1572864 Dec 17 2008 05:50:31 +09:00
Router_ESP_0_cpp-mcplo-ucode_121708055026.core.gz
Linux カーネルクラッシュ
Cisco ASR 1000 シリーズでは、Linux カーネルが RP、ESP、SIP 上で動作しています。Linux kernel がクラッシュした時、その
モジュールはコンソール出力なしに再起動します。そのモジュールが再度起動した後、もし Linux カーネルのコアダンプファイ
ルを確認できた場合、Linux カーネルクラッシュと特定できます。カーネルのコアファイルのサイズは、100 MByte 以上になりま
す。
Router#dir harddisk:core
Directory of harddisk:/core/
393230 ---- 137389415 Dec 19 2008 01:19:40 +09:00
Router_RP_0_kernel_20081218161940.core
TAC のサービスリクエストをオープンする場合の情報の収集
上記のトラブルシューティング手順を実行した後も、依然としてサポートが
必要で、Cisco TAC でサービス リクエストをオープンする必要がある場合
は、ルータ クラッシュのトラブルシューティングに必要な次の情報を必ず
収集してください。
サービス リクエストをオープンする前に実行したトラブルシューティ
ング
The show platform 出力
show logging 出力もしくはコンソールのキャプチャ
show tech-support 出力
Crashinfo ファイル(ファイルがある場合)
コアダンプファイル(ファイルがある場合)
収集したデータは、圧縮しないプレーンなテキスト形式(.txt)でサービス
リクエストに添付してください。情報をサービス リクエストに添付するに
は、TAC ServiceRequest tool( 登録ユーザのみ )を使用してアップロードしま
す。TAC Service Request Toolにアクセスできない場合は、メッセージの件
名の行にお客様のサービスリクエスト番号を記入し、[email protected] に
メッセージを送信することによって、お客様のサービスリクエストに関連情
報を添付できます。
注:ルータ クラッシュのトラブルシューティングに必要でない限り、上記の
情報を収集する前にルータを手動で再起動したり、電源のオフ/オンを行わ
ないようにしてください。問題の原因の判断に必要な、重要な情報が失われ
ます。
関連情報
製品サポートページ(英語)
トラブルシューティング:ルータのクラッシュ
crashinfo ファイルからの情報の取得
製品サポート:Cisco ASR 1000 シリーズ アグリゲーション サービス ルータ(英語)
テクニカルサポート&ドキュメンテーション - シスコシステムズ
1992 - 2014 Cisco Systems, Inc. All rights reserved.
Updated: 2009 年 8 月 21 日
http://www.cisco.com/cisco/web/support/JP/107/1070/1070948_asr_crash-j.html
Document ID: 109723