本文档描述了如何查看接口状态,以及当接口的物理状态为DOWN状态时,如何定位接口故障的原因,并恢复接口到UP状态。
引起接口物理DOWN的原因主要包括以下两个方面:
为了更加精确的分析接口物理DOWN的故障原因,本文以故障可能的引入点为线索,如下图所示,按照人(人为因素导致的故障)-》机(设备自身硬件故障)-》料(连接介质故障)-》法(连接介质使用方法错误)-》环(环境因素导致的故障)五步骤为排查顺序,逐步找到问题根因并排除故障。
如果您能够实际接触设备,直接观察业务接口的指示灯,可以更快的识别当前业务接口的状态。以S6730-H48X6C为例,如图1-1所示,其中编号为4的指示灯,为10GE光接口指示灯,编号为5的指示灯,为40GE/100GE光接口指示灯。
业务接口指示灯颜色 |
业务接口指示灯状态 |
含义 |
---|---|---|
- |
常灭 |
接口无连接或被关闭。该状态下,接口不能正常收发报文。 |
绿色 |
常亮 |
接口有连接。 |
绿色 |
闪烁 |
接口在进行数据收发。 |
黄色 |
闪烁 |
接口在进行数据收发。 |
可以在任意视图下执行命令display interface brief查看所有接口的物理状态(回显中PHY字段信息)。
display interface brief PHY: Physical //表示接口的物理状态 *down: administratively down ^down: standby ~down: LDT down #down: LBDT down (l): loopback (s): spoofing (E): E-Trunk down (b): BFD down (e): ETHOAM down (dl): DLDP down (d): Dampening Suppressed (ld): LDT block (lb): LBDT block (lp): Loop-detect block (ms): MACsec down (o): Observe-port forwarding down InUti/OutUti: input utility/output utility Interface PHY Protocol InUti OutUti inErrors outErrors Ethernet0/0/0 up up 0.01% 0.01% 0 0 GigabitEthernet1/0/0 down down 0% 0% 0 0 GigabitEthernet1/0/1 down down 0% 0% 0 0 GigabitEthernet1/0/2 down down 0% 0% 0 0 GigabitEthernet1/0/3 down down 0% 0% 0 0 GigabitEthernet1/0/4 down down 0% 0% 0 0 GigabitEthernet1/0/5 down down 0% 0% 0 0 GigabitEthernet1/0/6 up up 0% 0% 0 0 GigabitEthernet1/0/7 up up 0% 0% 0 0 GigabitEthernet1/0/8 up up 0% 0% 0 0 GigabitEthernet1/0/9 up up 0% 0% 0 0 GigabitEthernet1/0/10 down down 0% 0% 0 0 ……
或者在任意视图下执行命令display interface interface-type interface-number查看指定接口的当前物理状态(回显中current state字段信息)。
display interface gigabitethernet 0/0/12 GigabitEthernet0/0/12 current state : Administratively DOWN Line protocol current state : DOWN Description: Switch Port, Link-type : access(negotiated), PVID :1, TPID : 8100(Hex), The Maximum Frame Length is 9216 IP Sending Frames' Format is PKTFMT_ETHNT_2, Hardware address is 000b-0974-a475 Last physical up time: 2013-08-10 21:09:51 Last physical down time : 2013-08-10 21:10:51 Current system time: 2013-08-10 21:15:06 Port Mode: COMMON FIBER Speed : 1000,Loopback: NONE Duplex: FULL,Negotiation: ENABLE Mdi: -,Flow-control: DISABLE Last 300 seconds input rate 96 bits/sec, 0 packets/sec Last 300 seconds output rate 96 bits/sec, 0 packets/sec Input peak rate 15184 bits/sec, Record time: 2013-08-10 17:45:05 Output peak rate 15184 bits/sec, Record time: 2013-08-10 17:45:05
上述示例中,接口GE0/0/12的当前物理状态为Administratively DOWN ,表示该接口下执行了命令shutdown。如果希望将该接口UP,则需要在对应接口视图下执行undo shutdown命令。
更多查看接口配置信息或统计信息的命令,如下表所示。
命令 |
说明 |
---|---|
display interface counters |
查看物理接口发送或接收报文的统计信息。 |
display interface ethernet brief |
查看以太网接口的简要信息,包括接口的物理状态、自协商方式、双工模式、接口速率、接口接收方向和发送方向最近一段时间的平均带宽利用率。 |
display counters error |
查看接口的错误报文的统计信息。 |
display error-down recovery |
查看处于Error-Down状态的接口的相关信息,包括接口名、Error-Down原因、接口状态恢复到UP的延迟时间和当前的剩余时间。 |
Apr 15 2014 03:46:10-05:13 dgg62aslhw3i %%01IFNET/4/IF_STATE(l)[47]:Interface GigabitEthernet1/0/1 has turned into DOWN state. Apr 15 2014 03:45:31-05:13 dgg62aslhw3i %%01IFNET/4/IF_STATE(l)[49]:Interface GigabitEthernet3/0/0 has turned into DOWN state.
当接口由正常UP状态变为物理DOWN时,需要首先排查下近期是否有人为操作不当,包括错误拔插网线、误碰触设备导致连线松动。如果确保连线没有问题,则进一步排查是否有误配置命令行的行为。
在对接的两个设备上的任意视图下,均执行命令display interface interface-type interface-number,查看接口当前运行状态和接口统计信息。
display interface gigabitethernet 0/0/12 GigabitEthernet0/0/12 current state : DOWN//接口当前物理状态 Line protocol current state : DOWN Description: Switch Port, Link-type : access(negotiated), PVID :1, TPID : 8100(Hex), The Maximum Frame Length is 9216 IP Sending Frames' Format is PKTFMT_ETHNT_2, Hardware address is 000b-0974-a475 Last physical up time: 2013-08-10 21:09:51 Last physical down time : 2013-08-10 21:10:51 Current system time: 2013-08-10 21:15:06 Port Mode: COMMON FIBER //接口工作模式。 COMMON COPPER表示此接口为电接口; COMMON FIBER表示此接口为光接口 Speed : 1000,Loopback: NONE //接口速率、环回状态,链路两端需要保持一致 Duplex: FULL,Negotiation: ENABLE //接口双工模式及自协商状态,链路两端需要保持一致
Negotiation字段值 |
恢复手段 |
---|---|
ENABLE |
表示接口处在自协商模式,接口速率和双工模式均是双方协商的结果。 如果链路两端的速率和双工模式协商不一致,可在接口下执行命令restart,重启接口,使之重新协商。如果仍然协商不成功,可在接口下执行命令undo negotiation auto,使之工作在非自协商模式。速率和双工模式的配置可参见Negotiation字段值为DISABLE时的情况。 |
DISABLE |
表示接口处在非自协商模式,速率和双工模式可在接口视图下执行命令speed { 10 | 100 | 1000 | 2500 | 5000 | 10000 }以及duplex { full | half }进行调整,使链路两端参数保持一致。 |
在采用恢复措施前,建议您先排除业务故障,以防止接口再次进入ERROR DOWN状态。ERROR DOWN状态恢复措施包括手动和自动两种。
手动恢复:在接口视图下依次执行命令shutdown和undo shutdown命令或者执行命令restart,重启接口。
自动恢复:在系统视图下执行命令error-down auto-recovery cause down-cause interval interval-value,设置由具体原因引起的Error-Down自动恢复UP功能。
down-cause字段值 |
场景说明 |
---|---|
as-not-ready |
在SVF场景下,当设备协商为AS模式时,端口状态会变为Down,待Parent将模板业务下发完成后,设备端口会重新UP。 |
auto-defend |
执行命令auto-defend action配置攻击溯源的惩罚措施后,设备会将攻击报文进入的接口shutdown,从而避免攻击源继续攻击设备。 |
bpdu-protection |
在运行STP协议的网络中,执行命令stp bpdu-protection配置BPDU保护功能后,如果有人伪造BPDU报文恶意攻击交换设备,交换设备会在边缘端口接收到BPDU报文时将边缘端口状态变为Down,从而阻塞该接口上的所有业务。 |
efm-remote-failure |
执行efm trigger error-down命令使能远端故障事件和当前接口联动功能时,当EFM检测到故障事件critical-event、dying-gasp、link-fault或timeout后,相应接口的协议状态变为Down,接口上的所有业务将全部被中断。 |
efm-threshold-event |
当配置了链路监控功能后,如果在设置的观察时长内,接口检测到的误帧、误码或者误帧秒数量达到或者超过门限值,则用户可以认为此链路不可以用。执行命令efm threshold-event trigger error-down配置EFM越限事件和当前接口联动功能,在上述情况下,设备会将接口状态变为Down,从而阻塞该接口上的所有业务。 |
error-statistics |
配置了备份链路的以太网接口,当接收到错误报文时,会导致业务丢包等故障。为了不影响业务的正常运行,执行命令error-statistics threshold-event trigger error-down,当接收到的错误报文达到告警阈值时,则将接口shutdown,业务切换到备份链路。 |
runts-error-statistics |
插拔光纤、网线或者光模块,执行shutdown、undo shutdown命令或者网络中存在Runts报文等情况会导致接口收到Runts错包。为了避免对设备或者运行的业务带来更坏的影响,设备会统计接口在1分钟内收到的Runts错包数,当Runts错包数超过告警阈值5时,将该接口shutdown。 |
link-flap |
网线故障或主备倒换等问题会引起接口状态频繁UP/Down变化,此时可执行命令port link-flap protection enable配置接口的Link-flap保护,设备在收到接口UP/Down消息时,查看接口振荡的次数和间隔时间,在指定时间内UP/DOWN振荡次数达到了设定值时,将该接口shutdown。 |
storm-control |
执行命令storm-control action配置了接口下风暴控制的动作为error-down后,在风暴控制检测时间间隔内,当接口上接收广播、组播或未知单播报文的平均速率大于指定的高阈值的时候,接口将进行关闭处理。 |
port-security |
配置接口安全功能后,设备学习到的MAC地址变为安全动态MAC。若通过port-security protect-action命令配置接口安全保护动作为shutdown,当接口学习到的安全MAC地址数超过限制或配置静态MAC地址检测功能后出现静态MAC地址漂移时,就把接口关闭。 |
mac-address-flapping |
当用户网络中由于环网等原因造成了MAC地址漂移时,可以在相应接口上执行命令mac-address flapping action配置发生MAC地址漂移后的处理动作来实现破环。接口配置了MAC地址漂移处理动作后,如果系统检测到是该接口学习的MAC发生漂移,会将该接口关闭。 |
transceiver-power-low |
配置了备份链路的以太网光接口,当接口的光功率降低时,会导致业务丢包等故障。为了不影响业务的正常运行,执行命令transceiver power low trigger error-down,当设备光功率低于设置的告警下限阈值时,会触发接口error-down,及时切换业务。 |
data-integrity-error |
设备长时间运行后,芯片内存标识符出现数据完整性错误。 |
当设备单板故障、单个接口故障,以及对端设备出现异常状况时,直接会导致接口物理DOWN。因此设备自身硬件是否故障是重点排查项。
在任意视图下执行命令display interface brief ,查看所有接口状态和配置的简要信息。
display interface brief … … Interface PHY Protocol InUti OutUti inErrors outErrors GigabitEthernet0/0/1 down down 0% 0% 0 0 GigabitEthernet0/0/2 down down 0% 0% 0 0 GigabitEthernet0/0/3 down down 0% 0% 0 0 GigabitEthernet0/0/4 down down 0% 0% 0 0 GigabitEthernet0/0/5 down down 0% 0% 0 0 GigabitEthernet0/0/6 down down 0% 0% 0 0
system-view [HUAWEI] interface gigabitethernet 0/0/1 [HUAWEI-GigabitEthernet0/0/1] loopback internal [HUAWEI-GigabitEthernet0/0/1] display this interface GigabitEthernet0/0/1 current state : UP Line protocol current state : UP … …
Apr 15 2013 03:46:14-05:13 dgg62aslhw3i %%01IFNET/4/IF_STATE(l)[46]:Interface GigabitEthernet1/0/1 has turned into UP state. Apr 15 2013 03:46:10-05:13 dgg62aslhw3i %%01IFNET/4/IF_STATE(l)[47]:Interface GigabitEthernet1/0/1 has turned into DOWN state. Apr 15 2013 03:45:35-05:13 dgg62aslhw3i %%01IFNET/4/IF_STATE(l)[48]:Interface GigabitEthernet1/0/1 has turned into UP state. Apr 15 2013 03:45:31-05:13 dgg62aslhw3i %%01IFNET/4/IF_STATE(l)[49]:Interface GigabitEthernet1/0/1 has turned into DOWN state. Apr 15 2013 03:42:10-05:13 dgg62aslhw3i %%01IFNET/4/IF_STATE(l)[50]:Interface GigabitEthernet1/0/1 has turned into UP state.
如果对端设备反复重启,例如S交换机与AP设备对接,AP反复重启,导致S交换机上与之连接的接口物理DOWN。此时需要排查AP反复重启原因,确认是否存在网络环路、大量ARP广播报文、网络攻击等因素并排除后,才可以确保接口正常UP。
仅有单个接口物理DOWN,则需要排查链路两端接口是否有金属弹片凹陷等硬件故障,如果接口故障可尝试使用其他空闲接口。
设备物理接口有电口和光口,涉及的连接介质主要是RJ45-网线、光模块、光纤。当连接介质出现老化、破损或者光模块收发光异常等故障时,会导致接口物理DOWN。
电口连接介质故障
保证对接两端接口使用同一根网线,如果经过跳线架,请检查跳线是否正确。检查接口是否连接正确,同时检查是否存在接触不好及网线外部损坏的情况。
依据以太网相关标准,网线长度不能超过100m。对于GE电口,如果使用低于五类线的网线将不能够使GE电口以1000M速率UP。所有电口对接,均推荐使用五类线以上规格的网线对接。
网线中4对线序中有部分出现损坏,将不能保证电口正常UP。检测网线质量,可以使用测线仪或者接口视图下执行virtual-cable-test命令,检测线序对连接是否正常。
如下所示回显中Pair state为Ok表示正常;如果为Unknown,建议使用线缆分析仪进行测试;如果为Open或Short,建议更换其他网线。
[HUAWEI] interface gigabitethernet 0/0/1 [HUAWEI-GigabitEthernet0/0/1] virtual-cable-test Warning: The command will stop service for a while, Continue?[Y/N] y Info: This operation may take a few seconds. Please wait for a moment..........done. Pair A length: 1meter(s) Pair B length: 1meter(s) Pair C length: 1meter(s) Pair D length: 1meter(s) Pair A state: Ok Pair B state: Ok Pair C state: Ok Pair D state: Ok
光口连接介质故障
华为公司在交换机产品发货的光模块标签上增加有华为logo和相应标识,如下图所示,在产品电子标签、光模块信息里面都更新为“HUAWEI”厂家信息。
对于非华为认证发货的光模块插入交换机设备中,会出现告警信息,可以通过display trapbuffer命令查看。告警格式如下:
ENTITYTRAP/3/OPTICALINVALID:OID [oid] Optical Module is invalid.(Index=[INTEGER], EntityPhysicalIndex=[INTEGER], PhysicalName="[OCTET]", EntityTrapFaultID=[INTEGER])
执行命令display transceiver interface,检查两端设备上的光模块工作状态是否正常,主要查看收光功率、发光功率、电流值等,确定各项指标是否都在正常范围内,如下表所示。
display transceiver interface GigabitEthernet 2/0/3 verbose … … Diagnostic information: Temperature (°C) :39 Voltage(V):3.32 Bias Current(mA):6.91 //电流值 Bias High Threshold(mA):33.34 Bias LowThreshold(mA):1.67 Current Rx Power(dBM):-4.59 //接口收光功率 Default Rx Power High Threshold(dBM):0.00 Default Rx Power LowThreshold(dBM):-16.99 Current Tx Power(dBM):-5.10 //接口发光功率 Default Tx Power High Threshold(dBM):0.00 Default Tx Power LowThreshold(dBM):-12.50 User Set Rx Power High Threshold(dBM) :0.00 User Set Rx Power Low Threshold(dBM):-16.99 User Set Tx Power High Threshold(dBM) :0.00 User Set Tx Power Low Threshold(dBM):-12.50
光模块状态属性 |
正常数值范围 |
---|---|
电流Bias Current(mA) |
数值在门限范围内,即取值范围在 Bias LowThreshold(mA)和Bias High Threshold(mA)之间 |
收光功率 Current Rx Power(dBM) |
数值在默认门限范围内,即取值范围在回显字段Default Rx Power LowThreshold(dBM)和Default Rx Power LowThreshold(dBM)数值之间 |
发光功率 Current Tx Power(dBM) |
数值在默认门限范围内,即取值范围在回显字段Default Tx Power LowThreshold(dBM)和Default Tx Power LowThreshold(dBM)数值之间 |
电口连接介质故障
如果电口网线故障,建议直接更换网线。
光口连接介质故障
进行设备间连接介质操作时,需要考虑光模块与光口是否匹配,光模块是否与光纤型号是否匹配,光模块与光纤连线操作是否正确等。当接口出现物理DOWN时,可以从上述几个方面进行排查。
display device S9303‘s Device status: //设备型号,下方回显信息中Type列表示单板名称 Slot Sub Type Online Power Register Status Role ------------------------------------------------------------ 1 - LE0MX4UXA Present PowerOn Registered Normal NA 2 - LE0MF48TA Present PowerOn Registered Normal NA 3 - LE0MG24SA Present PowerOn Registered Normal NA 4 - LE0DMCUA Present PowerOn Registered Normal Master PWR1 - - Present PowerOn Registered Abnormal NA FAN1 - - Present PowerOn Registered Normal NA
display transceiver interface GigabitEthernet 0/0/1 verbose GigabitEthernet0/0/1 transceiver information: ------------------------------------------------------------- Common information: Transceiver Type:1000_BASE_SX_SFP //光模块型号 Connector Type:LC Wavelength(nm):850 //光模块波长 Transfer Distance(m):500(50um),300(62.5um) //光模块传输距离 Digital Diagnostic Monitoring:YES Vendor Name:HUAWEI Vendor Part Number:02315204 Ordering Name: ------------------------------------------------------------- Manufacture information: Manu. Serial Number:NSK1NNV Manufacturing Date:2014-11-09 Vendor Name:HUAWEI -------------------------------------------------------------
如下图所示,Combo接口GE1/0/1在设备面板上对应两个接口:Combo光口和Combo电口。Combo光口和Combo电口不能同时工作。当用户需要对Combo光口或Combo电口进行属性配置时,都只需要进入同一接口视图GE1/0/1进行配置。
display interface gigabitethernet 1/0/1 GigabitEthernet1/0/1 current state : DOWN Line protocol current state : DOWN Description:HUAWEI, Quidway Series, GigabitEthernet1/0/1 Interface …… Port Mode: COMBO AUTO //Combo口工作模式一般有三种 COMBO AUTO:自动选择接口模式; FORCE FIBER:强制选择光口模式; FORCE COPPER:强制选择电口模式。 Current Work Mode: COPPER //当Port Mode显示为COMBO AUTO时, 此处表示当前实际自动选择到的工作模式, COPPER:电口模式;FIBER:光口模式 Speed : 100, Loopback: NONE
Combo接口状态 |
Combo接口选择的工作模式 |
---|---|
Combo电口没有连接网线,Combo光口插上了光模块 |
光口模式 |
Combo电口已经连接网线,且Combo接口处于UP状态,Combo光口插上了光模块 |
|
Combo电口已经连接网线,且Combo接口处于DOWN状态,Combo光口插上了光模块 |
光口模式 |
综上所述,Combo接口工作模式为自动选择模式时,只要Combo光口已插上光模块,则设备重启后,Combo接口都将选择光口模式。因此请根据连接介质(光纤或者网线)的实际情况,决定是否在Combo光口上插光模块。
本端与对端设备连接的接口类型 |
配置方法 |
---|---|
本端Combo电口与对端电口相连 |
在接口视图下执行命令combo-port copper,强制指定Combo接口的工作模式为copper。 |
本端Combo光口与对端光口相连 |
在接口视图下执行命令combo-port fiber,强制指定Combo接口的工作模式为fiber。 |
综上所述,当确定正确的连接介质后(光纤或者网线)后,就可以确定Combo口正确的工作模式,您可以直接使用命令combo-port { copper | fiber },强制配置接口工作模式和连接介质保持一致即可。
设备在网络中的部署位置是多变的,因此设备的使用场景复杂多样。当设备及其连接介质由于环境因素导致异常时,接口状态也可能物理DOWN。
S交换机工作环境温度:0℃~45℃,相对湿度在5%RH~95%RH之间,不结露。
电源线与业务线缆分开布放。不能出现强弱电线缆并行的情况,防止干扰。检查是否有高温或者机架磨损导致网线破损老化的问题。