炎黄网络-中国人的网络专家！-神州互联-行业资讯

亲，欢迎您访问海量科技网站！

用户名：

密码：

验证码：

注册抢红包10-1000元

服务热线：4006050005

首页　　　云服务器　　　租用 · 托管　　　云虚拟主机　　　域名注册　　　关于海量　　　代理专区

　　　关于我们

　　公司简介

　　备案控制面板

　　白名单提交

　　帮助中心

　　会员中心

　　付款方式

海量科技客服中心

如有任何疑问请拨打客服热线：

咨询热线：0551-62360688

海量科技业务咨询

海量琳子	海量芳芳
海量婷婷	海量蕾蕾
海量云云	海量丹丹
海量售后	投诉表扬

海量科技售后解答

新闻动态

行业资讯

行业资讯

您当前的位置：首页 -> 行业资讯　

服务器运行中宕机如何进行故障检测

　 1.异常信息检测

　　update消息，主要是监听并缓存uptime消息，同时避免时间窗内多次消息冲突，导致信息被覆盖。

　　delete消息，通过SA判断ping不通，且ssh不通情况下发起，删除该条消息，避免延迟太长。

　　insert消息，在新增加机器，或者重装后重新上位的机器发起，该消息对宕机发现价值不大，配合uptime使用。

　　2.网络异常检测

　　服务器较多误报是由于网络问题干扰，无法准确判断出物理机是否宕机，有可能是网络问题。

　　排除上联网络设备异常导致的误报，包括机房断网演练，小面积网络故障，上联网络故障，如通过探测丢包情况，使用一些逻辑初步判断网络问题。

　　服务器本身未丢包的误报，除了需要过滤出网络问题，还要通过丢包数据分析，过滤掉SA误报问题， SA异常会上报心跳异常，被误理解为宕机。

　　3.服务器异常信息检测

　　个别机房有时候会出现大面积风暴式的无故的信息异常，同时网络ping包异常，但上联网络设备ping包正常，这种误报，一般根据具体case具体进行针对性的分析。如根据监控每个机房的上报频率，排除干扰。

　　4.ping检测

　　大部分干扰已经过滤掉，但仍有一部分误报隐藏其中。比如ping异常，都合乎宕机判断的逻辑，会导致误判成宕机，如导致网卡被打爆，或者重试率高，这种是业务原因导致网络异常，但业务认为不是异常，需要排除掉。

　　再例如服务器并没有挂掉，但是IO延时和资源占用率各项指标都不正常等场景。针对以上等情况，增加uptime判断以及带外日志分析排查。

阅读次数: 4380

发布日期:2020/11/23

【关闭窗口】

推荐产品

　• 服务器租用
　• 云主机
　• 虚拟主机
　• 域名注册

技术支持

　• 备案控制面板
　• 白名单保护
　• 忘记密码
　• 会员中心

关于我们

　• 公司介绍
　• 付款方式
　• 文档下载
　• 帮助演示

增值业务

　• 400电话
　• 网站建设
　• 代理专区
　• 域名注册　

Copyright 2005-2015 All Rights Reserved.安徽海量信息技术有限公司地址：合肥市高新区天智路5号TOP创展中心1号楼17层邮编：230001
www.9358.com 销售热线:(0551)62360688 (0551)62360668 7x24小时技术专线:(0551)62360688 咨询热线:4006050005
海量科技所有产品报价均为最终报价请不要再考虑降价可能性海量信息技术营业执照副本中华人民共和国经营性ICP许可证:皖B2-20050067 皖ICP备08002860号

咨询客服

海量售后