|
| 價格: |
面議 |
| 起批量: |
1 件起批 |
| 區(qū)域: |
福建 福州 倉山區(qū) |
| 關鍵詞: |
|
| 聯(lián)系人: |
不* 先生 |
| 在線交流: |
 |
| 立即詢價查看聯(lián)系方式 |
|
|
c獨立經(jīng)營福州,福州,福州,電信高防機房
高防服務器咨詢扣扣:1451169449 一四五一一六九四四九 福州高防服務器線路穩(wěn)定 無視CC攻擊 高防服務器租用
TEL:18559161223 一八五五九一六一二二三
服務器“異?!钡膸讉€可能性預警請重視!
提到服務器宕機檢測,大家會想到,宕機能夠很快知道,這個有什么可做的?實際上,很多時候服務器宕機,并不總是被及時感知。服務器宕機,ping或者ssh這是**簡單的做法,但**的工程實踐,沒這么簡單。
想要獲知服務器宕機怎么辦?可以通過服務器宕機實時檢測:
1)發(fā)現(xiàn)宕機
2)提前告警。
3)告知宕機的詳細原因,如硬件故障,內(nèi)核bug,網(wǎng)絡異常等等。
4)自動報修生成工單。
我們知道,進行全網(wǎng)物理機宕機準確探測與實時發(fā)現(xiàn),可以給宕機分析提供**現(xiàn)場,獲取**現(xiàn)場的日志。也可以盡早將宕機數(shù)據(jù)推送給業(yè)務或運營感知并處理,如自動報修,業(yè)務遷移等,從而盡可能將業(yè)務影響降到**。
更重要的是,準確的宕機發(fā)現(xiàn)數(shù)據(jù)可以為宕機預測提供準確的標注數(shù)據(jù),為后期宕機預測提供數(shù)據(jù)基礎,并且這些數(shù)據(jù)提供給運營部門進行整體分析,提升處理效率。
那么,如何可以準確發(fā)現(xiàn)宕機,減少誤報呢?我們可以有以下操作,比如:
心跳源檢測異常
顧名思義,通過心跳源,初步發(fā)現(xiàn)異常。通常心跳變化會有三類消息,update消息,delete消息和insert消息。心跳邏輯在于,正常情況下SA服務端與NC建立長連接,每數(shù)秒緩存一次心跳,每幾分鐘打包上報一次,但當NC異常時,長連接感知后,立即上報異常,并修改路由表。所以心跳異常做到秒級感知。
update消息,在有心跳發(fā)生變化情況下都會有,心跳異常和心跳恢復正常時都會發(fā)起,是主要的心跳來源。
delete消息,在心跳異常,并且SA判斷ping不通,且ssh不通情況下發(fā)起,刪除該條消息,避免延遲太長。
insert消息,在新增加機器, 或者重裝后重新上位的機器發(fā)起,該消息對宕機發(fā)現(xiàn)價值不大,配合uptime使用。
心跳源檢測任務邏輯,主要是**并緩存uptime消息,同時避免時間窗內(nèi)多次消息沖突,導致信息被覆蓋。
異常排除
|
福建陸陸陸網(wǎng)絡科技有限公司 |
| 聯(lián)系人: |
不* 先生  |
| 電話: |
|
| 手機: |
 |
| 傳真: |
|
| 郵箱: |
1451169449@qq.com |
| 聯(lián)系地址: |
福建福州 |
| 郵編: |
|
| 小貼士: |
|
|