1. <strong id="7actg"></strong>
    2. <table id="7actg"></table>

    3. <address id="7actg"></address>
      <address id="7actg"></address>
      1. <object id="7actg"><tt id="7actg"></tt></object>

        看完這篇文章,你就明白運維監(jiān)控體系了

        共 2092字,需瀏覽 5分鐘

         ·

        2022-01-04 19:20

        總結歸納運維工作中的監(jiān)控內容。

        監(jiān)控目標

        明白監(jiān)控的重要性以及使用監(jiān)控要實現的業(yè)務目標

        通常包括以下三點:

        • 對目標系統(tǒng)進行實時監(jiān)控

        • 監(jiān)控可以實時反饋目標系統(tǒng)的當前狀態(tài) 目標系統(tǒng)硬件、軟件、業(yè)務是否正常、目前處于何種狀態(tài)

        • 保證目標系統(tǒng)可靠性,業(yè)務可以持續(xù)穩(wěn)定運行 有問題第一時間反饋出來,便于運維人員處理

        監(jiān)控方法

        • 了解監(jiān)控對象 例如:CPU如何工作?
        • 性能基準指標 例如: CPU使用率、負載、用戶態(tài)、內核態(tài)、上下文切換
        • 報警閾值定義 例如: CPU負載高的定義,內核態(tài)、用戶態(tài)多少算高
        • 故障處理流程 如何更高效處理故障的流程

        監(jiān)控核心

        • 發(fā)現問題
        • 定位問題
        • 解決問題
        • 總結問題,對故障原因及問題防范進行歸納總結,避免以后重復出現

        監(jiān)控工具

        • 老牌監(jiān)控

          • Cacti

          • Nagios

          • smokeping

        • 流行監(jiān)控

          • Zabbix

          • OpenFalcon

          • Prometheus+Grafana

          • 滴滴開源夜鶯Nightingale

          • smartping(專用于網絡監(jiān)控)

          • LEPUS天兔(專用于監(jiān)控數據庫)

          • 自研

        • 第三方監(jiān)控

          • 監(jiān)控寶

          • 聽云

          • newrelic

        監(jiān)控流程

        • 采集
        通過SNMP、Agent、ICMP、SSH、IPMI等對系統(tǒng)進行數據采集
        • 存儲
        各類數據庫服務,MySQL、PostgreSQL
        • 分析
        提供圖形及時間線情況信息,方便我們定位故障所在
        • 展示
        指標信息、指標趨勢展示
        • 報警
        電話、郵件、微信、短信、報警升級機制
        • 處理
        故障級別判定,找響應人員進行快速處理

        監(jiān)控指標

        硬件監(jiān)控

        • 機器硬件:CPU溫度、物理磁盤、虛擬磁盤、主板溫度、磁盤陣列
          IPMI工具無法獲取到硬件的狀態(tài),可以借助MegaCli工具探測Raid磁盤隊列狀態(tài)
          https://www.ibm.com/developerworks/cn/linux/l-ipmi/

        系統(tǒng)監(jiān)控

        • 主機存活
        • CPU、內存、硬盤、使用率
        • inode
        • 負載
        • 網卡出入帶寬
        • TCP連接數
        • 磁盤讀寫、只讀

        應用監(jiān)控

        MySQL

        • 服務可用性

        • 內存使用率

        • 磁盤使用

        • 主從不同步及延遲

        • 備份情況

        • 連接數

        Redis、Redis Cluster

        • 負載

        • 內存使用率

        • 連接數量

        • qps

        Nginx

        • 狀態(tài)碼

        • 連接狀態(tài)信息

        • RabbitMQ

        • PHP-FPM

        • OpenLDAP

          • 接入IP

          • 調用次數

        • Zimbra

        • OpenVPN

          • 版本信息、當前在線

          • 用戶、分配IP、客戶端連接IP、通過IP獲取地址位置、接收發(fā)送流量 連接時間 時長 連接ID

        • ELK

        • Graylog

        • GitLab

        • Jenkins

        • MongoDB

        • HAproxy

        網絡監(jiān)控

        • 網絡質量

        • 公網出口

        • 專線帶寬

        • 網絡設備

        流量分析

        日志監(jiān)控

        安全監(jiān)控

        • URL、API監(jiān)控

        • 自研

        • 阿里云方案

        性能監(jiān)控(APM)java|php|go|nodejs|分布式鏈路追蹤

        • PinPoint

        • Zipkin

        • SkyWalking

        • CAT、Jaeger

        業(yè)務監(jiān)控

        電商業(yè)務為例:

        • 每分鐘產生多少訂單

        • 每分鐘注冊多少用戶

        • 每分鐘多少活躍用戶

        • 每天有多少推廣活動

        • 推廣活動引入多少用戶

        • 推廣活動引入多少流量

        • 推廣活動引入多少利潤

        其他

        • SSL證書監(jiān)控

        • 存活性 進程是否還在,端口監(jiān)聽、Log滾動

        • 健康指標 MQ消息堆積量

        • 接口監(jiān)控 API成功率,延遲情況,QPS等等

        監(jiān)控報警

        • 郵件

        • 短信

        • 釘釘、微信、企業(yè)微信等其他即時通信軟件

        • 電話

        報警處理

        故障自愈: 服務器宕機自動啟動。利用軟件機制supervisor,systemd或者自定義腳本實現

        綜合監(jiān)控

        硬件監(jiān)控

        通過SNMP來進行路由器交換機的監(jiān)控、其他內容使用IPMI實現。如果都是公有云,可以忽略這部分內容。案例:Open-Falcon監(jiān)控H3C-ER3260G2路由器

        系統(tǒng)監(jiān)控

        服務監(jiān)控

        • 服務自帶

          • Nginx自帶status模塊

          • PHP相應status模塊

          • MySQL利用percona官方工具進行監(jiān)控

        • 通過自定義方法獲取數據

          • MySQL show global status xxx;

          • Redis info指令信息

        • 網絡監(jiān)控(混合云架構)

          • smokeping

          • smartping

        • 安全監(jiān)控

          • 云服務直接用云安全組即可,或者補充本機iptables

          • 硬件防火墻

          • Web服務使用Nginx+Lua實現Web層面的防火墻,或者Openresty

        • 日志監(jiān)控
          ELK、Graylog實現異常日志,錯誤日志關鍵字的監(jiān)控

        • 業(yè)務監(jiān)控
          確定監(jiān)控指標,監(jiān)控起來,業(yè)務不同各不相同

        • 流量分析
          建議使用百度統(tǒng)計,google統(tǒng)計,商業(yè),研發(fā)嵌入代碼實現。

          或者使用piwik

        • 可視化
          dashboard

        • 自動化監(jiān)控
          通過API,批量操作

        監(jiān)控總結

        完整的監(jiān)控系統(tǒng),需要對業(yè)務有詳盡的了解,軟件只是手段。

        來自:知乎,作者:聆聽幸福

        鏈接:https://zhuanlan.zhihu.com/p/342809838


        End

        《華為工程師Linux核心筆記》高清版.pdf

        ●?數據庫整理合集:含MySQL、Redis、Mongodb等常見數據庫教程

        ●?142道Linux面試題【務必拿走】

        ●?別讓運維太忙,一文詳解 Ansible 的自動化運維,提高工作效率



        點個在看你最好看


        瀏覽 71
        點贊
        評論
        收藏
        分享

        手機掃一掃分享

        分享
        舉報
        評論
        圖片
        表情
        推薦
        點贊
        評論
        收藏
        分享

        手機掃一掃分享

        分享
        舉報
        1. <strong id="7actg"></strong>
        2. <table id="7actg"></table>

        3. <address id="7actg"></address>
          <address id="7actg"></address>
          1. <object id="7actg"><tt id="7actg"></tt></object>
            狠狠擼成人AV | 亚洲91无码乱人伦了在线看观 | 久热99 | 亚洲精品电影院 | 公交车上荫蒂添的过程 | 调教打屁股沟羞耻扒开双男视频 | 欧美成人精品三级网站 | 王雨纯裸体 | 蜜桃av色偷偷av老熟女 | 亚洲影音先锋 |