[心得] 自動化監控網站運行服務 - Gatus

軟工

1080

部落格: https://bit.ly/docker-gatus
影片: https://www.youtube.com/watch?v=Fdgp3NpsPIs


## 前言

不知道大家在部署網站後,怎麼明確讓大家清楚知道現在網站的運行狀況,就像 GitHub
就是提供整體運行的網頁,監控常用的操作指令,像是 Git Operations, Webhooks 或
GitHub Actions 等服務狀況。讓開發者遇到問題的時候,可以即時查看現在狀態做出相
對應動作。而類似這樣的線上服務很多,像是 Atlassian 的 Statuspage 或 PingPong
等,更多免費服務可以直接參考 awesome-status-pages。而本篇要介紹一套開源軟體
Gatus,它是用 Go 語言撰寫出來的,非常輕量。

## 什麼是 Gatus

Gatus 提供一個輕量的監控服務健康網頁,讓開發者透過簡單的 HTTP, ICMP, TCP 等
Protocol 來監控服務狀況,並且根據網頁回應的 Status Code 或 Response time 及
Body 內容來決定網站是否健康,如果發生異常,可以設定不同的 Alert 像是 Slack,
Email, Teams, Discord 或 Telegram 等常用的即時軟體。可以參考此連結看看
Dashboard 實際狀況。

## 為什麼選擇 Gatus

> Why would I use Gatus when I can just use Prometheus, Alertmanager,
Cloudwatch or even Splunk?

第一點各位開發者可以想看看,如何監控整個服務的狀況,而不是等到客戶遇到問題,你
才知道狀況的發生。而 Gatus 可以從客戶角度對每個功能進行配置檢查,團隊可以根據
重要的服務或接口進行監控,即時數據整理,才可以讓團隊比客戶更早知道狀況。

第二點團隊可以想看看,如果從 Prometheus 開始入手,是不是門檻過高,團隊真的有多
餘的時間跟人力可以做到完整的監控,用 Prometheus + Alert 到 Grafana 監控頁面,
需要花費不少時間跟人力才能完成,而這些指標,真的是客戶想看到的嗎?以及是否可以
正確收到警報,這些配置都需要層層關卡,而 Gatus 透過簡單的設定,讓團隊可以快速
監控整個服務,即時的通知設定,都可以在幾個小時內完成。

## 心得

我選擇此套原因就是簡單設定跟方便部署,除了監控網站服務之外,測試團隊其實可以拿
這套,去寫大量的測試監控所有服務及效能,光是這點就可以替團隊省下不少時間做測試
。另外每個服務還可以看到 response time 結果。

中間省略一段安裝及使用說明,詳細可以參考部落格: https://bit.ly/docker-gatus

--
AppleBoy Blog: http://blog.wu-boy.com

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.254.168.131 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1648334853.A.2B4.html
safe1樓老闆最在意的免費要嗨賴起來呀 03/27 09:52
ss8651twtw2樓實用推 03/27 11:06
ptta3樓感謝分享 03/27 15:22
OrzOGC4樓免錢的最貴啊 03/27 15:27
jamo5樓免費真的最貴~ 03/27 18:02
BignoZe6樓免錢的最貴不是這樣用的啦XD 03/27 18:24
roccqqck7樓實用 03/27 22:09
Esh8樓目前用Zabbix達到同樣目的 03/28 00:07
superpandal9樓現在一堆人賴以爲生的都是免費的 經驗有延續值得 沒 03/28 01:48
superpandal10樓有遇到了被就轟炸 XD 03/28 01:50
s5150711樓推分享 03/31 21:01
更多心得
[心得] Java後端面試心得分享
[心得] MIT 6.824 lab心得
[心得] 無禮但又好笑的視訊面試(對方消失)
[心得] 產品經理面試經驗分享
[心得] Android-幣安/熊貓/Funnow/Crypto.com
[心得] 非本科半年面試心得多間
[心得] Shopback MLE 工作一年半分享
[心得] 2021 CV/ ML 面試心得