הגדרת Uptime Monitoring עם BetterStack
סקירה כללית
Agentix מספקת endpoint בשם/health שבודק חיבור ל-PostgreSQL ול-Redis. המטרה היא להגדיר ניטור חיצוני דרך BetterStack שיזהה השבתות ויתריע מהר.
1. דרישות מוקדמות
- חשבון BetterStack
- URL ציבורי של ה-API, למשל
https://api.agentix.app - כתובות אימייל של מקבלי ההתראות
2. יצירת Monitor
ב-BetterStack:- עברו אל Monitors
- לחצו על Create Monitor
- הגדירו:
| שדה | ערך |
|---|---|
| Monitor type | HTTP(s) |
| URL | https://api.agentix.app/health |
| Check frequency | כל 60 שניות |
| Method | GET |
| Expected status code | 200 |
| Confirmation period | 2 checks |
| Timeout | 10 seconds |
3. הגדרת Email Alerts
- עברו אל On-call > People
- הוסיפו את חברי הצוות
- עברו אל Escalation policies
- קשרו את המדיניות ל-monitor
4. Slack Alerts אופציונליים
- עברו ל-Integrations
- חברו Slack workspace
- הוסיפו שלב במדיניות ההסלמה
5. Status Page אופציונלי
אפשר ליצור status page ציבורי:- עברו אל Status pages
- צרו דף חדש
- חברו אליו את monitor ה-API
6. אימות
לאחר ההגדרה:- המתינו לכמה בדיקות
- ודאו שה-monitor מסומן כ-Up
- בדקו גרף זמני תגובה
בדיקת התראות מקצה לקצה
- החליפו זמנית את ה-URL למסלול שגוי
- המתינו לשתי בדיקות כושלות
- ודאו שהתקבלה התראה
- החזירו את ה-URL ל-
/health
7. Checklist
- monitor פעיל
- תדירות הבדיקה תקינה
- expected status code הוא 200
- escalation policy מחוברת
- התקבלה התראת בדיקה
- אם קיים status page, הוא זמין
8. פתרון תקלות
| בעיה | בדיקה |
|---|---|
| monitor מסמן Down אבל ה-app עובד | בדקו CORS, auth, firewall ו-DNS |
| לא מתקבלות התראות | בדקו spam, המדיניות המחוברת וכתובות האימייל |
/health לא תקין | בדקו DB, Redis ולוגי API |