تجاوز إلى المحتوى الرئيسي

خدمة 5.10 · بنية تحتية

لا تعتمد على شكوى العميل لاكتشاف العطل

فحص كل 30 دقيقة، تعافي تلقائي، تنبيهات ذكية. النظام يكتشف نفسه قبل أن يكتشفه أحد.

TL;DR — طبقة مراقبة تأتي مع كل منظومة نُسلّمها — فحص كل 30 دقيقة، تعافي تلقائي للأعطال العابرة، تنبيهات ذكية (بريد HTML + WhatsApp) بعد 3 محاولات فاشلة فقط، واحترام لأوقات العمل. قاعدتنا: النظام الذي لا يخبرك أنه معطّل أسوأ من عدم وجوده.

ما الفرق بين مراقبة سلبية وذاتية؟

جدول مقارنة بين المراقبة السلبية والذاتية
الجانب سلبية ذاتية (نحن)
اكتشاف العطل حين يشتكي عميل فحص كل 30 دقيقة
الاستجابة تدخّل بشري بعد ساعات Restart تلقائي ثم re-check
التنبيهات لو وصلت أصلاً بريد HTML احترافي بعد 3 محاولات
Spam protection 100 تنبيه لعطل واحد تنبيه كل 4 ساعات كحد أقصى
Time awareness تنبيه في عطلات ذكي — لا إنذار 3ص خارج العمل
تاريخ واي كرييشنز غير موجود State table في DB

ما الذي نراقبه فعلياً؟

  • Connection Status

    اتصال
    open/closed/error

    فحص حالة الاتصال بـ WhatsApp provider كل 30 دقيقة. تمييز بين disconnected مؤقت وفعلي.

    النتيجة: اكتشاف قبل ساعة من العميل.

  • Message Activity

    نشاط
    consecutive_no_messages

    هل انقطع تدفّق الرسائل بلا سبب؟ مقارنة بالمتوسط التاريخي لهذا الوقت من اليوم.

    النتيجة: انحراف إحصائي مكتشَف.

  • Time-aware Alerts

    ذكاء
    business hours

    عطلة يوم الجمعة؟ عطلة رسمية؟ بعد ساعات العمل؟ النظام يعرف ولا يُزعج بلا داع.

    النتيجة: صفر تنبيهات مزعجة.

ما القدرات الجوهرية؟

  • فحص دوري كل 30 دقيقة

    مهمّة دورية تُشغّل عملية الفحص. 48 فحص يومي لكل منظومة. سجل كامل لكل فحص في قاعدة البيانات.

  • Escalation ذكي

    Restart تلقائي → انتظار 30 ثانية → re-check. فقط بعد 3 محاولات فاشلة متتالية يُرسَل تنبيه بشري.

  • بريد HTML عربي احترافي

    تنبيه ليس plain text — بريد مُنسَّق بالهوية البصرية، خطوات التعافي، لقطة من الـ logs، رابط للوحة المراقبة.

  • Anti-Spam 4-hour window

    لا بريد جديد إلا بعد 4 ساعات من آخر تنبيه. يمنع إزعاج الفريق عند تكرار نفس المشكلة في وقت قصير.

  • Time & Holiday Awareness

    تقويم ساعات العمل + العطلات الرسمية السعودية. تنبيه critical يُرسَل دائماً، لكن info ينتظر ليوم العمل التالي.

  • State Persistence

    كل منظومة لها سجل حالة (consecutive_no_messages، last_email_sent_at، last_status). القرارات تعتمد على التاريخ لا الحاضر فقط.

كيف تعمل عملية الفحص؟

  1. Cron Trigger

    كل 30 دقيقة، عملية الفحص تُستدعى تلقائياً. 48 فحصاً يومياً لكل منظومة مُراقَبة.

  2. Connection Check

    استعلام WhatsApp provider API: هل الاتصال open؟ closed؟ error؟

  3. Activity Check

    استعلام Postgres: عدد الرسائل في آخر 30 دقيقة. مقارنة بالمتوسط التاريخي.

  4. Time Awareness

    فحص الساعة الحالية مقابل business hours + holidays. تحديد نوع التنبيه المناسب.

  5. Escalation Logic

    لو فشل: Restart تلقائي → wait 30s → re-check. تسجيل المحاولة في state table.

  6. Threshold Check

    بعد 3 محاولات فاشلة متتالية + آخر تنبيه > 4 ساعات = تنبيه بشري.

  7. HTML Email

    بناء بريد احترافي: الحالة، آخر الأحداث، خطوات التعافي المُجرَّبة، link للوحة.

  8. State Update

    تحديث last_email_sent_at، last_status، consecutive_no_messages في DB.

الأثر

جدول الأثر — المقاييس قبل وبعد المراقبة الذاتية
المقياس قبل بعد
وقت اكتشاف العطل ساعات (شكوى العميل) دقائق (الفحص التلقائي)
التنبيهات الكاذبة 10-20% من الوقت قريب من الصفر
التعافي التلقائي لا يوجد أغلب الأعطال العابرة تُحَلّ
ساعات متابعة الفريق 1-2 ساعة يومياً <15 دقيقة

أسئلة شائعة عن المراقبة الذاتية

لماذا كل 30 دقيقة وليس كل دقيقة؟

فحص كل دقيقة = 1440 فحص يومياً لكل منظومة — عبء على APIs ومكلف. 30 دقيقة = 48 فحصاً يومياً، وهو كافٍ لاكتشاف الأعطال قبل 99% من الحالات الحرجة. لأنظمة مالية real-time، نُقلّل إلى 5 دقائق.

ما معنى «Self-Healing»؟ هل يعالج كل الأعطال؟

لا. Self-Healing يعالج الأعطال العابرة: connection timeout، rate limit مؤقت، memory leak خفيف. الأعطال البنيوية (API تغيّر، DB عطل) تتطلّب تدخّل بشري. الهدف: 80% من الأعطال تُحَلّ تلقائياً.

كم تكلفة تشغيل طبقة المراقبة؟

~$5-20 شهرياً لكل منظومة مُراقَبة. تكلفة API calls للفحوصات + Email (SMTP أو SendGrid).

هل تعمل على منظومات غير مبنيّة لديكم؟

نعم، بشروط. نحتاج API للنظام نُراقبه (health check endpoint). نبني طبقة المراقبة منفصلة عن النظام. تعاملنا مع أنظمة خارجية (Salesforce، ERP قديم) بنفس النمط.

ماذا لو لم يَرَ أحد البريد الإلكتروني؟

التصعيد: لو لم يُفتح البريد خلال ساعة (Gmail read receipt أو tracking pixel)، يُرسَل تنبيه WhatsApp للمسؤول الأول. ثم بعد ساعة، للمسؤول الثاني (escalation chain).

كم يستغرق تركيب طبقة المراقبة؟

1-2 أسبوع. معظم الوقت في Discovery: ما المنظومات التي نُراقب؟ ما الـ health checks المطلوبة؟ مَن يستقبل التنبيهات؟ البناء نفسه أسرع — قوالب جاهزة نُكيّفها.

لديك مهام متكرّرة أو تأخذ وقتاً طويلاً؟

احجز جلسة مجانية (45 دقيقة). نخرج منها بتقدير واضح: هل الأتمتة تستحق الاستثمار، وكم ستوفر، وفي كم أسبوع.