رقمنة المستندات الحكومية
وزارة حكومية مسؤولة عن خدمات المواطنين كانت تعالج آلاف المستندات يوميًا من خلال إدخال بيانات يدوي. شهادات الميلاد وطلبات الهوية وتسجيلات العقارات وطلبات التصاريح كلها تتطلب من الموظفين قراءة المستندات الورقية واستخراج البيانات وإدخالها في أنظمة قديمة متعددة. بنينا خط معالجة مستندات ذكي أتمت الاستخراج والتحقق والتوجيه.
The Challenge
كانت الوزارة تعالج متوسط 8,000 مستند يوميًا عبر مكاتبها الإقليمية. كل مستند يمر عبر موظفين متعددين يقرأون ويصنفون ويستخرجون البيانات ويتحققون منها مقابل السجلات الحالية ويدخلونها في قاعدة البيانات الحكومية المناسبة. كانت العملية بطيئة ومعرّضة للأخطاء وتخلق تراكمات كبيرة خلال فترات الذروة.
- متوسط وقت معالجة المستند 25 دقيقة لكل مستند، مع الحالات المعقدة تستغرق أكثر من ساعة
- معدل خطأ إدخال البيانات 8-12% يتطلب إعادة عمل وتصحيحات
- المستندات تصل بصيغ غير متسقة: نماذج مطبوعة وطلبات مكتوبة بخط اليد ونسخ ممسوحة ضوئيًا وصور
- نصوص عربية وإنجليزية تظهر على نفس المستندات، أحيانًا مختلطة ضمن نفس الحقل
- أكثر من 40 نوع مستند مختلف بتخطيطات ومتطلبات بيانات متنوعة
- أنظمة خلفية قديمة بوصول محدود لـ API تتطلب تكاملاً على مستوى الشاشة لبعض إدخال البيانات
- متطلبات صارمة لسيادة البيانات تفرض أن تتم جميع المعالجة على بنية تحتية حكومية
Our Solution
صممنا خط معالجة مستندات متعدد المراحل يجمع بين الرؤية الحاسوبية ومعالجة اللغة الطبيعية وتصنيف تعلم الآلة للتعامل مع الطيف الكامل من أنواع المستندات التي تستقبلها الوزارة.
المرحلة الأولى كانت استيعاب المستندات ومعالجتها المسبقة. تدخل المستندات النظام عبر ماسحات ضوئية عالية السرعة في المكاتب الإقليمية أو من خلال رفع رقمي. وحدة المعالجة المسبقة تعالج تصحيح الصور (تعديل الانحراف وتعديل التباين وإزالة الضوضاء) لتعظيم دقة OCR بغض النظر عن جودة المستند المصدر.
المرحلة الثانية كانت التصنيف وOCR. درّبنا مصنف مستندات مبنيًا على TensorFlow على أكثر من 40 نوع مستند بالوزارة، محققين دقة تصنيف 97.5%. بعد التصنيف، يطبق النظام قوالب OCR خاصة بنوع المستند تعرف الحقول المتوقعة وأماكنها. للنصوص المكتوبة بخط اليد، استخدمنا نموذجًا متخصصًا للتعرف على الكتابة العربية بخط اليد مُضبط على 50,000 عينة مُصنَّفة من أرشيف الوزارة.
المرحلة الثالثة كانت استخراج البيانات والتحقق منها. الحقول المستخرجة تُتحقق مقابل قواعد العمل (فحص صيغ التاريخ ومجاميع أرقام الهوية والمراجعة التبادلية مقابل سجلات المواطنين في قاعدة البيانات). المستندات التي تجتاز التحقق تُدخل تلقائيًا في أنظمة الخلفية المناسبة. المستندات ذات الاستخراجات منخفضة الثقة أو فشل التحقق تُوجَّه لطابور مراجعة بشرية مع أفضل تخمين للذكاء الاصطناعي مُعبأ مسبقًا للتصحيح السريع.
بُني النظام بالكامل على .NET لطبقة التنسيق ونُشر على البنية التحتية السحابية الخاصة بالحكومة. صممنا البنية لمعالجة المستندات بالتوازي عبر عقد عاملة متعددة، مع تخزين PostgreSQL لحالة المعالجة وسجلات التدقيق ومقاييس الأداء.
Results & Impact
- 10,000+ — مستند يُعالج يوميًا
- 85% — تخفيض في وقت المعالجة
- 2.1% — معدل الخطأ (من 8-12%)
- 60% — من الموظفين أُعيد نشرهم لمهام أعلى قيمة
زاد الخط الآلي قدرة المعالجة اليومية من 8,000 إلى أكثر من 10,000 مستند مع تقليل متوسط وقت المعالجة من 25 دقيقة إلى أقل من 4 دقائق لكل مستند. المستندات التي تمر بالمعالجة الآلية بالكامل (حوالي 72% من جميع الطلبات) تكتمل في أقل من 90 ثانية بدون تدخل بشري.
انخفض معدل خطأ إدخال البيانات من 8-12% إلى 2.1%، مع بقاء الأخطاء تحدث بشكل رئيسي في مسح المستندات المتدهورة بشدة التي تتحدى حتى القراء البشريين. طابور المراجعة البشرية يتعامل مع الـ28% من المستندات التي تتطلب اهتمامًا، لكن المراجعين يعملون مع بيانات مُعبأة مسبقًا واقتراحات ذكاء اصطناعي بدلاً من البدء من نماذج فارغة.
سمحت مكاسب الكفاءة للوزارة بإعادة نشر 60% من موظفي إدخال البيانات لأدوار خدمة مواطنين مباشرة، مما حسّن تجربة الخدمة الإجمالية. انخفضت أوقات انتظار المواطنين لمعالجة المستندات من متوسط 5 أيام عمل إلى إتمام في نفس اليوم لمعظم أنواع المستندات. وسّعت الوزارة النظام منذ ذلك الحين لثلاث إدارات إضافية.
Tech Stack
“This system has transformed our citizen services. What used to take days now takes minutes. The accuracy improvement alone has saved us thousands of hours of correction and reprocessing work. Our staff are now serving citizens directly instead of typing data into screens.”