logo

ما هو CRISP في استخراج البيانات؟

يرمز CRISP-DM إلى العملية القياسية عبر الصناعة لاستخراج البيانات. توفر منهجية CRISP-DM نهجا منظما لتخطيط مشروع استخراج البيانات. إنها منهجية قوية ومثبتة جيدًا. نحن لا ندعي أي ملكية عليه. نحن لم نخترعه نحن نعمل على تحويل التطبيق العملي القوي والمرونة والفائدة عند استخدام التحليلات لحل مشكلات العمل. إنه الخيط الذهبي الذي يمر عبر كل اجتماع مع العميل تقريبًا.

هذا النموذج هو تسلسل مثالي للأحداث. من الناحية العملية، يمكن تنفيذ العديد من المهام بترتيب مختلف، وسيكون من الضروري غالبًا الرجوع إلى المهام السابقة وتكرار إجراءات معينة. لا يحاول النموذج التقاط جميع الطرق الممكنة من خلال عملية استخراج البيانات.

كيف تساعد تقنية CRISP؟

يوفر CRISP DM خريطة طريق، ويمنحك أفضل الممارسات، ويوفر هياكل للحصول على نتائج أفضل وأسرع لاستخدام التنقيب عن البيانات، وبالتالي فهو يساعد الشركة على المتابعة أثناء التخطيط لمشروع التنقيب عن البيانات وتنفيذه.

مراحل CRISP-DM

يوفر CRISP-DM نظرة عامة على دورة حياة استخراج البيانات كنموذج للعملية. يتكون نموذج دورة الحياة من ست مراحل، مع وجود أسهم تشير إلى التبعيات الأكثر أهمية والمتكررة بين المراحل. تسلسل المراحل ليس صارما. وتتحرك معظم المشاريع ذهابًا وإيابًا بين المراحل حسب الضرورة. يتميز نموذج CRISP-DM بالمرونة ويمكن تخصيصه بسهولة.

على سبيل المثال، إذا كانت مؤسستك تهدف إلى اكتشاف عمليات غسيل الأموال، فمن المحتمل أن تقوم بتدقيق كميات كبيرة من البيانات دون هدف محدد للنمذجة. بدلاً من النمذجة، سيركز عملك على استكشاف البيانات وتصورها للكشف عن الأنماط المشبوهة في البيانات المالية. يتيح لك CRISP-DM إنشاء نموذج لاستخراج البيانات يناسب احتياجاتك.

ويتضمن وصفًا للمراحل النموذجية للمشروع، والمهام المتضمنة في كل مرحلة، وشرحًا للعلاقات بين هذه المهام.

ما هو CRISP في استخراج البيانات

المرحلة الأولى: فهم الأعمال

المرحلة الأولى من عملية CRISP-DM هي فهم ما تريد تحقيقه من منظور الأعمال. قد يكون لدى مؤسستك أهداف وقيود متنافسة يجب أن تكون متوازنة بشكل صحيح. تهدف مرحلة العملية هذه إلى الكشف عن العوامل المهمة التي تؤثر على نتائج المشروع. إن إهمال هذه الخطوة قد يعني بذل الكثير من الجهد لإنتاج الإجابات الصحيحة للأسئلة الخاطئة.

ما هي المخرجات المرجوة من المشروع؟

    حدد أهداف:صف هدفك الأساسي من منظور الأعمال. قد تكون هناك أيضًا أسئلة أخرى ذات صلة تود ذكرها. على سبيل المثال، قد يكون هدفك الأساسي هو الحفاظ على العملاء الحاليين من خلال التنبؤ بالوقت الذي يكونون فيه عرضة للانتقال إلى منافس.إنتاج خطة المشروع:وصف الخطة لتحقيق أهداف استخراج البيانات والأعمال. يجب أن تحدد الخطة الخطوات التي سيتم تنفيذها خلال بقية المشروع، بما في ذلك الاختيار الأولي للأدوات والتقنيات.معايير نجاح الأعمال:هنا، ستضع المعايير التي ستستخدمها لتحديد ما إذا كان المشروع ناجحًا من وجهة نظر الأعمال. وينبغي أن تكون هذه الأمور محددة وقابلة للقياس، على سبيل المثال، تقليل إيقاع العملاء إلى مستوى معين. ومع ذلك، في بعض الأحيان قد يكون من الضروري وجود معايير أكثر ذاتية، مثل إعطاء رؤى مفيدة حول العلاقات.

تقييم الوضع الحالي

المؤشرات في ج

يتضمن ذلك تقصي حقائق أكثر تفصيلاً حول الموارد والقيود والافتراضات والعوامل الأخرى التي ستحتاج إلى أخذها في الاعتبار عند تحديد هدف تحليل البيانات وخطة المشروع.

    جرد الموارد:قم بإدراج الموارد المتاحة للمشروع، بما في ذلك:
    • الموظفون (خبراء الأعمال، خبراء البيانات، الدعم الفني، خبراء استخراج البيانات)
    • البيانات (مقتطفات ثابتة، الوصول إلى البيانات الحية أو المخزنة أو التشغيلية)
    • موارد الحوسبة (منصات الأجهزة)
    • البرمجيات (أدوات استخراج البيانات، والبرامج الأخرى ذات الصلة)
    المتطلبات والافتراضات والقيود:قم بإدراج جميع متطلبات المشروع، بما في ذلك الجدول الزمني للإنجاز، والشمولية المطلوبة وجودة النتائج، وأي مخاوف تتعلق بأمن البيانات والمسائل القانونية. تأكد من أنه مسموح لك باستخدام البيانات. قائمة الافتراضات التي قدمها المشروع. قد تكون هذه افتراضات حول البيانات التي يمكن التحقق منها أثناء التنقيب في البيانات ولكنها قد تتضمن أيضًا افتراضات غير قابلة للتحقق حول الأعمال المتعلقة بالمشروع. ومن المهم إدراج هذه الأخيرة إذا كانت تؤثر على صحة النتائج. اذكر القيود المفروضة على المشروع. قد تكون هذه قيودًا على توافر الموارد ولكنها قد تشمل أيضًا قيودًا تكنولوجية مثل حجم مجموعة البيانات التي من العملي استخدامها للنمذجة.المخاطر والطوارئ:قم بإدراج المخاطر أو الأحداث التي قد تؤخر المشروع أو تتسبب في فشله. قم بإدراج خطط الطوارئ المقابلة، مثل ما الإجراء الذي ستتخذه في حالة حدوث هذه المخاطر أو الأحداث؟المصطلح:قم بتجميع مسرد للمصطلحات ذات الصلة بالمشروع. سيتكون هذا بشكل عام من مكونين:
    • يشكل مسرد مصطلحات الأعمال ذات الصلة جزءًا من فهم الأعمال المتاح للمشروع. يعد إنشاء هذا المسرد تمرينًا مفيدًا في 'استخلاص المعرفة' والتمرين التعليمي.
    • يتم توضيح مسرد مصطلحات استخراج البيانات مع الأمثلة ذات الصلة بمشكلة العمل.
    التكاليف والفوائد:قم بإنشاء تحليل التكلفة والعائد للمشروع، والذي يقارن تكاليف المشروع بالفوائد المحتملة للشركة إذا نجح. يجب أن تكون هذه المقارنة محددة قدر الإمكان. على سبيل المثال، يجب عليك استخدام التدابير المالية في الوضع التجاري.

تحديد أهداف استخراج البيانات

ينص هدف العمل على الأهداف في مصطلحات الأعمال. ينص هدف استخراج البيانات على أهداف المشروع من الناحية الفنية. على سبيل المثال، قد يكون هدف العمل هو زيادة مبيعات الكتالوج للعملاء الحاليين. قد يكون هدف استخراج البيانات هو التنبؤ بعدد الأدوات التي سيشتريها العميل، مع الأخذ في الاعتبار مشترياته على مدى السنوات الثلاث الماضية، والمعلومات الديموغرافية (العمر، الراتب، المدينة، وما إلى ذلك)، وسعر العنصر.

    معايير نجاح الأعمال:فهو يصف المخرجات المقصودة للمشروع والتي تمكن من تحقيق أهداف العمل.معايير نجاح التنقيب عن البيانات:فهو يحدد معايير نتيجة المشروع الناجح. على سبيل المثال، مستوى معين من الدقة التنبؤية أو ملف تعريف الميل إلى الشراء بدرجة معينة من 'الرفع'. كما هو الحال مع معايير نجاح الأعمال، قد يكون من الضروري وصفها بعبارات ذاتية، وفي هذه الحالة يجب تحديد الشخص أو الأشخاص الذين يصدرون الحكم الذاتي.

إنتاج خطة المشروع

وصف الخطة المقصودة لتحقيق أهداف استخراج البيانات وأهداف العمل. يجب أن تحدد خطتك الخطوات التي يجب تنفيذها خلال بقية المشروع، بما في ذلك الاختيار الأولي للأدوات والتقنيات.

1. خطة المشروع: قم بإدراج المراحل التي سيتم تنفيذها في المشروع، مع مدتها والموارد المطلوبة والمدخلات والمخرجات والتبعيات. حيثما أمكن، حاول توضيح التكرارات واسعة النطاق في عملية استخراج البيانات، على سبيل المثال، تكرار مرحلتي النمذجة والتقييم.

كجزء من خطة المشروع، من المهم تحليل التبعيات بين الجداول الزمنية والمخاطر. ضع علامة على نتائج هذه التحليلات بشكل واضح في خطة المشروع، ومن الأفضل أن تكون مع الإجراءات والتوصيات إذا ظهرت المخاطر. قرر استراتيجية التقييم التي سيتم استخدامها في مرحلة التقييم.

خوارزمية لbfs

ستكون خطة مشروعك وثيقة ديناميكية. وفي نهاية كل مرحلة، ستقوم بمراجعة التقدم والإنجازات وتحديث خطة المشروع وفقًا لذلك. يجب أن تكون نقاط المراجعة المحددة لهذه التحديثات جزءًا من خطة المشروع.

2. التقييم الأولي للأدوات والتقنيات: في نهاية المرحلة الأولى، يجب عليك إجراء تقييم أولي للأدوات والتقنيات. على سبيل المثال، يمكنك تحديد أداة استخراج البيانات التي تدعم أساليب مختلفة لمراحل مختلفة من العملية. من المهم تقييم الأدوات والتقنيات في وقت مبكر من العملية لأن اختيار الأدوات والتقنيات قد يؤثر على المشروع بأكمله.

المرحلة الثانية: فهم البيانات

تتطلب المرحلة الثانية من عملية CRISP-DM منك الحصول على البيانات المدرجة في موارد المشروع. تتضمن هذه المجموعة الأولية تحميل البيانات إذا كان ذلك ضروريًا لفهم البيانات. على سبيل المثال، إذا كنت تستخدم أداة محددة لفهم البيانات، فمن المنطقي تمامًا تحميل بياناتك في هذه الأداة. إذا حصلت على مصادر بيانات متعددة، فأنت بحاجة إلى التفكير في كيفية ومتى ستقوم بدمجها.

    تقرير جمع البيانات الأولي:قم بإدراج مصادر البيانات التي تم الحصول عليها ومواقعها وطرق الحصول عليها وأي مشاكل تمت مواجهتها. قم بتسجيل المشكلات التي واجهتها وأي حلول تم تحقيقها. سيساعد ذلك في تكرار هذا المشروع في المستقبل وتنفيذ مشاريع مستقبلية مماثلة.

وصف البيانات

فحص الخصائص 'الإجمالية' أو 'السطحية' للبيانات المكتسبة وتقديم تقرير عن النتائج.

    تقرير وصف البيانات:وصف البيانات التي تم الحصول عليها، بما في ذلك شكلها وكميتها وهويات الحقول وأي ميزات سطحية أخرى تم اكتشافها. تقييم ما إذا كانت البيانات التي تم الحصول عليها تلبي متطلباتك.

استكشاف البيانات

خلال هذه المرحلة، ستتعامل مع أسئلة استخراج البيانات باستخدام تقنيات الاستعلام وتصور البيانات وإعداد التقارير. قد تشمل هذه:

  • توزيع السمات الرئيسية
  • العلاقات بين أزواج أو أعداد صغيرة من السمات
  • نتائج التجميعات البسيطة
  • خصائص المجموعات السكانية الفرعية الهامة
  • تحليلات إحصائية بسيطة

قد تتناول هذه التحليلات أهداف التنقيب عن البيانات بشكل مباشر. قد يساهمون في وصف البيانات وتقارير الجودة أو تحسينها ويغذون عملية التحويل وخطوات إعداد البيانات الأخرى اللازمة لمزيد من التحليل.

    تقرير استكشاف البيانات:قم بوصف نتائج استكشاف البيانات الخاصة بك، بما في ذلك النتائج الأولى أو الفرضية الأولية وتأثيرها على بقية المشروع. إذا كان ذلك مناسبًا، يمكنك تضمين الرسوم البيانية والمخططات هنا للإشارة إلى خصائص البيانات التي تقترح مزيدًا من الفحص لمجموعات فرعية مثيرة للاهتمام من البيانات.

التحقق من جودة البيانات

فحص جودة البيانات، والإجابة على أسئلة مثل:

مرحبا بالعالم جافا
  • هل البيانات كاملة أم أنها تغطي كافة الحالات المطلوبة؟
  • هل هي صحيحة أم أنها تحتوي على أخطاء، وإذا كانت هناك أخطاء فما مدى شيوعها؟
  • هل هناك قيم مفقودة في البيانات؟ إذا كان الأمر كذلك، فكيف يتم تمثيلها، وأين تحدث، وما مدى شيوعها؟

تقرير جودة البيانات

قائمة نتائج التحقق من جودة البيانات. في حالة وجود مشاكل في الجودة، اقترح الحلول الممكنة. تعتمد حلول مشكلات جودة البيانات عمومًا بشكل كبير على البيانات والمعرفة التجارية.

المرحلة 3: إعداد البيانات

في مرحلة المشروع هذه، عليك أن تقرر البيانات التي ستستخدمها للتحليل. تتضمن المعايير التي قد تستخدمها لاتخاذ هذا القرار مدى ملاءمة البيانات لأهداف استخراج البيانات، وجودة البيانات، والقيود الفنية مثل القيود المفروضة على حجم البيانات أو أنواع البيانات.

    الأساس المنطقي للإدراج / الاستبعاد:قم بإدراج البيانات المطلوب تضمينها/استبعادها وأسباب هذه القرارات.

تنظيف البيانات الخاصة بك

تتضمن هذه المهمة رفع جودة البيانات إلى المستوى الذي تتطلبه تقنيات التحليل التي حددتها. وقد يتضمن ذلك اختيار مجموعات فرعية نظيفة من البيانات، أو إدراج افتراضات مناسبة، أو تقنيات أكثر طموحًا مثل تقدير البيانات المفقودة عن طريق النمذجة.

    تقرير تنظيف البيانات:قم بوصف القرارات والإجراءات التي اتخذتها لمعالجة مشكلات جودة البيانات. ضع في اعتبارك أي تحويلات للبيانات تم إجراؤها لأغراض التنظيف وتأثيرها المحتمل على نتائج التحليل.

بناء البيانات المطلوبة

تتضمن هذه المهمة عمليات إعداد البيانات البناءة مثل إنتاج السمات المشتقة أو السجلات الجديدة بالكامل أو القيم المحولة للسمات الموجودة.

    السمات المشتقة:هذه سمات جديدة تم إنشاؤها من سمة واحدة أو أكثر موجودة في نفس السجل. على سبيل المثال، يمكنك استخدام متغيري الطول والعرض لحساب متغير جديد للمساحة.السجلات التي تم إنشاؤها:هنا، يمكنك وصف إنشاء أي سجلات جديدة تمامًا. على سبيل المثال، قد تحتاج إلى إنشاء سجلات للعملاء الذين لم يقوموا بالشراء خلال العام الماضي. ولم يكن هناك سبب لوجود مثل هذه السجلات في البيانات الأولية. ومع ذلك، قد يكون من المنطقي الإشارة إلى أن عملاء محددين لم يجروا أي عمليات شراء بشكل صريح لأغراض عرض الأزياء.

دمج البيانات

تجمع هذه الطرق المعلومات من قواعد بيانات أو جداول أو سجلات متعددة لإنشاء سجلات أو قيم جديدة.

    البيانات المدمجة:يشير دمج الجداول إلى ضم جدولين أو أكثر بمعلومات مختلفة حول نفس الكائنات. على سبيل المثال، قد تحتوي سلسلة البيع بالتجزئة على جدول واحد يحتوي على معلومات حول الخصائص العامة لكل متجر (على سبيل المثال، مساحة الأرضية، ونوع المركز التجاري)، وجدول آخر يحتوي على بيانات مبيعات ملخصة (على سبيل المثال، الربح، ونسبة التغير في المبيعات عن العام السابق)، و آخر يحتوي على معلومات حول التركيبة السكانية للمنطقة المحيطة. يحتوي كل جدول من هذه الجداول على سجل واحد لكل مخزن. يمكن دمج هذه الجداول في جدول جديد بسجل واحد لكل مخزن، مع دمج الحقول من الجداول المصدر.التجمعات:التجميعات هي عمليات يتم فيها حساب القيم الجديدة عن طريق تلخيص المعلومات من سجلات أو جداول متعددة. على سبيل المثال، تحويل جدول مشتريات العملاء حيث سجل واحد لكل عملية شراء إلى جدول جديد وسجل واحد لكل عميل، مع حقول مثل عدد المشتريات، متوسط ​​مبلغ الشراء، النسبة المئوية للطلبات المحملة على بطاقة الائتمان، النسبة المئوية للأصناف تحت الترويج الخ

المرحلة الرابعة: النمذجة

تحديد تقنية النمذجة: كخطوة أولى، ستحدد تقنية النمذجة الأساسية التي ستستخدمها. على الرغم من أنك ربما تكون قد قمت بالفعل بتحديد أداة أثناء مرحلة فهم الأعمال، إلا أنه في هذه المرحلة، ستختار تقنية النمذجة المحددة، على سبيل المثال. بناء شجرة القرار باستخدام C5.0 أو إنشاء شبكة عصبية مع الانتشار الخلفي. إذا تم تطبيق تقنيات متعددة، قم بتنفيذ هذه المهمة بشكل منفصل لكل تقنية.

    تقنية النمذجة:توثيق تقنية النمذجة الأساسية التي سيتم استخدامها.افتراضات النمذجة:تضع العديد من تقنيات النمذجة افتراضات محددة حول البيانات، على سبيل المثال، أن جميع السمات لها توزيعات موحدة، ولا يُسمح بقيم مفقودة، ويجب أن تكون سمة الفئة رمزية وما إلى ذلك. قم بتسجيل أي افتراضات تم إجراؤها.

إنشاء تصميم الاختبار

قبل أن تقوم ببناء نموذج، تحتاج إلى إنشاء إجراء أو آلية لاختبار جودة النموذج وصلاحيته. على سبيل المثال، في مهام التنقيب عن البيانات الخاضعة للإشراف مثل التصنيف، من الشائع استخدام معدلات الخطأ كمقاييس الجودة لنماذج التنقيب عن البيانات. لذلك، عادةً ما تقوم بفصل مجموعة البيانات إلى مجموعات تدريب واختبار، وبناء النموذج على مجموعة القطار، وتقدير جودته على مجموعة اختبار منفصلة.

    تصميم الاختبار:وصف الخطة المقصودة للتدريب والاختبار وتقييم النماذج. أحد المكونات الأساسية للخطة هو تحديد كيفية تقسيم مجموعة البيانات المتاحة إلى مجموعات بيانات التدريب والاختبار والتحقق من الصحة.

بناء النموذج

قم بتشغيل أداة النمذجة على مجموعة البيانات المعدة لإنشاء نموذج واحد أو أكثر.

هي أمثلة نموذجية
    إعدادات المعلمة:باستخدام أي أداة للنمذجة، غالبًا ما يكون هناك عدد كبير من المعلمات التي يمكن تعديلها. قم بإدراج المعلمات وقيمها والأساس المنطقي لاختيار إعدادات المعلمة.عارضات ازياء:هذه هي النماذج التي تنتجها أداة النمذجة، وليس تقريرا عن النماذج.أوصاف النموذج:وصف النماذج الناتجة، والإبلاغ عن تفسير النماذج، وتوثيق أي صعوبات تواجه معانيها.

نموذج التقييم

قم بتفسير النماذج وفقًا لمعرفتك بالمجال الخاص بك، ومعايير نجاح استخراج البيانات، وتصميم الاختبار المطلوب. الحكم على مدى نجاح تطبيق تقنيات النمذجة والاكتشاف، ثم الاتصال بمحللي الأعمال وخبراء المجال لاحقًا لمناقشة نتائج استخراج البيانات في سياق الأعمال. تأخذ هذه المهمة في الاعتبار النماذج فقط، بينما تأخذ مرحلة التقييم أيضًا في الاعتبار جميع النتائج الأخرى التي تم إنتاجها خلال المشروع.

في هذه المرحلة يجب عليك ترتيب النماذج وتقييمها حسب معايير التقييم. يجب عليك أن تفكر في أهداف العمل ومعايير النجاح بقدر ما تستطيع هنا. في معظم مشاريع استخراج البيانات، يتم تطبيق تقنية واحدة أكثر من مرة، ويتم إنشاء نتائج استخراج البيانات باستخدام عدة تقنيات مختلفة.

    تقييم النموذج:تلخيص نتائج هذه المهمة، وسرد صفات النماذج التي تم إنشاؤها (على سبيل المثال، من حيث الدقة) وترتيب جودتها مع بعضها البعض.إعدادات المعلمة المنقحة:وفقًا لتقييم النموذج، قم بمراجعته وضبطه لتشغيل النمذجة التالي. كرر بناء النموذج وتقييمه حتى تؤمن بشدة أنك وجدت أفضل نموذج (نماذج). قم بتوثيق جميع هذه المراجعات والتقييمات.

المرحلة الخامسة: التقييم

تقييم نتائجك: خطوات التقييم السابقة تناولت عوامل مثل دقة وعمومية النموذج. خلال هذه الخطوة، ستقوم بتقييم مدى تلبية النموذج لأهداف عملك وستسعى إلى تحديد ما إذا كان هناك سبب تجاري وراء نقص هذا النموذج. هناك خيار آخر وهو اختبار النموذج على تطبيقات الاختبار في التطبيق الحقيقي إذا سمحت قيود الوقت والميزانية بذلك. تتضمن مرحلة التقييم أيضًا تقييم أي نتائج أخرى لاستخراج البيانات قمت بإنشائها. تتضمن نتائج استخراج البيانات نماذج ترتبط بالضرورة بأهداف العمل الأصلية وجميع النتائج الأخرى التي لا ترتبط بالضرورة بأهداف العمل الأصلية ولكنها قد تكشف أيضًا عن تحديات أو معلومات أو تلميحات إضافية للاتجاهات المستقبلية.

    تقييم نتائج استخراج البيانات:تلخيص نتائج التقييم في معايير نجاح الأعمال، بما في ذلك البيان النهائي بشأن ما إذا كان المشروع يلبي بالفعل أهداف العمل الأولية.النماذج المعتمدة:بعد تقييم النماذج لمعايير نجاح الأعمال، تصبح النماذج التي تم إنشاؤها والتي تلبي المعايير المحددة هي النماذج المعتمدة.

عملية الاستعراض

وفي هذه المرحلة، تبدو النماذج الناتجة مرضية وتلبي احتياجات العمل. من المناسب لك الآن إجراء مراجعة أكثر شمولاً لمشاركة استخراج البيانات لتحديد ما إذا كان هناك عامل أو مهمة مهمة تم التغاضي عنها بطريقة أو بأخرى. وتغطي هذه المراجعة أيضًا قضايا ضمان الجودة. على سبيل المثال: هل قمنا ببناء النموذج بشكل صحيح؟ هل استخدمنا فقط السمات المسموح لنا باستخدامها والمتاحة للتحليلات المستقبلية؟

    مراجعة العملية:قم بتلخيص مراجعة العملية وتسليط الضوء على الأنشطة التي تم تفويتها وتلك التي يجب تكرارها.

تحديد الخطوات التالية

أنت الآن تقرر كيفية المتابعة اعتمادًا على نتائج التقييم ومراجعة العملية. هل تنتهي من هذا المشروع وتنتقل إلى النشر، أو تبدأ المزيد من التكرارات، أو تقوم بإعداد مشاريع جديدة لاستخراج البيانات؟ يجب عليك أيضًا تقييم مواردك وميزانيتك المتبقية، مما قد يؤثر على قراراتك.

    قائمة الإجراءات المحتملة:قم بإدراج الإجراءات الإضافية المحتملة والأسباب المؤيدة والمعارضة لكل خيار.قرار:قم بوصف القرار الخاص بكيفية المتابعة، بالإضافة إلى الأساس المنطقي.

المرحلة 6: النشر

نشر الخطة: في مرحلة النشر، ستأخذ نتائج التقييم الخاصة بك وتحدد استراتيجية لنشرها. إذا تم تحديد إجراء عام لإنشاء النموذج (النماذج) ذي الصلة، فسيتم توثيق هذا الإجراء هنا للنشر لاحقًا. من المنطقي النظر في طرق ووسائل النشر أثناء مرحلة فهم الأعمال لأن النشر أمر بالغ الأهمية لنجاح المشروع. هذا هو المكان الذي تساعد فيه التحليلات التنبؤية على تحسين الجانب التشغيلي لشركتك.

    خطة النشر:قم بتلخيص استراتيجية النشر الخاصة بك، بما في ذلك الخطوات الضرورية وكيفية تنفيذها.

مراقبة الخطة وصيانتها

تعد المراقبة والصيانة من القضايا المهمة إذا أصبحت نتيجة استخراج البيانات جزءًا من الأعمال اليومية وبيئتها. يساعد الإعداد الدقيق لاستراتيجية الصيانة على تجنب فترات طويلة غير ضرورية من الاستخدام غير الصحيح لنتائج استخراج البيانات. يحتاج المشروع إلى خطة عملية مراقبة مفصلة لمراقبة نشر نتائج (نتائج) استخراج البيانات. تأخذ هذه الخطة في الاعتبار نوع النشر المحدد.

    خطة المراقبة والصيانة:تلخيص استراتيجية المراقبة والصيانة، بما في ذلك الخطوات اللازمة وكيفية تنفيذها.

إنتاج التقرير النهائي

في نهاية المشروع، سوف تكتب التقرير النهائي. اعتمادًا على خطة النشر، قد يكون هذا التقرير مجرد ملخص للمشروع وتجاربه (إذا لم يتم توثيقها بالفعل كنشاط مستمر)، أو قد يكون عرضًا نهائيًا وشاملاً لنتيجة استخراج البيانات.

    التقرير الأخير:هذا هو التقرير المكتوب النهائي لمشاركة استخراج البيانات. ويشمل جميع التسليمات السابقة، وتلخيص وتنظيم النتائج.العرض النهائي:غالبًا ما يكون هناك اجتماع بعد المشروع يتم فيه عرض النتائج على العميل.

مراجعة المشروع

تحويل سلسلة إلى كثافة العمليات

قم بتقييم ما حدث بشكل صحيح وما هو خطأ، وما تم القيام به بشكل جيد وما يحتاج إلى تحسين.

    توثيق الخبرة:تلخيص الخبرة الهامة المكتسبة خلال المشروع. على سبيل المثال، يمكن أن تتضمن هذه الوثائق أي مخاطر واجهتها، أو أساليب مضللة، أو تلميحات لاختيار تقنيات استخراج البيانات الأكثر ملاءمة في مواقف مماثلة. في المشاريع المثالية، يغطي توثيق الخبرة أيضًا أي تقارير كتبها أعضاء المشروع الفرديون خلال المراحل السابقة من المشروع.