يتم تعريف نموذج التعلم الآلي على أنه تمثيل رياضي لمخرجات عملية التدريب. التعلم الآلي هو دراسة الخوارزميات المختلفة التي يمكن أن تتحسن تلقائيًا من خلال الخبرة والبيانات القديمة وبناء النموذج. يشبه نموذج التعلم الآلي برامج الكمبيوتر المصممة للتعرف على الأنماط أو السلوكيات بناءً على الخبرة أو البيانات السابقة. تكتشف خوارزمية التعلم الأنماط داخل بيانات التدريب، وتقوم بإخراج نموذج تعلم الآلة الذي يلتقط هذه الأنماط ويقوم بالتنبؤات على البيانات الجديدة.
دعونا نفهم مثالاً لنموذج ML حيث نقوم بإنشاء تطبيق للتعرف على مشاعر المستخدم بناءً على تعبيرات الوجه. لذلك، يمكن إنشاء مثل هذا التطبيق من خلال نماذج التعلم الآلي حيث سنقوم بتدريب نموذج من خلال تغذية صور الوجوه مع المشاعر المختلفة الموضحة عليها. كلما تم استخدام هذا التطبيق لتحديد الحالة المزاجية للمستخدم، فإنه يقرأ جميع البيانات المغذية ثم يحدد الحالة المزاجية لأي مستخدم.
ومن هنا، وبكلمات بسيطة، يمكننا أن نقول أن أ نموذج التعلم الآلي هو تمثيل مبسط لشيء ما أو عملية ما. سنناقش في هذا الموضوع نماذج التعلم الآلي المختلفة وتقنياتها وخوارزمياتها .
ما هو نموذج التعلم الآلي؟
يمكن فهم نماذج التعلم الآلي على أنها برنامج تم تدريبه للعثور على أنماط ضمن البيانات الجديدة وإجراء التنبؤات. يتم تمثيل هذه النماذج كدالة رياضية تأخذ الطلبات في شكل بيانات مدخلة، وتقوم بالتنبؤات على بيانات الإدخال، ثم توفر مخرجات استجابة. أولاً، يتم تدريب هذه النماذج على مجموعة من البيانات، ثم يتم تزويدها بخوارزمية للتفكير في البيانات، واستخراج النمط من بيانات التغذية والتعلم من تلك البيانات. بمجرد تدريب هذه النماذج، يمكن استخدامها للتنبؤ بمجموعة البيانات غير المرئية.
هناك أنواع مختلفة من نماذج التعلم الآلي المتاحة بناءً على أهداف العمل ومجموعات البيانات المختلفة.
تصنيف نماذج التعلم الآلي:
استنادًا إلى أهداف العمل ومجموعات البيانات المختلفة، هناك ثلاثة نماذج تعليمية للخوارزميات. تستقر كل خوارزمية تعلم الآلة في أحد النماذج الثلاثة:
- التعلم تحت الإشراف
- تعليم غير مشرف عليه
- تعزيز التعلم
وينقسم التعلم الخاضع للإشراف أيضًا إلى فئتين:
- تصنيف
- تراجع
ينقسم التعلم غير الخاضع للرقابة أيضًا إلى الفئات التالية:
- تجمع
- قاعدة الرابطة
- تخفيض الأبعاد
1. نماذج التعلم الآلي الخاضعة للإشراف
التعلم الخاضع للإشراف هو أبسط نموذج للتعلم الآلي لفهم البيانات المدخلة التي تسمى بيانات التدريب ولها تسمية أو نتيجة معروفة كمخرجات. لذلك، فهو يعمل على مبدأ أزواج المدخلات والمخرجات. يتطلب الأمر إنشاء وظيفة يمكن تدريبها باستخدام مجموعة بيانات التدريب، ثم يتم تطبيقها على بيانات غير معروفة وإجراء بعض الأداء التنبؤي. يعتمد التعلم الخاضع للإشراف على المهام ويتم اختباره على مجموعات بيانات مصنفة.
يمكننا تنفيذ نموذج التعلم الخاضع للإشراف على مشاكل بسيطة من الحياة الواقعية. على سبيل المثال، لدينا مجموعة بيانات تتكون من العمر والطول؛ ومن ثم، يمكننا بناء نموذج تعليمي خاضع للإشراف للتنبؤ بطول الشخص بناءً على عمره.
يتم تصنيف نماذج التعلم الخاضعة للإشراف إلى فئتين:
تراجع
في مشاكل الانحدار، يكون الإخراج متغيرًا مستمرًا. بعض نماذج الانحدار شائعة الاستخدام هي كما يلي:
أ) الانحدار الخطي
الانحدار الخطي هو أبسط نموذج للتعلم الآلي حيث نحاول التنبؤ بمتغير إخراج واحد باستخدام واحد أو أكثر من متغيرات الإدخال. تمثيل الانحدار الخطي هو معادلة خطية، تجمع بين مجموعة من قيم الإدخال (x) والمخرجات المتوقعة (y) لمجموعة قيم الإدخال تلك. ويتم تمثيلها على شكل خط:
ص = ب س + ج.
الهدف الرئيسي لنموذج الانحدار الخطي هو العثور على أفضل خط مناسب يناسب نقاط البيانات.
يمتد الانحدار الخطي إلى الانحدار الخطي المتعدد (ابحث عن مستوى مناسب بشكل أفضل) والانحدار متعدد الحدود (ابحث عن أفضل منحنى مناسب).
ب) شجرة القرار
فتح ملف مع جافا
أشجار القرار هي نماذج التعلم الآلي الشائعة التي يمكن استخدامها لمشكلات الانحدار والتصنيف.
تستخدم شجرة القرار بنية تشبه الشجرة من القرارات إلى جانب عواقبها ونتائجها المحتملة. في هذا، يتم استخدام كل عقدة داخلية لتمثيل اختبار على إحدى السمات؛ يتم استخدام كل فرع لتمثيل نتيجة الاختبار. كلما زاد عدد العقد في شجرة القرار، زادت دقة النتيجة.
ميزة أشجار القرار هي أنها بديهية وسهلة التنفيذ، لكنها تفتقر إلى الدقة.
تستخدم أشجار القرار على نطاق واسع في بحوث العمليات، وتحديداً في تحليل القرار والتخطيط الاستراتيجي ، وبشكل رئيسي في التعلم الآلي.
ج) الغابة العشوائية
الغابة العشوائية هي طريقة التعلم المجمعة، والتي تتكون من عدد كبير من أشجار القرار. تتنبأ كل شجرة قرار في غابة عشوائية بالنتيجة، ويعتبر التنبؤ بأغلبية الأصوات هو النتيجة.
يمكن استخدام نموذج الغابة العشوائية لكل من مشاكل الانحدار والتصنيف.
بالنسبة لمهمة التصنيف، يتم أخذ نتيجة الغابة العشوائية من أغلبية الأصوات. بينما في مهمة الانحدار، يتم أخذ النتيجة من متوسط أو متوسط التنبؤات الناتجة عن كل شجرة.
د) الشبكات العصبية
الشبكات العصبية هي مجموعة فرعية من التعلم الآلي وتعرف أيضًا باسم الشبكات العصبية الاصطناعية. تتكون الشبكات العصبية من خلايا عصبية صناعية ومصممة بطريقة تشبه بنية الدماغ البشري وعمله. وتتصل كل خلية عصبية اصطناعية مع العديد من الخلايا العصبية الأخرى في الشبكة العصبية، وهذه الملايين من الخلايا العصبية المتصلة تخلق بنية معرفية متطورة.
تتكون الشبكات العصبية من بنية متعددة الطبقات، تحتوي على طبقة إدخال واحدة، وطبقة مخفية واحدة أو أكثر، وطبقة إخراج واحدة. عندما ترتبط كل خلية عصبية بخلية عصبية أخرى، فإنها تنقل البيانات من طبقة واحدة إلى الخلية العصبية الأخرى في الطبقات التالية. وأخيرًا، تصل البيانات إلى الطبقة الأخيرة أو طبقة الإخراج في الشبكة العصبية وتولد المخرجات.
تعتمد الشبكات العصبية على بيانات التدريب للتعلم وتحسين دقتها. ومع ذلك، يمكن للشبكة العصبية المدربة بشكل مثالي والدقيقة تجميع البيانات بسرعة وتصبح أداة قوية للتعلم الآلي والذكاء الاصطناعي. واحدة من الشبكات العصبية الأكثر شهرة هي خوارزمية بحث جوجل.
تصنيف
نماذج التصنيف هي النوع الثاني من تقنيات التعلم الخاضع للإشراف، والتي تستخدم لتوليد استنتاجات من القيم المرصودة في النموذج الفئوي. على سبيل المثال، يمكن لنموذج التصنيف تحديد ما إذا كان البريد الإلكتروني بريدًا عشوائيًا أم لا؛ سيشتري المشتري المنتج أم لا، وما إلى ذلك. تُستخدم خوارزميات التصنيف للتنبؤ بفئتين وتصنيف المخرجات إلى مجموعات مختلفة.
في التصنيف، يتم تصميم نموذج المصنف الذي يصنف مجموعة البيانات إلى فئات مختلفة، ويتم تعيين تسمية لكل فئة.
هناك نوعان من التصنيفات في التعلم الآلي:
بعض خوارزميات التصنيف الشائعة هي كما يلي:
أ) الانحدار اللوجستي
يستخدم الانحدار اللوجستي لحل مشاكل التصنيف في التعلم الآلي. وهي تشبه الانحدار الخطي ولكنها تستخدم للتنبؤ بالمتغيرات الفئوية. يمكنه التنبؤ بالمخرجات إما بنعم أو لا، 0 أو 1، صحيح أو خطأ، وما إلى ذلك. ومع ذلك، بدلاً من إعطاء القيم الدقيقة، فإنه يوفر القيم الاحتمالية بين 0 و1.
ب) دعم آلة المتجهات
آلة دعم المتجهات أو SVM هي خوارزمية التعلم الآلي الشائعة، والتي تستخدم على نطاق واسع لمهام التصنيف والانحدار. ومع ذلك، على وجه التحديد، يتم استخدامه لحل مشاكل التصنيف. الهدف الرئيسي لـ SVM هو العثور على أفضل حدود القرار في مساحة ذات أبعاد N، والتي يمكنها فصل نقاط البيانات إلى فئات، وتعرف أفضل حدود القرار باسم Hyperplane. يختار SVM المتجه الأقصى للعثور على المستوى الزائد، وتُعرف هذه المتجهات باسم ناقلات الدعم.
ج) ساذج بايز
Naïve Bayes هي خوارزمية تصنيف شائعة أخرى تستخدم في التعلم الآلي. يطلق عليه ذلك لأنه يعتمد على نظرية بايز ويتبع الافتراض الساذج (المستقل) بين الميزات التي يتم تقديمها على النحو التالي:
يفترض كل مصنف ساذج Bayes أن قيمة متغير معين مستقلة عن أي متغير/ميزة أخرى. على سبيل المثال، إذا كانت الفاكهة بحاجة إلى التصنيف على أساس اللون والشكل والطعم. لذلك سيتم التعرف على اللون الأصفر والبيضاوي والحلو على أنه مانجو. هنا كل ميزة مستقلة عن الميزات الأخرى.
2. نماذج التعلم الآلي غير الخاضعة للرقابة
تنفذ نماذج التعلم الآلي غير الخاضعة للرقابة عملية التعلم المعاكسة للتعلم الخاضع للإشراف، مما يعني أنها تمكن النموذج من التعلم من مجموعة بيانات التدريب غير المسماة. واستنادًا إلى مجموعة البيانات غير المسماة، يتنبأ النموذج بالمخرجات. باستخدام التعلم غير الخاضع للإشراف، يتعلم النموذج الأنماط المخفية من مجموعة البيانات بنفسه دون أي إشراف.
تُستخدم نماذج التعلم غير الخاضعة للرقابة بشكل أساسي لأداء ثلاث مهام، وهي كما يلي:
التجميع هو أسلوب تعلم غير خاضع للرقابة يتضمن تجميع نقاط البيانات أو تجميعها في مجموعات مختلفة بناءً على أوجه التشابه والاختلاف. تظل الكائنات ذات أكبر قدر من التشابه في نفس المجموعة، ولا يوجد بها أي أوجه تشابه أو لديها عدد قليل جدًا من أوجه التشابه من المجموعات الأخرى.
يمكن استخدام خوارزميات التجميع على نطاق واسع في مهام مختلفة مثل تجزئة الصور، تحليل البيانات الإحصائية، تجزئة السوق ، إلخ.
بعض خوارزميات التجميع شائعة الاستخدام هي K- يعني التجميع، التجميع الهرمي، DBSCAN ، إلخ.
تعلم قواعد الارتباط هو أسلوب تعلم غير خاضع للرقابة، يجد علاقات مثيرة للاهتمام بين المتغيرات ضمن مجموعة بيانات كبيرة. الهدف الرئيسي من خوارزمية التعلم هذه هو العثور على تبعية عنصر بيانات واحد على عنصر بيانات آخر وتعيين تلك المتغيرات وفقًا لذلك حتى تتمكن من تحقيق أقصى قدر من الربح. يتم تطبيق هذه الخوارزمية بشكل أساسي في تحليل سلة السوق، التعدين باستخدام الويب، الإنتاج المستمر ، إلخ.
بعض الخوارزميات الشائعة لتعلم قواعد الارتباط هي خوارزمية أبريوري، إكلات، خوارزمية نمو FP.
يُعرف عدد الميزات/المتغيرات الموجودة في مجموعة البيانات بأبعاد مجموعة البيانات، وتُعرف التقنية المستخدمة لتقليل الأبعاد باسم تقنية تقليل الأبعاد.
على الرغم من أن المزيد من البيانات توفر نتائج أكثر دقة، إلا أنها يمكن أن تؤثر أيضًا على أداء النموذج/الخوارزمية، مثل مشكلات التجاوز. في مثل هذه الحالات، يتم استخدام تقنيات تقليل الأبعاد.
' إنها عملية تحويل مجموعة البيانات ذات الأبعاد الأعلى إلى مجموعة بيانات ذات أبعاد أقل لضمان أنها توفر معلومات مماثلة .'
طرق مختلفة للحد من الأبعاد مثل مثل PCA (تحليل المكونات الرئيسية)، تحليل القيمة المفردة، إلخ.
تعزيز التعلم
في التعلم المعزز، تتعلم الخوارزمية الإجراءات لمجموعة معينة من الحالات التي تؤدي إلى حالة الهدف. إنه نموذج تعلم قائم على التغذية الراجعة يأخذ إشارات ردود الفعل بعد كل حالة أو إجراء من خلال التفاعل مع البيئة. تعمل هذه التعليقات كمكافأة (إيجابية لكل فعل جيد وسلبية لكل فعل سيء)، وهدف الوكيل هو تعظيم المكافآت الإيجابية لتحسين أدائه.
ويشبه سلوك النموذج في التعلم المعزز التعلم البشري، حيث يتعلم الإنسان الأشياء عن طريق التجارب كالتغذية الراجعة والتفاعل مع البيئة.
فيما يلي بعض الخوارزميات الشائعة التي تندرج ضمن التعلم المعزز:
ويهدف إلى معرفة السياسة التي يمكن أن تساعد وكيل الذكاء الاصطناعي على اتخاذ أفضل إجراء لتعظيم المكافأة في ظل ظروف معينة. فهو يشتمل على قيم Q لكل زوج من إجراءات الحالة التي تشير إلى مكافأة اتباع مسار حالة معين، ويحاول تعظيم قيمة Q.
نماذج التعلم الآلي للتدريب
بمجرد إنشاء نموذج التعلم الآلي، يتم تدريبه للحصول على النتائج المناسبة. لتدريب نموذج التعلم الآلي، يحتاج المرء إلى كمية هائلة من البيانات المعالجة مسبقًا. تعني البيانات المعالجة مسبقًا هنا البيانات في شكل منظم مع قيم فارغة مخفضة، وما إلى ذلك. إذا لم نقدم بيانات تمت معالجتها مسبقًا، فهناك احتمالات كبيرة بأن يكون أداء نموذجنا سيئًا.
كيفية اختيار النموذج الأفضل؟
في القسم أعلاه، ناقشنا نماذج وخوارزميات التعلم الآلي المختلفة. ولكن السؤال الأكثر إرباكًا الذي قد يتبادر إلى ذهن أي مبتدئ هو 'أي نموذج يجب أن أختار؟'. لذا فالجواب هو أن الأمر يعتمد بشكل أساسي على متطلبات العمل أو متطلبات المشروع. وبصرف النظر عن هذا، فإنه يعتمد أيضًا على السمات المرتبطة، وحجم مجموعة البيانات المتاحة، وعدد الميزات، والتعقيد، وما إلى ذلك. ومع ذلك، من الناحية العملية، يوصى بأن نبدأ دائمًا بأبسط نموذج يمكن تطبيقه على البيانات المعينة. المشكلة ثم قم بتعزيز التعقيد تدريجيًا واختبار الدقة بمساعدة ضبط المعلمات والتحقق من الصحة.
الفرق بين نموذج التعلم الآلي والخوارزميات
أحد الأسئلة الأكثر إرباكًا بين المبتدئين هو هل نماذج التعلم الآلي والخوارزميات هي نفسها؟ لأنه في حالات مختلفة في التعلم الآلي وعلوم البيانات، يتم استخدام هذين المصطلحين بالتبادل.
الإجابة على هذا السؤال هي لا، ونموذج التعلم الآلي ليس هو نفسه الخوارزمية. بطريقة بسيطة، أ تشبه خوارزمية ML الإجراء أو الطريقة التي يتم تشغيلها على البيانات لاكتشاف الأنماط منها وتوليد النموذج. وفي الوقت نفسه، أ يشبه نموذج التعلم الآلي برنامج كمبيوتر يقوم بإنشاء مخرجات أو عمل تنبؤات . وبشكل أكثر تحديدًا، عندما ندرب خوارزمية باستخدام البيانات، فإنها تصبح نموذجًا.
Machine Learning Model = Model Data + Prediction Algorithm