logo

ما هو خلية النحل

Hive هو نظام مستودع بيانات يستخدم لتحليل البيانات المنظمة. إنه مبني على قمة Hadoop. تم تطويره بواسطة الفيسبوك.

توفر Hive وظيفة القراءة والكتابة وإدارة مجموعات البيانات الكبيرة الموجودة في التخزين الموزع. يقوم بتشغيل SQL مثل الاستعلامات التي تسمى HQL (لغة استعلام الخلية) والتي يتم تحويلها داخليًا إلى وظائف MapReduce.

باستخدام Hive، يمكننا تخطي متطلبات النهج التقليدي لكتابة برامج MapReduce المعقدة. تدعم Hive لغة تعريف البيانات (DDL)، ولغة معالجة البيانات (DML)، والوظائف المحددة من قبل المستخدم (UDF).

مميزات الخلية

هذه هي الميزات التالية للخلية:

  • الخلية سريعة وقابلة للتطوير.
  • يوفر استعلامات تشبه SQL (أي HQL) يتم تحويلها ضمنيًا إلى وظائف MapReduce أو Spark.
  • إنه قادر على تحليل مجموعات البيانات الكبيرة المخزنة في HDFS.
  • فهو يسمح بأنواع تخزين مختلفة مثل النص العادي وRCFile وHBase.
  • ويستخدم الفهرسة لتسريع الاستعلامات.
  • يمكنه العمل على البيانات المضغوطة المخزنة في نظام Hadoop البيئي.
  • وهو يدعم الوظائف المحددة من قبل المستخدم (UDFs) حيث يمكن للمستخدم توفير وظائفه.

حدود الخلية

  • Hive غير قادر على التعامل مع البيانات في الوقت الحقيقي.
  • لم يتم تصميمه لمعالجة المعاملات عبر الإنترنت.
  • تحتوي استعلامات الخلية على زمن استجابة مرتفع.

الاختلافات بين الخلية والخنزير

خلية نحل خنزير
يتم استخدام Hive بشكل شائع بواسطة محللي البيانات. يستخدم الخنزير بشكل شائع من قبل المبرمجين.
ويتبع استعلامات تشبه SQL. يتبع لغة تدفق البيانات.
يمكنه التعامل مع البيانات المنظمة. يمكنه التعامل مع البيانات شبه المنظمة.
إنه يعمل على جانب الخادم لمجموعة HDFS. إنه يعمل على جانب العميل لمجموعة HDFS.
الخلية أبطأ من الخنزير. الخنزير أسرع نسبيًا من الخلية.