- Redshift عبارة عن خدمة سحابية سريعة وقوية ومُدارة بالكامل وبحجم بيتابايت لتخزين البيانات.
- يمكن للعملاء استخدام Redshift مقابل 0.25 دولارًا أمريكيًا فقط في الساعة دون أي التزامات أو تكاليف مسبقة والتوسع إلى بيتابايت أو أكثر مقابل 1000 دولار أمريكي لكل تيرابايت سنويًا.
OLAP
OLAP هو نظام معالجة التحليلات عبر الإنترنت المستخدمة من قبل الانزياح الأحمر .
مثال لمعاملة OLAP:
لنفترض أننا نريد حساب صافي الربح لمنطقة أوروبا والشرق الأوسط وأفريقيا والمحيط الهادئ لمنتج الراديو الرقمي. وهذا يتطلب سحب عدد كبير من السجلات. فيما يلي السجلات المطلوبة لحساب صافي الربح:
- مجموع أجهزة الراديو المباعة في أوروبا والشرق الأوسط وأفريقيا.
- مجموع أجهزة الراديو المباعة في المحيط الهادئ.
- تكلفة وحدة الراديو في كل منطقة.
- سعر بيع كل راديو
- سعر البيع - تكلفة الوحدة
الاستعلامات المعقدة مطلوبة لجلب السجلات المذكورة أعلاه. تستخدم قواعد بيانات تخزين البيانات بنية أنواع مختلفة من منظور قاعدة البيانات وطبقة البنية التحتية.
تكوين الانزياح الأحمر
يتكون الانزياح الأحمر من نوعين من العقد:
عقدة واحدة: تخزن العقدة الواحدة ما يصل إلى 160 جيجابايت.
متعدد العقدة: العقدة المتعددة هي عقدة تتكون من أكثر من عقدة واحدة. وهو من نوعين:
يدير اتصالات العميل ويستقبل الاستفسارات. تتلقى العقدة الرائدة الاستعلامات من تطبيقات العميل، وتحلل الاستعلامات، وتطور خطط التنفيذ. يقوم بالتنسيق مع التنفيذ المتوازي لهذه الخطط مع العقدة الحسابية ويجمع النتائج المتوسطة لجميع العقد، ثم يعيد النتيجة النهائية إلى تطبيق العميل.
تقوم عقدة الحوسبة بتنفيذ خطط التنفيذ، ثم يتم إرسال النتائج المتوسطة إلى العقدة الرائدة للتجميع قبل إرسالها مرة أخرى إلى تطبيق العميل. يمكن أن تحتوي على ما يصل إلى 128 عقدة حسابية.
دعونا نفهم مفهوم العقدة الرائدة وحساب العقد من خلال مثال.
مستودع Redshift عبارة عن مجموعة من موارد الحوسبة المعروفة باسم العقد، ويتم تنظيم هذه العقد في مجموعة تعرف باسم المجموعة. تعمل كل مجموعة في محرك Redshift الذي يحتوي على قاعدة بيانات واحدة أو أكثر.
عند تشغيل مثيل Redshift، فإنه يبدأ بعقدة واحدة بحجم 160 جيجابايت. عندما تريد النمو، يمكنك إضافة عقد إضافية للاستفادة من المعالجة المتوازية. لديك عقدة رائدة تدير العقد المتعددة. تتعامل العقدة الرائدة مع اتصال العميل بالإضافة إلى عقد الحوسبة. يقوم بتخزين البيانات في عقد الحساب وتنفيذ الاستعلام.
لماذا يكون الانزياح نحو الأحمر أسرع بـ 10 مرات؟
يكون الانزياح نحو الأحمر أسرع 10 مرات للأسباب التالية:
بدلاً من تخزين البيانات كسلسلة من الصفوف، يقوم Amazon Redshift بتنظيم البيانات حسب العمود. تعد الأنظمة المستندة إلى الصفوف مثالية لمعالجة المعاملات، في حين تعتبر الأنظمة المستندة إلى الأعمدة مثالية لتخزين البيانات والتحليلات، حيث تتضمن الاستعلامات غالبًا تجميعات يتم إجراؤها على مجموعات كبيرة من البيانات. نظرًا لأنه تتم معالجة الأعمدة المشاركة في الاستعلامات فقط ويتم تخزين البيانات العمودية في وسائط التخزين بشكل تسلسلي، فإن الأنظمة المستندة إلى الأعمدة تتطلب عددًا أقل من عمليات الإدخال/الإخراج، وبالتالي تحسين أداء الاستعلام.
يمكن ضغط مخازن البيانات العمودية أكثر بكثير من مخازن البيانات المستندة إلى الصفوف لأنه يتم تخزين البيانات المماثلة بشكل تسلسلي على القرص. يستخدم Amazon Redshift تقنيات ضغط متعددة ويمكنه في كثير من الأحيان تحقيق ضغط كبير مقارنةً بمخزن بيانات العلاقات التقليدية.
لا يتطلب Amazon Redshift فهارس أو طرق عرض مادية، لذا فهو يتطلب مساحة أقل من أنظمة قواعد البيانات العلائقية التقليدية. عند تحميل بيانات في جدول فارغ، يقوم Amazon Redshift باختبار بياناتك تلقائيًا ويحدد أسلوب الضغط الأكثر ملاءمة.
يقوم Amazon Redshift تلقائيًا بتوزيع البيانات وتحميل الاستعلام عبر العقد المختلفة. يُسهل Amazon Redshift إضافة عقد جديدة إلى مستودع البيانات الخاص بك، وهذا يسمح لنا بتحقيق أداء أسرع للاستعلام مع نمو مستودع البيانات الخاص بك.
ميزات الانزياح الأحمر
ميزات التحول نحو الأحمر مذكورة أدناه:
تحويل من شار إلى int جافا
يعتبر Redshift سهل الإعداد والتشغيل. يمكنك نشر مستودع بيانات جديد ببضع نقرات فقط في وحدة تحكم AWS، وسيقوم Redshift تلقائيًا بتوفير البنية الأساسية لك. في AWS، تتم جميع المهام الإدارية تلقائيًا، مثل النسخ الاحتياطي والنسخ المتماثل، وتحتاج إلى التركيز على بياناتك، وليس على الإدارة.
يقوم Redshift تلقائيًا بنسخ بياناتك احتياطيًا إلى S3. يمكنك أيضًا نسخ اللقطات الموجودة في S3 في منطقة أخرى لأي عملية استرداد بعد عطل فادح.
Amazon Redshift هي خدمة مستودع البيانات الأكثر فعالية من حيث التكلفة حيث يتعين عليك الدفع فقط مقابل ما تستخدمه.
تبدأ تكاليفها بـ 0.25 دولارًا أمريكيًا للساعة دون أي التزام أو تكاليف مقدمة ويمكن أن تصل إلى 250 دولارًا أمريكيًا لكل تيرابايت سنويًا.
Amazon Redshift هي خدمة مستودع البيانات الوحيدة التي تقدم التسعير عند الطلب دون أي تكاليف مقدمة، كما أنها توفر تسعير المثيلات المحجوزة الذي يوفر ما يصل إلى 75% من خلال توفير مدة تتراوح بين 1-3 سنوات.
يمكنك اختيار أي من العقدتين لتحسين التحول نحو الأحمر.
يمكن لعقدة الحوسبة الكثيفة إنشاء مستودعات بيانات عالية الأداء باستخدام وحدات المعالجة المركزية السريعة وكمية كبيرة من ذاكرة الوصول العشوائي وأقراص الحالة الصلبة.
إذا كنت ترغب في تقليل التكلفة، فيمكنك استخدام عقدة التخزين الكثيفة. يقوم بإنشاء مستودع بيانات فعال من حيث التكلفة باستخدام محرك أقراص ثابت أكبر.
يقوم Amazon Redshift تلقائيًا بتوسيع العقد لأعلى أو لأسفل وفقًا للتغييرات المطلوبة. من خلال بضع نقرات فقط في وحدة تحكم AWS أو استدعاء واحد لواجهة برمجة التطبيقات (API) يمكن بسهولة تغيير عدد العقد في مستودع البيانات.
إنها إحدى ميزات Redshift التي تتيح لك تشغيل الاستعلامات مقابل إكسابايت من البيانات في Amazon S3. Amazon S3 عبارة عن بيانات آمنة وفعالة من حيث التكلفة لتخزين بيانات غير محدودة بتنسيق مفتوح.
إنها إحدى ميزات Redshift التي تعني أن الاستعلامات المتعددة يمكنها الوصول إلى نفس البيانات في Amazon S3. يسمح لك بتشغيل الاستعلامات عبر العقد المتعددة بغض النظر عن مدى تعقيد الاستعلام أو كمية البيانات.
Amazon Redshift هو مستودع البيانات الوحيد الذي يتم استخدامه للاستعلام عن مستودع بيانات Amazon S3 دون تحميل البيانات. يوفر ذلك المرونة من خلال تخزين البيانات التي يتم الوصول إليها بشكل متكرر في Redshift والبيانات غير المنظمة أو التي يتم الوصول إليها بشكل غير متكرر في Amazon S3.
باستخدام اثنين من إعدادات المعلمات، يمكنك ضبط Redshift لاستخدام SSL لتأمين بياناتك. يمكنك أيضًا تمكين التشفير، حيث سيتم تشفير كافة البيانات المكتوبة على القرص.
يوفر Amazon Redshift تخزين البيانات العمودي والضغط والمعالجة المتوازية لتقليل كمية الإدخال/الإخراج اللازمة لتنفيذ الاستعلامات. يؤدي هذا إلى تحسين أداء الاستعلام.