ما هي إمبالا في البيانات الضخمة؟
ما هي إمبالا في البيانات الضخمة؟

فيديو: ما هي إمبالا في البيانات الضخمة؟

فيديو: ما هي إمبالا في البيانات الضخمة؟
فيديو: جهاز فحص السيارات لاتعتمد عليه كليا في تشخيص الاعطال- امبالا p0010- cars diagnosis tool 2024, يمكن
Anonim

إمبالا هو محرك استعلام معالجة متوازي مفتوح المصدر على نطاق واسع أعلى الأنظمة المجمعة مثل Apache Hadoop. تم إنشاؤه بناءً على ورقة Google Dremel. إنه محرك استعلام تفاعلي يشبه SQL يتم تشغيله أعلى نظام الملفات الموزعة Hadoop (HDFS). إمبالا يستخدم HDFS كوحدة تخزين أساسية.

بخصوص هذا ، ما هي إمبالا وهايف؟

اباتشي خلية نحل هو معيار فعال لـ SQL-in-Hadoop. إمبالا هو محرك استعلام SQL مفتوح المصدر تم تطويره بعد Google Dremel. كلوديرا إمبالا هو محرك SQL لمعالجة البيانات المخزنة في HBase و HDFS. إمبالا الاستخدامات خلية نحل ميغاستور ويمكن الاستعلام عن خلية نحل الجداول مباشرة.

علاوة على ذلك ، أيهما أفضل خلية أم إمبالا؟ اباتشي خلية نحل قد لا تكون مثالية للحوسبة التفاعلية بينما إمبالا مخصص للحوسبة التفاعلية. خلية نحل هو Hadoop MapReduce على دفعات بينما إمبالا يكون أكثر مثل قاعدة بيانات MPP. خلية نحل يدعم أنواع معقدة ولكن إمبالا لا. اباتشي خلية نحل هو خطأ متسامح حيث إمبالا لا يدعم التسامح مع الخطأ.

سئل أيضًا ، لماذا نستخدم إمبالا؟

إمبالا يدعم معالجة البيانات في الذاكرة ، أي أنه يصل إلى / يحلل البيانات التي يكون المخزنة على عقد بيانات Hadoop دون نقل البيانات. تستطيع بيانات الدخول باستخدام إمبالا استعلامات مثل SQL. إمبالا يوفر وصولاً أسرع للبيانات في HDFS عند مقارنتها بمحركات SQL الأخرى.

ما هي الخلية في البيانات الضخمة؟

اباتشي خلية نحل هو البيانات نظام المستودعات ل البيانات التلخيص والتحليل والاستعلام عن البيانات أنظمة في منصة Hadoop مفتوحة المصدر. يقوم بتحويل الاستعلامات المشابهة لـ SQL إلى وظائف MapReduce لسهولة تنفيذ ومعالجة كميات كبيرة للغاية من ملفات البيانات.

موصى به: