ما هو محرك معالجة البيانات وراء Amazon Elastic MapReduce؟
ما هو محرك معالجة البيانات وراء Amazon Elastic MapReduce؟

فيديو: ما هو محرك معالجة البيانات وراء Amazon Elastic MapReduce؟

فيديو: ما هو محرك معالجة البيانات وراء Amazon Elastic MapReduce؟
فيديو: hadoop yarn architecture 2024, شهر نوفمبر
Anonim

أمازون EMR يستخدم Apache Hadoop كما تم توزيعه محرك معالجة البيانات . Hadoop هو إطار عمل برنامج Java مفتوح المصدر يدعم ملفات البيانات - تطبيقات موزعة مكثفة تعمل على مجموعات كبيرة من الأجهزة السلع.

علاوة على ذلك ، ما هو Amazon Elastic MapReduce؟

Amazon Elastic MapReduce ( EMR ) هو خدمات أمازون ويب ( AWS ) أداة لمعالجة البيانات الضخمة وتحليلها. أمازون EMR يعالج البيانات الضخمة عبر مجموعة Hadoop من الخوادم الافتراضية أمازون مطاطا حساب السحابة ( EC2 ) و أمازون خدمة تخزين بسيطة ( S3 ).

علاوة على ذلك ، هل تتم إدارة Amazon EMR بالكامل؟ انه تدار بالكامل خدمة بحيرة البيانات التي يمكنها فصل تخزين البيانات عن موارد الحوسبة وبدلاً من ذلك تجعل مجموعات الحوسبة قابلة للتوسع ومتاحة للاستخدام عند الطلب ، وتتضمن القدرة على مجموعات متعددة للوصول إلى مجموعات البيانات نفسها في وقت واحد.

قد يتساءل المرء أيضًا ، كيف يعمل AWS EMR؟

بشكل عام ، عند معالجة البيانات بتنسيق أمازون EMR ، المدخلات هي البيانات المخزنة كملفات في نظام الملفات الأساسي الذي اخترته ، مثل أمازون S3 أو HDFS. تنتقل هذه البيانات من خطوة إلى أخرى في تسلسل المعالجة. تكتب الخطوة الأخيرة بيانات الإخراج إلى موقع محدد ، مثل ملف أمازون دلو S3.

ما هو الفرق بين ec2 و EMR؟

على عكس EMR , EC2 لا يصنف العقد التابعة إلى عقد أساسية وعقد مهمة. هذا يزيد من خطر فقدان بيانات HDFS في حالة إزالة / فقدان عقدة. EC2 يستخدم مكتبات Apache (s3a) للوصول إلى البيانات الموجودة على s3. من ناحية أخرى، EMR يستخدم كود AWS الخاص للوصول بشكل أسرع إلى s3.

موصى به: