ما المقصود بـ AWS MapReduce؟
ما المقصود بـ AWS MapReduce؟

فيديو: ما المقصود بـ AWS MapReduce؟

فيديو: ما المقصود بـ AWS MapReduce؟
فيديو: What is Amazon EMR or Elastic MapReduce? Big Data Platform on AWS | AWS New 2024, ديسمبر
Anonim

أمازون مطاطا مابريديوس (EMR) هي إحدى خدمات Amazon Web Services ( AWS ) أداة لمعالجة البيانات الضخمة وتحليلها. تعالج Amazon EMR البيانات الضخمة عبر مجموعة Hadoop من الخوادم الافتراضية على Amazon Elastic Compute Cloud (EC2) و Amazon Simple Storage Service (S3).

بهذه الطريقة ، كيف يعمل AWS EMR؟

تبدأ الخدمة عددًا محددًا من قبل العميل لمثيلات Amazon EC2 ، والتي تتألف من عقد رئيسية واحدة وعقد أخرى متعددة. أمازون EMR يدير برنامج Hadoop في هذه الحالات. تقسم العقدة الرئيسية بيانات الإدخال إلى كتل ، وتوزع معالجة الكتل على العقد الأخرى.

بجانب ما ورد أعلاه ، ما هو الفرق بين ec2 و EMR؟ على عكس EMR , EC2 لا يصنف العقد التابعة إلى عقد أساسية وعقد مهمة. هذا يزيد من خطر فقدان بيانات HDFS في حالة إزالة / فقدان عقدة. EC2 يستخدم مكتبات Apache (s3a) للوصول إلى البيانات الموجودة على s3. من ناحية أخرى، EMR يستخدم كود AWS الخاص للوصول بشكل أسرع إلى s3.

بالإضافة إلى ذلك ، هل تتم إدارة AWS EMR بالكامل؟

أمازون مطاطا MapReduce ( EMR ) هو تدار بالكامل منصة Hadoop و Spark من أمازون خدمة ويب ( AWS ). مع EMR , AWS يمكن للعملاء إنشاء مجموعات Hadoop متعددة العقد بسرعة لمعالجة أعباء عمل البيانات الضخمة.

هل تستخدم AWS برنامج Hadoop؟

أمازون خدمات الويب الاستخدامات برنامج Apache مفتوح المصدر هادوب تقنية الحوسبة الموزعة لتسهيل الوصول إلى كميات كبيرة من قوة الحوسبة لتشغيل مهام كثيفة البيانات. هادوب ، الإصدار مفتوح المصدر من MapReduce من Google ، يتم استخدامه بالفعل من قبل شركات مثل Yahoo و Facebook.

موصى به: