ما هو DistCp في Hadoop؟
ما هو DistCp في Hadoop؟

فيديو: ما هو DistCp في Hadoop؟

فيديو: ما هو DistCp في Hadoop؟
فيديو: 16 - Hadoop Filesystems and CLI | Hadoop 2024, شهر نوفمبر
Anonim

DistCp (نسخة موزعة) هي أداة تستخدم لنسخ كبير بين / داخل الكتلة. يستخدم مابريديوس لتأثير التوزيع ومعالجة الأخطاء والاسترداد والإبلاغ. يقوم بتوسيع قائمة الملفات والدلائل في مدخلات لتعيين المهام ، كل منها سينسخ قسمًا من الملفات المحددة في قائمة المصادر.

وبالمثل قد يتساءل المرء ، هل يقوم Distcp بالكتابة؟

يجب أن أشرح بعض التفاصيل وأشرح ذلك distcp - الكتابة فوق إرادة الكتابة فوق الملف بغض النظر عما إذا كان الحجم مطابقًا أم لا. سيؤدي هذا إلى تحديث جميع الملفات في hdfs-nn2 التي لا تتطابق في الحجم من hdfs-nn1 ، وكذلك حذف أي ملفات غريبة.

وبالمثل ، ما هو أمر Hadoop FS؟ نظام الملفات ( FS ) تتضمن قذيفة مختلفة تشبه الصدفة أوامر التي تتفاعل مباشرة مع هادوب نظام الملفات الموزعة ( HDFS ) بالإضافة إلى أنظمة الملفات الأخرى التي هادوب يدعم ، مثل Local FS ، HFTP FS ، S3 FS ، و اخرين.

بهذه الطريقة ، كيف يمكنني نقل البيانات من أحد ملفات Hdfs إلى ملفات Hdfs أخرى؟

هادوب fs cp - الأسهل طريقة لنسخ البيانات من واحد دليل المصدر إلى اخر . استخدم ال هادوب fs -cp [المصدر] [الوجهة]. هادوب fs copyFromLocal - تحتاج إلى نسخ البيانات من نظام الملفات المحلي إلى HDFS ؟ استخدم ال هادوب fs -copyFromLocal [المصدر] [الوجهة].

كيف أنسخ كتلة من كتلة إلى أخرى؟

نسخ الملفات ما بين عناقيد المجموعات . تستطيع نسخ الملفات أو الدلائل بين مختلف عناقيد المجموعات باستخدام الأمر hadoop distcp. يجب عليك تضمين بيانات الاعتماد ملف في الخاص بك ينسخ طلب ذلك المصدر العنقودية يمكن التحقق من مصادقتك على المصدر العنقودية والهدف العنقودية.

موصى به: