جدول المحتويات:

كيف يمكنني تحسين أداء sqoop الخاص بي؟
كيف يمكنني تحسين أداء sqoop الخاص بي؟

فيديو: كيف يمكنني تحسين أداء sqoop الخاص بي؟

فيديو: كيف يمكنني تحسين أداء sqoop الخاص بي؟
فيديو: Sqoop Import and Export data from RDMBS and HDFS 2024, شهر نوفمبر
Anonim

لتحسين أداء ، يضع ال عدد مهام التعيين إلى قيمة أقل من ال الحد الأقصى لعدد الاتصالات التي ال تدعم قاعدة البيانات. المتابعة ال مقدار التوازي ذلك سكوب سوف تستخدم لنقل البيانات ال الطريقة الرئيسية للسيطرة ال تحميل على لك قاعدة البيانات.

في المقابل ، ماذا يحدث إذا فشل sqoop بين العملية؟

نموذجي سكوب المهمة التي تستوعب البيانات من قاعدة بيانات المصدر إلى HDFS ستنسخ البيانات إلى الدليل الهدف. سيتم حذف الملف المنسوخ إذا فشل sqoop بدون استكمال.

قد يتساءل المرء أيضًا ، كيف يمكنك تحقيق التوازي في sqoop؟ المتابعة تماثل . سكوب يستورد البيانات بالتوازي من معظم مصادر قاعدة البيانات. يمكنك تحديد عدد مهام الخريطة (العمليات المتوازية) لاستخدامها لإجراء الاستيراد باستخدام الوسيطة -m أو --num-mappers. تأخذ كل من هذه الوسيطات قيمة عددية تتوافق مع درجة تماثل يوظف

وبالتالي ، كيف يمكنني تحسين أداء استعلام Hive الخاص بي؟

فيما يلي قائمة بالممارسات التي يمكننا اتباعها لتحسين استعلامات الخلية

  1. تفعيل الضغط في الخلية.
  2. تحسين عمليات الانضمام.
  3. تجنب الفرز العام في الخلية.
  4. تفعيل محرك تنفيذ Tez.
  5. تحسين عامل التشغيل.
  6. تمكين التنفيذ المتوازي.
  7. قم بتمكين Mapreduce Strict Mode.
  8. تخفيض فردي لـ Multi Group BY.

كيف يعمل تطبيق sqoop Split؟

يمكن استخدامه لتحسين أداء الاستيراد من خلال تحقيق قدر أكبر من التوازي. سكوب يخلق انشقاقات بناءً على القيم الموجودة في عمود معين من الجدول المحدد بواسطة - الانقسام - بواسطة المستخدم من خلال أمر الاستيراد. إذا لم يكن متاحًا ، فسيتم استخدام المفتاح الأساسي لجدول الإدخال لإنشاء ملف انشقاقات.

موصى به: