ما هو سبارك البث؟
ما هو سبارك البث؟

فيديو: ما هو سبارك البث؟

فيديو: ما هو سبارك البث؟
فيديو: 3.7 Apache Spark Tutorial | Spark Broadcast Variables 2024, شهر نوفمبر
Anonim

إذاعة المتغيرات في اباتشي شرارة هي آلية لمشاركة المتغيرات عبر المنفذين التي من المفترض أن تكون للقراءة فقط. بدون إذاعة المتغيرات سيتم شحن هذه المتغيرات إلى كل منفذ لكل تحويل وإجراء ، وهذا يمكن أن يتسبب في عبء الشبكة.

وبالمثل ، يسأل الناس ، متى يجب أن أبث الشرارة؟

إذاعة يتم استخدام المتغيرات في الغالب عندما تتطلب المهام عبر مراحل متعددة نفس البيانات أو عندما يكون التخزين المؤقت للبيانات في النموذج غير المتسلسل مطلوبًا. إذاعة يتم إنشاء المتغيرات باستخدام متغير v عن طريق استدعاء SparkContext.

أيضا ما هي المجمعات ومتغيرات البث في سبارك؟ شرارة يدعم نوعين من ملفات المتغيرات : متغيرات البث ، والتي يمكن استخدامها لتخزين قيمة في الذاكرة مؤقتًا على جميع العقد ، و المراكم ، و هو المتغيرات التي تتم "إضافتها" فقط إلى ، مثل العدادات والمبالغ.

بالنظر إلى هذا ، ما هو مجمع الشرارة؟

المراكم هي متغيرات يتم "إضافتها" فقط من خلال عملية ترابطية ويمكن بالتالي دعمها بكفاءة بالتوازي. يمكن استخدامها لتنفيذ عدادات (كما في MapReduce) أو المبالغ. شرارة يدعم أصلا المراكم من الأنواع الرقمية ، ويمكن للمبرمجين إضافة دعم لأنواع جديدة.

كيف أقوم بتحديث متغير البث الخاص بي في سبارك؟

  1. انقل البحث عن البيانات المرجعية إلى forEachPartition أو forEachRdd بحيث يتواجد بالكامل على العاملين.
  2. أعد تشغيل Spark Context في كل مرة يتغير فيها refdata ، باستخدام متغير بث جديد.

موصى به: