ما هي بحيرة البيانات في Hadoop؟
ما هي بحيرة البيانات في Hadoop؟

فيديو: ما هي بحيرة البيانات في Hadoop؟

فيديو: ما هي بحيرة البيانات في Hadoop؟
فيديو: Small file problem in Hadoop and Spark - How delta lake helps? 2024, شهر نوفمبر
Anonim

أ بحيرة بيانات Hadoop هو البيانات منصة إدارة تتألف من واحد أو أكثر هادوب عناقيد المجموعات. يتم استخدامه بشكل أساسي لمعالجة وتخزين العناصر غير العلائقية البيانات ، مثل ملفات السجل ، وسجلات تدفق الإنترنت ، وأجهزة الاستشعار البيانات وكائنات JSON والصور ومنشورات الوسائط الاجتماعية.

في هذا الصدد ، ما هو الفرق بين مستودع البيانات وبحيرة البيانات؟

بحيرات البيانات و البيانات تستخدم المستودعات على نطاق واسع لتخزين كبيرة البيانات ، لكنها ليست مصطلحات قابلة للتبديل. أ بحيرة البيانات هي مجموعة كبيرة من الخام البيانات ، الغرض الذي لم يتم تحديده بعد. أ مستودع البيانات هو مستودع منظم ، مصفى البيانات التي تمت معالجتها بالفعل لغرض معين.

بالإضافة إلى ذلك ، ما هي بنية بحيرة البيانات؟ أ بحيرة البيانات هو مستودع تخزين يمكنه تخزين كمية كبيرة من الهيكلية وشبه الهيكلية وغير المهيكلة البيانات . على عكس منزل Dataware الهرمي حيث البيانات يتم تخزينها في الملفات والمجلدات ، بحيرة البيانات لديه شقة هندسة معمارية.

فيما يتعلق بهذا ، ما المقصود ببحيرة البيانات؟

أ بحيرة البيانات هو مستودع تخزين يحتوي على كمية هائلة من المواد الخام البيانات بتنسيقه الأصلي حتى يتم الاحتياج إليه. في حين أن التسلسل الهرمي البيانات مخازن المستودعات البيانات في الملفات أو المجلدات ، أ بحيرة البيانات يستخدم بنية مسطحة للتخزين البيانات . المصطلح بحيرة البيانات غالبًا ما يرتبط بتخزين الكائنات الموجهة Hadoop.

هل Elasticsearch بحيرة بيانات؟

أ بحيرة البيانات هو مجرد مكان لركن سيارتك البيانات حتى تحتاج إليه ، ويمكن أن يشمل HDFS (الأكثر شيوعًا) أو تخزين الكائنات أو صناديق NAS أو أي شيء آخر. في الأساس ، Elasticsearch هي أداة للفهرسة البيانات ، ليس لتخزين ملفات البيانات بحد ذاتها.

موصى به: