فيديو: ما هو القرب في التنقيب عن البيانات؟
2024 مؤلف: Lynn Donovan | [email protected]. آخر تعديل: 2023-12-15 23:43
القرب تشير المقاييس إلى مقاييس التشابه والاختلاف. التشابه والاختلاف مهمان لأنهما يستخدمهما عدد من بيانات التعدين التقنيات ، مثل التجميع ، وتصنيف الجيران الأقرب ، واكتشاف الانحراف.
فيما يتعلق بهذا ، ما هو مقياس القرب؟
تدابير القرب وصف التشابه أو الاختلاف الموجود بين الأشياء أو العناصر أو المنبهات أو الأشخاص الذين تكمن وراء دراسة تجريبية.
بجانب ما ورد أعلاه ، كيف تجد قرب المصفوفة؟ مصفوفة المسافة
- يمكن قياس القرب بين الجسم كمصفوفة مسافة.
- على سبيل المثال ، المسافة بين الكائن أ = (1 ، 1) و ب = (1.5 ، 1.5) يتم حسابها على أنها.
- مثال آخر على المسافة بين الجسم D = (3 ، 4) و F = (3 ، 3.5) محسوب على النحو التالي.
إذاً ، ما هو التشابه والاختلاف في التنقيب عن البيانات؟
التشابه والاختلاف هي التالية بيانات التعدين المفاهيم التي سنناقشها. تشابه هو مقياس رقمي لكيفية تشابه اثنين البيانات الأشياء هي و الاختلاف هو مقياس رقمي لمدى اختلاف الاثنين البيانات الأشياء.
ما هي مصفوفة الاختلاف؟
ال مصفوفة الاختلاف هو مصفوفة التي تعبر عن زوج التشابه للاقتران بين مجموعتين. إنه مربع ومتماثل. يتم تعريف العناصر القطرية على أنها صفر ، مما يعني أن الصفر هو مقياس الاختلاف بين عنصر ونفسه.
موصى به:
هل كل الأنماط مثيرة للاهتمام في التنقيب عن البيانات؟
على عكس المهمة التقليدية لنمذجة البيانات - حيث يكون الهدف هو وصف جميع البيانات بنموذج واحد - تصف الأنماط جزءًا فقط من البيانات [27]. بالطبع ، أجزاء كثيرة من البيانات ، وبالتالي العديد من الأنماط ، ليست مثيرة للاهتمام على الإطلاق. الهدف من التنقيب عن الأنماط هو اكتشاف تلك الموجودة فقط
ما أنواع المعلومات التي ينتجها التنقيب في البيانات؟
تعدين البيانات هو كل شيء عن اكتشاف العلاقات غير المتوقعة / غير المعروفة سابقًا بين البيانات. إنها مهارة متعددة التخصصات تستخدم التعلم الآلي والإحصاءات والذكاء الاصطناعي وتكنولوجيا قواعد البيانات. يمكن استخدام الرؤى المستمدة من التنقيب في البيانات للتسويق واكتشاف الاحتيال والاكتشاف العلمي وما إلى ذلك
ما هي متطلبات التجميع في التنقيب عن البيانات؟
المتطلبات الرئيسية التي يجب أن تفي بها خوارزمية التجميع هي: قابلية التوسع ؛ التعامل مع أنواع مختلفة من السمات ؛ اكتشاف العناقيد ذات الشكل التعسفي ؛ الحد الأدنى من متطلبات معرفة المجال لتحديد معلمات الإدخال ؛ القدرة على التعامل مع الضوضاء والقيم المتطرفة
ما هو التنقيب عن البيانات وما هو ليس التنقيب عن البيانات؟
يتم التنقيب في البيانات دون أي فرضية مسبقة ، وبالتالي فإن المعلومات التي تأتي من البيانات ليست للإجابة على أسئلة محددة للمؤسسة. ليس التنقيب عن البيانات: الهدف من التنقيب في البيانات هو استخراج الأنماط والمعرفة من كميات كبيرة من البيانات ، وليس استخراج (تعدين) البيانات نفسها
ما هي أنواع البيانات المختلفة في التنقيب عن البيانات؟
دعونا نناقش نوع البيانات التي يمكن استخراجها: الملفات المسطحة. قواعد البيانات العلائقية. مستودع البيانات. قواعد بيانات المعاملات. قواعد بيانات الوسائط المتعددة. قواعد البيانات المكانية. قواعد بيانات السلاسل الزمنية. شبكة الويب العالمية (WWW)