3 مراحل تطبيع البيانات

بعض المراحل الهامة التي تشارك في عملية تطبيع البيانات هي كما يلي:

هناك عدة طرق لتجميع عناصر البيانات في الجداول. سيكون مصمم قاعدة البيانات مهتمًا باختيار الطريقة التي تضمن عدم وجود أي خلل في تجميع البيانات. وتشمل هذه الحالات الشاذة تكرار البيانات وفقدان البيانات والعلاقات الزائفة في البيانات.

Image Courtesy: 4.bp.blogspot.com/-MTnjMQCPoRI/Tu4HGFKjV2I/AAAAAAAAAHQ/md1Cz89KH1U/s1600/2service.jpg

التطبيع يهدف إلى القضاء على الشذوذات في البيانات. تتضمن عملية التطبيع ثلاث مراحل ، كل مرحلة تولد جدولاً في شكل طبيعي.

1. النموذج العادي الأول:

تتمثل الخطوة الأولى في التطبيع في وضع جميع الحقول المتكررة في ملفات منفصلة وتعيين مفاتيح مناسبة لها.

عند أخذ مثال معالجة أمر الشراء ، يمكن تحديد عناصر البيانات التالية في أمر الشراء:

واسم المورد

اسم المورد

عنوان

رقم طلب الشراء

تاريخ

شروط الدفع

شروط الشحن

رقم

كود المنتج

وصف

وحدة قياس

السعر

الكمية المطلوبة

كمية

كما هو موضح أعلاه ، يتم تكرار "شروط الشحن" لكل رقم س ، وسيكون هناك العديد من السجلات الخاصة به في كل أمر شراء. في المرحلة الأولى من التطبيع ، توضع عناصر البيانات المتكررة في جداول منفصلة. وبالتالي ، نقوم بتقسيم عناصر البيانات إلى جدولين كما هو موضح أدناه:

يتم عرض عناصر البيانات الرئيسية بحروف كبيرة. أصبح الجدول الآن في النموذج العادي الأول (INF) لأن جميع عناصر البيانات المتكررة (الحقول) موجودة في جدول منفصل (الجدول 1.2) وتم تعيين مفاتيح الاسترداد لكل جدول. بما أن هناك عنصرين رئيسيين في كلا الجدولين ، يمكن القول أن كل جدول يحتوي على مفاتيح مركبة / مركبة. وقد سهلت عملية التطبيع هذه البيانات.

2. الشكل الثاني العادي:

في هذه المرحلة من التطبيع ، يتم وضع جميع العناصر غير الرئيسية المحددة بالكامل بشيء آخر غير المفتاح الكامل في جدول منفصل. عادة ، تعتمد هذه العناصر غير الأساسية على جزء من مفتاح مركب فقط.

مع الأخذ في الاعتبار الجدول 1.1 ، وهو عبارة عن مفتاح مركب يتكون من معرف_المورد وأمر الشراء لا. يتم إستخدامه. ومع ذلك ، فإن العناصر غير الرئيسية مثل اسم المورد وعنوانه لا تعتمد إلا على المورد_ المعرف وليس على رقم أمر الشراء لا. وهكذا ، يتم وضع عناصر البيانات غير الرئيسية هذه في جداول منفصلة جنبًا إلى جنب مع عنصر البيانات الرئيسي - supplier_ id.

وبالمثل ، فإن عناصر البيانات غير الرئيسية مثل التاريخ وشروط الدفع وشروط الشحن لا تعتمد إلا على أمر الشراء لا. وبالتالي يتم وضعها في جدول منفصل مع أمر الشراء لا. كعنصر رئيسي. الآن ، لدينا ثلاثة جداول بدلاً من الجدول 1.1:

وبالمثل ، يمكننا تقسيم الجدول 1.2 بفصل العناصر غير الرئيسية مثل الوصف ووحدة القياس والسعر ، والتي لا تعتمد إلا على رمز المنتج في الجدول. وبالمثل ، يتم وضع كود المنتج والكمية والمبلغ المعتمد على أمر الشراء ورقم S. في جدول منفصل.

النموذج العادي الثاني (2NF) جاهز الآن وهناك خمسة جداول.

3. الشكل الثالث العادي:

هذه المرحلة من التسوية تمكن من القضاء على عناصر البيانات المتكررة والجداول التي هي مجموعات فرعية من الجداول الأخرى. العناصر المكررة هي عناصر البيانات غير الرئيسية التي يتم وضعها في أكثر من جدول لعناصر البيانات الظاهرية.

عناصر البيانات الظاهرية هي تلك العناصر التي يمكن حساب قيمتها باستخدام عناصر أخرى عندما تكون القيمة مطلوبة. يمكن حساب قيمة عنصر البيانات الكمية في الجدول 1.2.2 بضرب الكمية بالسعر وبالتالي القضاء على عناصر البيانات المتكررة هذه.

وإذا تم الاحتفاظ بجدول آخر يسمى الجدول الرئيسي للموردين في قاعدة البيانات ، فمن المرجح أن يكون الجدول 1-1-2 بمثابة مجموعة فرعية من الجدول الرئيسي للمورد. وبالتالي ، قد يتم التخلص من هذا الجدول أيضًا.

أما الشكل الثالث (3NF) ، فيقدم مجموعة بيانات بسيطة وسهلة الصيانة وبأقل قدر من التكرار.

وبالتالي ، يمكن أن يساعد التطبيع في الحد من التكرار بالإضافة إلى إزالة الشذوذات الأخرى في البيانات. عملية التطبيع ذات الثلاث خطوات التي نوقشت أعلاه ليست سوى إيحائية. قد يتم إجراء محاولات أخرى أثناء تصميم قواعد البيانات ، إذا لزم الأمر ، استنادًا إلى طبيعة البيانات.