Big Data
من المُصطلحات المهمة حاليًا هو الـ "Big Data" ولكن:
هل تعرف معناه أو أشكاله؟
والمبدأ اللي بيعتمد عليه؟
لو ما عندكش فكرة فالكلام دا مهم.
مبدئيًا إيه معنى الـ Data؟
يعني البيانات اللي ممكن تكون في أشكال مُختلفة سواء صور وكتابات ورموز، أو خليط ما بينهم وكمان ممكن تكون بيانات في شكل جداول لكن بيانات لم يتم معالجتها وترتيبها ويُطلق عليها لفظ (الخام).
و بعض انواعها تتمثل في الآتي:
⬅️ بيانات مهيكلة: فيها البيانات بتكون في شكل جداول وقواعد بيانات.
⬅️ بيانات شبه مهيكلة: تعتبر بيانات مهيكلة لكن مش في صورة جداول وقواعد بيانات.
⬅️ بيانات غير مهيكلة : البيانات اللي الإنسان بيستخدمها بشكل يومي زي الصور والكتابات والرموز.
ولكن السؤال إيه العلاقة بين صور البيانات والـ Big Data؟
- العلاقة إن الـ Big Data هي مجموعات من البيانات الضخمة جدًا والمُعقدة وصعب التعامل معها بواسطة نظم إدارة قواعد البيانات (DBMS) التقليدية من ناحية التخزين، البحث، التمثيل وحجمها يصل الي مئات التيرا بايت؛ ولذلك التصنيف المُتبع للـ Big Data هو مبدأ الـ (3V's) :
1️⃣ حجم البيانات (Volume)
حجم البيانات بيكون كبير جدًا، فـ كل دقيقتين بيتم تسجيل تقريباً 7 ملايين تيرابايت من البيانات
2️⃣ اختلاف وتنوع البيانات (Variety)
الـ Big Data بتستخدم Varchar وInteger بس، ولكن كل أنواع البيانات مُرحب بيها وأي بيانات يرجع مصدرها لرقم ثنائي (0,1)، علي عكس قواعد البيانات التقليدية مش بتسمح غيّر بأنواع بتحددها انت.
3️⃣ سرعة تداول البيانات (Velocity)
سرعة النقل من حفظ المعلومات واستدعائها بيتم بشكل سريع وفوري رغم ضخامة المعلومات، ومؤخرًا تم إضافة مبدأ "صحة البيانات".
مجال الـ Big Data بيتقسم لخطوات متكاملة بتتكون من :
1️⃣ Data warehousing:
تجميع البيانات وفلترتها وعزل البيانات الضارة.
2️⃣ Data collection :
تجميع البيانات وحفظها في المكان المخصص ليها .
3️⃣ Data analysis :
تحليل البيانات ومعرفة طريقة استخدمها بشكل صح .
4️⃣ Data transformation :
تطبيق التغييرات اللازمة بعد التعديل و الفلترة لتطوير البيانات .
-ومن اللغات البرمجية المهمة المُستخدمه في مجال الـ Big data واللي لازم تتعلمها (Python, SQL) وأشهر البرامج الي بيتم استخدامها هي الـ MATLAB.
وبكده عرفنا يعني ايه "Big Data".