في وسط التطور التكنولوجي الرهيب الذي نعيشه الآن، هناك أعداد هائلة من البيانات التي يتم تجميعها كل لحظة، مماجعل مهمة التعامل مع هذه البيانات صعبة للغاية، وهو ما أدى إلى ظهور مصطلح “البيانات الضخمة”
ولأن هذه البيانات كبيرة جدًا ومعقدة للغاية، فلزم إستخدام وحدات قياس تناسبها غير البايت والميجا بايت والجيجابايت الخ.. حتى نصل إلى وحدة تسمى “يوتابايت” والتي تمثل 280 بايت وهو رقم مهول جدًا.
ومنذ عام 2012، يتم إنتاج أكثر من 1.2 زيتابايت من البيانات سنويًّا أي ما يعادل 1021بايت، أو ما يكفي لملء 80 مليار جهاز ’آي فون‘ سعة 16 جيجابايت، ويقوم كل فرد منا بإنشاء 2.2 مليون تيرا بايت من البيانات بشكل يومي، و هناك 12 تيرابايت من التغريدات يوميًا على تويتر مع 25 تيرابايت من سجلات الدخول على فيس بوك يومياً و على تويتر أكثرمن 200 مليون مستخدم نشط يكتبون أكثر من 230 مليون تغريدة على تويتر يوميًا.
تتسم البيانات الضخمة بثلاث خصائص:
الحجم
وهو حجم البيانات التي نقوم بإطلاقها أو إنشائها،
التنوع
وهو مدى هيكلة وتهيئة هذه البيانات وهل تحتاج إلى تنسيق وإعداد أم لا
والسرعة
وهي مدى تواتر حدوث عملية تجميع البيانات وتكوينها.
وتتمثل أهمية البيانات الضخمة في حجم البيانات التي يمكن تجميعها حول أشخاص وأشياء معينة، والتي من شأنهاأن تعزز مدى قدرة الشركات على إتخاذ قرارات فعالة تزيد من نمو ونجاح الشركة إعتمادًا على أرقام وحقائق ملموسة منالمستخدمين الفعليين. والشركات العملاقة التي لديها عدد مستخدمين كبير مثل فيس بوك وتويتر وغيرهم يقومونبتجميع ومعادلة ملايين الصور والتغريدات، وأرقام مهولة من البيانات كل ثانية واحدة فقط،فيديو يشرح لك ما هيالبيانات الضخمة وآلية عملها