مقالات في التكنولوجيا

البيانات الضخمة Big Data

نسمع كثيرا عن مصطلح البيانات الضخمة Big Data و سرعة انتشار هذا المجال في سوق العمل وهو جيل جديد من الحوسبة تقوده البيانات الضخمة Big Data، والتي تلقى انتشارا واسعا في مجال سوق عمل تقنية المعلومات والتي قد تغير عملية نقل البيانات بأنواعها وتسهل عملية البحث عنها.

يطلق مصطلح البيانات الضخمة على البيانات ذات الحجم الهائل والتي تختلف أنواعها ومصادرها ويصعب معالجتها بالطرق التقليدية، ويزيد حجم هذه البيانات باستمرار وتتنقل بسرعة بين الأنظمة المختلفة والإنترنت. علي الرغم من هذه التحديات إلا أن البيانات الضخمة تساعد الشركات والمؤسسات على اتخاذ القرار وتحسين الخدمات. تعد البيانات التي يتم تجميعها من الشبكة العنكبوتية والتي تكون عبارة عن كلمات أو صور أو مقاطع مصورة أو قراءات لمستشعرات من أبرز أمثلة البيانات الضخمة بسبب حجمها الكبير وعدم انتظامها وصعوبة حصرها وتخزينها في قاعدة بيانات واحدة. 

تحليل البيانات الضخمة واستخلاص المعارف منها يتطلب استخدام  أدوات من تكنولوجيا الذكاء الاصطناعي وتنقيب البيانات. ويعتمد التقدم في بعض أنظمة الذكاء الاصطناعي على كمية البيانات المدخلة وكل كانت هذه البيانات أكبر كلما كان ذلك أفضل. علي سبيل المثال في حالة الأنظمة التي تعتمد على تعليم الألة، هذه الأنظمة تحتاج إلى كمية بيانات كبيرة، حيث كلما زاد حجم هذه البيانات واختلفت تركيبتها كلما كان ذلك أفضل لهذه الأنظمة في فهم وتحليل البيانات. من أمثلة التطبيقات التي تبنى على تكنولوجيا تعليم الآلة تطبيق سيري (Siri) الذي تقدمه شركة أبل في أجهزتها المحمولة، وهو عبارة عن تطبيق للإجابة على تساؤلات المستخدم المختلفة، حيث أنه يعتمد على تعليم نفسه بنفسه من خلال الأسئلة والبيانات التي يدخلها المستخدم، وكلما زادت كمية البيانات المدخلة للتطبيق كلما زادت دقة إجابته.

اعلانات جوجل

خصائص البيانات الضخمة

الحجم: وهي حجم البيانات المستخرجة من مصدر ما، وهو ما يحدد قيمة وإمكانات البيانات لكي تصنف من ضمن البيانات الضخمة؛ و قد يكون الخاصية الأكثر أهمية في تحليل البيانات الضخمة. كما أن وصفها بالضخمة لا يحدد كمية معينة؛ بل يقاس عادة بالبيتا بايت او بالإكسا بايت، ومع حلول العام 2020 سيحتوى الفضاء الإلكتروني على ما يقرب من 40.000 ميتابايت من البيانات الجاهزة للتحليل واستخلاص المعلومات؛ ويقدر أن %90 من البيانات الموجودة في العالم اليوم قد استحدثت خلال السنتين الأخيرتين، بواسطة أجهزة وعلى أيدي بشر ساهم كلاهما في تزايد البيانات.

التنوع: ويقصد بها تنوع البيانات المستخرجة، والتي تساعد المستخدمين سواء كانوا باحثين أو محللين على اختيار البيانات المناسبة لمجال بحثهم و تتضمن بيانات مهيكلة في قواعد بيانات و بيانات غير مهيكلة تأتي من طابعها غير الممنهج، مثل: الصور ومقاطع وتسجيلات الصوت وأشرطة الفيديو والرسائل القصيرة وسجلات المكالمات وبيانات الخرائط (GPS) وغيرها؛ وتتطلب وقتاً وجهداً لتهيئتها في شكل مناسب للتجهيز والتحليل.

السرعة: ويقصد بها سرعة إنتاج واستخراج البيانات لتغطية الطلب عليها؛ حيث تعتبر السرعة عنصراً حاسماً في اتخاذ القرار بناء على هذه البيانات، وهو الوقت الذي نستغرقه من لحظة وصول هذه البيانات إلى لحظة الخروج بالقرار بناء عليها.

تطبيقات البيانات الضخمة

الصحة: يعد مجال الصحة من المجالات التي تستفيد من البيانات الضخمة بشكل كبير، حيث يمكننا الآن تحليل سلاسل الحمض النووي بدقائق ومعرفة علاجات جديدة للأمراض وتوقع حدوث الأوبئة. فقط تخيل لو أن جميع بيانات المرضى من وزن وعمر وسلوك وأيضاً أعراض ونتائج المرض تم تجميعها ومعالجتها، سينتج لدينا المعرفة اللازمة لمعالجة ومنع انتشار الأمراض. كذلك يتم حالياً استخدام البيانات الضخمة في حاضنات الأطفال حديثي الولادة، حيث يتم تسجيل الأطفال المولودين خلال فترات زمنية طويلة وتحليل سلوكهم من تنفس ونبض، وبعد معالجة هذه البيانات يتم التوصل إلى خوارزمية للتنبؤ مستقبلاً بالأمراض عند الأطفال حديثي الولادة.

الرياضة: يتم استخدام تحليل البيانات الضخمة في معظم الرياضات الكبرى، حيث يتم تسجيل حركة اللاعبين من خلال الفيديو وتحليل نشاطاتهم وسلوكهم في الملعب مما يساعد في تحسين خطط اللعب واكتشاف نقاط الضعف.

الأمن: تستخدم وكالة الأمن الوطني الأمريكي تحليل البيانات الكبيرة المستمدة من الإنترنت ووسائل الاتصال الإلكتروني والشبكات الاجتماعية في إحباط المخططات الإرهابية عن طريق تحليل البيانات ومعرفة سلوك وتوجهات الأفراد، كما يتم استخدام البيانات الكبيرة في منع والحماية من الهجمات الإلكترونية.

تحسين أداء الآلات والأجهزة: تساعد البيانات الكبيرة في تحسين أداء الآلات وجعلها أكثر ذكاءً. على سبيل المثال، سيارة القيادة الذاتية من جوجل تأتي بمجموعة من الأجهزة المختلفة مثل الكاميرات والمستشعرات ونظام الملاحة العالمي. بإستخدام تحليل البيانات الواردة من هذه الأجهزة يمكن المساعدة في تحسين أداء السيارة  لتجنب مناطق الازدحامات المرورية أو التكيف مع حالة الطريق. 

أمثلة عملية

مصادم الهيدرون العظيم يملك 150 مليون جهاز استشعار تقدم بيانات 40 مليون مرة في الثانية الواحدة. وهناك ما يقرب من 600 مليون تصادم في الثانية الواحدة. لكن نتعامل فقط مع أقل من 0.001% من بيانات تيار الاستشعار، فإن تدفق البيانات من جميع تجارب المصادم الأربعة يمثل 25 بيتابايت.

موقع امازون Amazon.com يعالج ملايين العمليات الخلفية كل يوم، فضلاً عن استفسارات من أكثر من نصف مليون بائع طرف ثالث. وتعتمد أمازون علي نظام اللينوكس بشكل أساسي ليتمكن من التعامل مع هذا الكم الهائل من البيانات، و تملك أمازون أكبر 3 قواعد بيانات لينوكس في العالم والتي تصل سعتها إلي 7.8، 18.5 و 24.7 تيرابايت.

اعلانات جوجل

سلسلة المتاجر Walmart تعالج أكثر من مليون معاملة تجارية كل ساعة، والتي يتم استيرادها إلي قواعد بيانات يُقدر أنها تحتوي علي أكثر من 2.5 بيتابايت (2560 تيرابايت) من البيانات – وهو ما يوازي 167 ضعف البيانات الواردة في جميع الكتب الموجودة في مكتبة الكونغرس في الولايات المتحدة.

يعالج فيس بوك 50 مليار صورة من قاعدة مستخدميه. ويقوم نظام حماية بطاقات الائتمان من الاحتيال ” FICO Falcon Credit Card Fraud Detection System” بحماية 2.1 مليار حساب نشط في جميع أنحاء العالم.

تقوم شركة Windermere Real Estate باستخدام إشارات GPS مجهولة من ما يقرب من 100 مليون سائق لمساعدة مشتري المنازل الجدد لتحديد أوقات قيادتهم من وإلى العمل خلال الأوقات المختلفة لليوم.

تأثير البيانات الكبيرة

لمعرفة تأثير البيانات الكبيرة قال الدكتور “إيرك برينجولفشن”(Erik Brynjolfsson) الخبير الاقتصادي في معهد ماساتشوستس للتقنية أنه يمكن تشبيه البيانات الضخمة بالميكروسكوب: اختراع  الميكروسكوب تم قبل قرون مضت ومن خلاله استطاع العلماء معرفة وقياس أشياء لم يكونوا يتخيلوها من قبل على مستوى الخلية، حيث كان الميكروسكوب يمثل  تطوراً هائلاً في القياس والاستكشاف. بالنسبة للبيانات الضخمة فهي عبارة عن ميكروسكوب العصر الحديث حيث أنه من خلالها تستطيع رؤية الأشياء وقياس البيانات كما لم تكن تتوقعها.  فمثلا يمكن عن طريق تحليل نتائج البحث في جوجل ومنشورات الفيسبوك وتغريدات تويتر معرفة أمور عن الشخص وسلوكه بتفاصيل دقيقة لم تكن معلومة من قبل. كما صرح الدكتور “إيرك” أنه في مجالات الاقتصاد وإدارة الأعمال سوف يتم الاعتماد في اتخاذ القرارات والتنبؤ توجهات المستهلكين على تحليل البيانات بدلاً من الخبرة لدى أصحاب القرار. وفي ورقة علمية نشرها الدكتور “إيرك” بالتعاون مع اثنين من زملائه تم من خلالها استنتاج أن هناك 179 من الشركات الكبرى في الولايات المتحدة تستخدم تحليل البيانات الضخمة كمعدلات الاستهلاك وتقييمات الزبائن في اتخاذها للقرارات وإدارة الشركة، مما أدى إلى زيادة في الإنتاجية بنسبة 5 أو 6 بالمئة مقارنةً بالشركات التي لا تعتمد تحليل البيانات الضخمة .

وقد تم اكتشاف قوة البيانات الضخمة في العديد من المجالات غير التكنولوجيا منها الصحة العامة والاقتصاد والإدارة، حيث وجد الباحثون في جوجل أن العديد من الأشخاص في منطقة معينة قاموا  بالبحث عن كلمات مثل “دواء للإنفلونزا” أو “أعراض الأنفلونزا”، وبعدها بأسبوعين تم ملاحظة زيادة في عدد الأشخاص الذين دخلوا المستشفى الموجودة في هذه المنطقة مصابين بالإنفلونزا.

في زمننا هذا نشهد انفجارا ضخما في البيانات فتحليل ومعالجة هذه البيانات يزيد بشكل رئيسي في فهم واستيعاب متطلبات العملاء وبالتالي زيادة الكفاءة والانتاجية وتقليل الخسائر بالنسبة للشركات. ومما لا شك فيه ان البيانات الضخمة عاملاً أساسياً في اتخاذ القرارات في الشركات الكبرى وذلك نتيجة لتداخل مصادر البيانات في جميع مجالات حياة المستخدم، حيث أننا من خلال بحث جوجل ومنشورات الفيسبوك وتغريدات تويتر وسجل التسوق الإلكتروني نستطيع معرفة سلوك الإنسان وطموحاته وخططه المستقبلية وتوقعاته ،وبناءا عليه يمكن للشركات الكبري اتخاذ قراراتها العملية.

اعلانات جوجل

الدكتور حازم فلاح سكيك

د. حازم فلاح سكيك استاذ الفيزياء المشارك في قسم الفيزياء في جامعة الازهر – غزة | مؤسس شبكة الفيزياء التعليمية | واكاديمية الفيزياء للتعليم الالكتروني | ومنتدى الفيزياء التعليمي

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

هذا الموقع يستخدم Akismet للحدّ من التعليقات المزعجة والغير مرغوبة. تعرّف على كيفية معالجة بيانات تعليقك.

زر الذهاب إلى الأعلى