ما هو التنقيب في البيانات

أحمد بكري

التنقيب في البيانات أو استخراج البيانات هو تحليل كميات كبيرة من البيانات لاكتشاف الأنماط والمعرفة. في الواقع، فإن استخراج البيانات يعرف أيضاً باسم اكتشاف البيانات أو اكتشاف المعرفة.

يستخدم استخراج البيانات الإحصاءات، ومبادئ تعلم الآلة، والذكاء الاصطناعي، وكميات هائلة من البيانات (غالباً من قواعد البيانات أو مجموعات البيانات) لتحديد الأنماط بطريقة تلقائية ومفيدة قدر الإمكان.

ماذا يفعل التنقيب في البيانات؟

إن استخراج البيانات له هدفان أساسيان: الوصف، والتنبؤ.

أولاً، يصف استخراج البيانات الرؤى والمعرفة التي تم الحصول عليها من تحليل الأنماط في البيانات. وثانياً، يستخدم استخراج البيانات وصف أنماط البيانات المعترف بها للتنبؤ بالأنماط المستقبلية.

على سبيل المثال، إذا كنت قد أمضيت وقتاً في التصفح على موقع تسوق للكتب حول كيفية التعرف على أنواع مختلفة من النباتات، فإن خدمات التنقيب في البيانات التي تعمل خلف الكواليس على هذا الموقع تسجل وصفاً لعمليات البحث الخاصة بك في ما يتعلق بملفك الشخصي.

عند تسجيل الدخول مرة أخرى بعد أسبوعين، تستخدم خدمات التنقيب في البيانات في الموقع وصف عمليات البحث السابقة للتنبؤ باهتماماتك الحالية، وتقديم توصيات مخصصة للتسوق تتضمن كتباً حول تحديد النباتات.

كيف يعمل التنقيب في البيانات

يعمل استخراج البيانات باستخدام الخوارزميات، ومجموعات من التعليمات التي تخبر جهاز الكمبيوتر أو جهاز المعالجة كيفية القيام بمهمة، لاكتشاف أنواع مختلفة من الأنماط داخل البيانات.

وهناك عدد قليل من أساليب التعرف على الأنماط المختلفة المستخدمة في استخراج البيانات تتضمن التحليل العنقودي، والكشف عن الشذوذ، وتعلم الارتباطات، والاعتماد على البيانات، وأشجار القرار، ونماذج الانحدار، والتصنيفات، والكشف الخارجي، والشبكات العصبية.

في حين يمكن استخدام استخراج البيانات لوصف والتنبؤ بالأنماط في جميع الأنواع المختلفة من البيانات، فإن الاستخدام الأبرز الذي يواجهه المستخدمين -حتى لو لم يعلموا بوجوده- هو وصف الأنماط في اختياراتك وسلوكياتك الشرائية للتنبؤ بقرارات الشراء المحتملة في المستقبل.

على سبيل المثال، هل تساءلت يوماً كيف يبدو فيس بوك دائماً وكأنه يعلم ما كنت تبحث عنه في الإنترنت، إعلانات متعلقة بمواقع قمت بزيارتها سابقاً أثناء بحثك على الإنترنت؟

يستخدم التنقيب في البيانات على فيس بوك المعلومات المخزنة في المتصفح الخاص بك كي يتتبع الأنشطة الخاصة بك، مثل ملفات تعريف الارتباط، جنباً إلى جنب مع معرفته الخاصة من الأنماط الخاصة بك والتي جمعها من استخدامك لموقع فيس بوك نفسه، ثم يعرض لك العروض أو المنتجات التي قد تكون مهتماً بها.

أنواع البيانات التي يمكن استخراجها

اعتماداً على الخدمة أو المخزن (متاجر التجزئة تستخدم استخراج البيانات أيضاً)، هناك كمية مدهشة من البيانات عنك وعن الأنماط الخاصة بك التي يمكن استخلاصها.

قد تتضمن البيانات التي تم جمعها عنك نوع السيارة التي تقودها، ومكان إقامتك، والأماكن التي سافرت إليها، والمجلات والصحف التي تشترك فيها، وما إذا كنت متزوجاً أم لا.

ويمكن أيضاً تحديد ما إذا كان لديك أطفال، أو ما هي هواياتك، أو الفريق الموسيقى المفضل لديك، أو الميول السياسية الخاصة بك، أو ما تشتري سواء على الإنترنت أو في متاجر التجزئة (في كثير من الأحيان يحدث هذا من خلال بطاقات مكافأة ولاء العملاء)، وأي تفاصيل تشاركها عن حياتك على وسائل الإعلام الاجتماعية.

على سبيل المثال، تجار التجزئة وجهات النشر القائمة على الموضة التي تستهدف المراهقين تستخدم إحصائيات من التنقيب في الصور على خدمات وسائل الاعلام الاجتماعية مثل إنستاجرام وفيس بوك للتنبؤ باتجاهات الموضة التي سوف تغري المتسوقين أو القراء ممن هم في سن المراهقة.

إن الإحصائيات المكتشفة من خلال استخراج البيانات يمكن أن تكون دقيقة بحيث يمكن لبعض تجار التجزئة التنبؤ بأن تكون المرأة حامل، استناداً إلى تغييرات محددة جداً في خيارات الشراء الخاصة بها.

استخراج البيانات في كل مكان، ومع ذلك، يتم استخدام الكثير من المعلومات التي تم اكتشافها وتحليلها عن عادات الشراء لدينا، والتفضيلات الشخصية، والخيارات، والمالية، والأنشطة عبر الإنترنت من قبل المتاجر والخدمات بهدف تعزيز تجربة العملاء.

كلمات مفتاحية:
شارك هذا المقال