التنقيب في البيانات أو استخراج البيانات هو تحليل كميات كبيرة من البيانات لاكتشاف الأنماط والمعرفة. في الواقع، فإن استخراج البيانات يعرف أيضاً باسم اكتشاف البيانات أو اكتشاف المعرفة.

يستخدم استخراج البيانات الإحصاءات، ومبادئ تعلم الآلة، والذكاء الاصطناعي، وكميات هائلة من البيانات (غالباً من قواعد البيانات أو مجموعات البيانات) لتحديد الأنماط بطريقة تلقائية ومفيدة قدر الإمكان.

ماذا يفعل التنقيب في البيانات؟

إن استخراج البيانات له هدفان أساسيان: الوصف، والتنبؤ.

أولاً، يصف استخراج البيانات الرؤى والمعرفة التي تم الحصول عليها من تحليل الأنماط في البيانات. وثانياً، يستخدم استخراج البيانات وصف أنماط البيانات المعترف بها للتنبؤ بالأنماط المستقبلية.

على سبيل المثال، إذا كنت قد أمضيت وقتاً في التصفح على موقع تسوق للكتب حول كيفية التعرف على أنواع مختلفة من النباتات، فإن خدمات التنقيب في البيانات التي تعمل خلف الكواليس على هذا الموقع تسجل وصفاً لعمليات البحث الخاصة بك في ما يتعلق بملفك الشخصي.

عند تسجيل الدخول مرة أخرى بعد أسبوعين، تستخدم خدمات التنقيب في البيانات في الموقع وصف عمليات البحث السابقة للتنبؤ باهتماماتك الحالية، وتقديم توصيات مخصصة للتسوق تتضمن كتباً حول تحديد النباتات.

كيف يعمل التنقيب في البيانات

يعمل استخراج البيانات باستخدام الخوارزميات، ومجموعات من التعليمات التي تخبر جهاز الكمبيوتر أو جهاز المعالجة كيفية القيام بمهمة، لاكتشاف أنواع مختلفة من الأنماط داخل البيانات.

وهناك عدد قليل من أساليب التعرف على الأنماط المختلفة المستخدمة في استخراج البيانات تتضمن التحليل العنقودي، والكشف عن الشذوذ، وتعلم الارتباطات، والاعتماد على البيانات، وأشجار القرار، ونماذج الانحدار، والتصنيفات، والكشف الخارجي، والشبكات العصبية.

في حين يمكن استخدام استخراج البيانات لوصف والتنبؤ بالأنماط في جميع الأنواع المختلفة من البيانات، فإن الاستخدام الأبرز الذي يواجهه المستخدمين -حتى لو لم يعلموا بوجوده- هو وصف الأنماط في اختياراتك وسلوكياتك الشرائية للتنبؤ بقرارات الشراء المحتملة في المستقبل.

على سبيل المثال، هل تساءلت يوماً كيف يبدو فيس بوك دائماً وكأنه يعلم ما كنت تبحث عنه في الإنترنت، إعلانات متعلقة بمواقع قمت بزيارتها سابقاً أثناء بحثك على الإنترنت؟

يستخدم التنقيب في البيانات على فيس بوك المعلومات المخزنة في المتصفح الخاص بك كي يتتبع الأنشطة الخاصة بك، مثل ملفات تعريف الارتباط، جنباً إلى جنب مع معرفته الخاصة من الأنماط الخاصة بك والتي جمعها من استخدامك لموقع فيس بوك نفسه، ثم يعرض لك العروض أو المنتجات التي قد تكون مهتماً بها.

أنواع البيانات التي يمكن استخراجها

اعتماداً على الخدمة أو المخزن (متاجر التجزئة تستخدم استخراج البيانات أيضاً)، هناك كمية مدهشة من البيانات عنك وعن الأنماط الخاصة بك التي يمكن استخلاصها.

قد تتضمن البيانات التي تم جمعها عنك نوع السيارة التي تقودها، ومكان إقامتك، والأماكن التي سافرت إليها، والمجلات والصحف التي تشترك فيها، وما إذا كنت متزوجاً أم لا.

ويمكن أيضاً تحديد ما إذا كان لديك أطفال، أو ما هي هواياتك، أو الفريق الموسيقى المفضل لديك، أو الميول السياسية الخاصة بك، أو ما تشتري سواء على الإنترنت أو في متاجر التجزئة (في كثير من الأحيان يحدث هذا من خلال بطاقات مكافأة ولاء العملاء)، وأي تفاصيل تشاركها عن حياتك على وسائل الإعلام الاجتماعية.

على سبيل المثال، تجار التجزئة وجهات النشر القائمة على الموضة التي تستهدف المراهقين تستخدم إحصائيات من التنقيب في الصور على خدمات وسائل الاعلام الاجتماعية مثل إنستاجرام وفيس بوك للتنبؤ باتجاهات الموضة التي سوف تغري المتسوقين أو القراء ممن هم في سن المراهقة.

إن الإحصائيات المكتشفة من خلال استخراج البيانات يمكن أن تكون دقيقة بحيث يمكن لبعض تجار التجزئة التنبؤ بأن تكون المرأة حامل، استناداً إلى تغييرات محددة جداً في خيارات الشراء الخاصة بها.

استخراج البيانات في كل مكان، ومع ذلك، يتم استخدام الكثير من المعلومات التي تم اكتشافها وتحليلها عن عادات الشراء لدينا، والتفضيلات الشخصية، والخيارات، والمالية، والأنشطة عبر الإنترنت من قبل المتاجر والخدمات بهدف تعزيز تجربة العملاء.

إخلاء مسئولية

يتم نشر جميع المعلومات الواردة على موقعنا بحسن نية ولأغراض المعلومات العامة فقط. أي إجراء يتخذه القارئ بشأن المعلومات الموجودة على موقعنا هو على مسؤوليته الخاصة.

اشترك في نشرة رواد الأعمال

احصل على أحدث المقالات في مجال ريادة الأعمال مباشرةً في صندوق بريدك.

مقالات ذات صلة

إطلاق خمسة منتجات إقامة مميزة في السعودية تستهدف المواهب والمستثمرين العالميين

في خطوة لتعزيز برنامج الإقامة المميزة وجذب الكفاءات العالمية، أطلقت المملكة العربية…

الصين تسعى لرقمنة المناجم لتحسين الأمان

تستخدم الصين تقنية «الذكاء الاصطناعي» لتحسين سجلها في مجال السلامة في المناجم…

«أندلسية لابس» تتخطى الـ مليار دولار بعد جولة تمويل ناجحة

أبوظبي – حققت شركة «أندلسية لابس»، الرائدة عالميًا في مجال بنى إدارة…

الشيخ مشعل يعين الشيخ محمد الصباح رئيسًا لوزراء الكويت

أصدر أمير الكويت الشيخ مشعل الأحمد الجابر الصباح، يوم الخميس، مرسومًا بتعيين…

النفايات الإلكترونية.. قنبلة موقوتة تهدد صحة الإنسان والبيئة

حذّر تقرير أممي حديث من تنامي ظاهرة النفايات الإلكترونية بشكلٍ مُقلق، مُشيرًا…

فوري تُخطط لإطلاق بنك رقمي وتقديم الخدمات المالية

أعلنت فوري، الشركة الرائدة في مجال حلول الدفع الإلكتروني في مصر، عن…

Sandbox تخصص 2 مليار دولار للاستثمار في الميتافيرس

أعلنت شركة Animoca Brands المالكة لمشروع Sandbox عن تخصيص مبلغ بقيمة 2…

الرئيس التركي يطلب من تسلا إنشاء مصنع في تركيا

طلب الرئيس التركي، رجب طيب أردوغان، من الرئيس التنفيذي لشركة تسلا، إيلون…

مجموعة stc تتصدر قائمة أفضل أماكن العمل في السعودية

في إنجاز جديد يضاف إلى سجلها الحافل، حصدت مجموعة الاتصالات السعودية stc…

هل تقبل أوروبا عملة البريكس في عام 2024؟

صرح تحالف البريكس مؤخرًا، وسط خطط إزالة الدولار الشاملة، أن عملته هي…

سام ألتمان يعبر عن قلقه حيال مستقبل البيتكوين والعملات الرقمية

أعرب سام ألتمان، مؤسس OpenAI، الشركة الأم لمنصة تفاعل الذكاء الاصطناعي ChatGPT،…

البنوك الصينية تسجل ارتفاعًا في حجم المعاملات مع روسيا باستخدام اليوان

تعمل البنوك الصينية على تعزيز جهودها لتشجيع استخدام اليوان في التجارة الدولية،…

زعماء G20 يرغبون في فرض ضرائب على العملات المشفرة

وفقًا لتقرير من موقع الأخبار الياباني Jiji.com، دعت بلدان مجموعة العشرين أثناء اجتماعها…

شراكة بين Paymob وآيكيا لتسهيل الدفع على العملاء

أصبح لعملاء شركة آيكيا في مصر الآن مجموعة واسعة من خيارات الدفع،…

البحث عن سبب فشل تنفيذ تخطيط موارد المؤسسات ERP

تعتبر حالات فشل تنفيذ تخطيط موارد المؤسسات (ERP)، الناتجة في كثير من…