التحيز بين الجنسين هو شيء حقيقي وتستخدم Meta الذكاء الاصطناعي لمكافحته
على الإنترنت وفي العالم الحقيقي ، فإن تمثيل النساء أقل بكثير من الرجال في جميع أنواع الأشياء سواء كانت مهنة أو صناعة الترفيه. إذا دعت الحاجة إلى المعلومات ، فنحن نذهب تلقائيًا إلى ويكيبيديا ولكن ويكيبيديا ليست متنوعة كما قد تظن لأن تمثيل النساء هناك ناقص أيضًا.
لا يعطي الموقع الفضل والتقدير الذي تستحقه النساء لأن 20٪ فقط من السير الذاتية على ويكيبيديا مملوكة للنساء. تتدهور هذه النسبة أكثر عندما نتحدث عن الصناعات التي يهيمن عليها الذكور مثل العلوم والمجتمعات التاريخية الممثلة تمثيلا ناقصا.
لمعالجة حقيقة أن التحيز الجنساني موجود بشكل خاص على الإنترنت ، عملت أنجيلا فان ، وهي باحثة في الذكاء الاصطناعي في Meta ، على هذا الموضوع للحصول على درجة الدكتوراه. من أجل إكمال البحث ، تعاونت مع مستشارة الدكتوراه ، كلير غاردنت ، وهي باحثة تعمل في علوم الكمبيوتر. أنشأوا معًا ذكاءً إصطناعيًا يمكنه إنشاء سير ذاتية بأسلوب ويكيبيديا في المرحلة الأولى من المسودات ومصادرها. لقد كشفوا الآن عن الأشياء التي اكتشفوها خلال البحث في ورقة بعنوان "إنشاء سيرة ذاتية كاملة الطول على ويكيبيديا: تأثير التحيز الجنساني على الجيل القائم على الاسترداد للسير الذاتية للنساء"
أصدرت Meta أيضًا النموذج والبيانات التي تتطلبها. من خلال هذا النموذج ، يريدون تمثيل المرأة في العلوم ، ليس فقط في أوروبا وأمريكا ولكن أيضًا في آسيا وأفريقيا مع التركيز بشكل أساسي على الأخيرة.
يعمل الأشخاص في NLP أو Natural Language Processing على طرق للتغلب على التحيز الجنساني بما يتماشى مع اكتشاف استخدام لغة مسيئة أو افتراءات ، والحوار مع التعهدات والترجمات التي تقوم بها الآلات. في مجموعات Wikipedia مثل WikiProject Women و Women in Red وهي مجموعة تحريرية. تعمل كلتا المجموعتين وغيرهما على إزالة التحيز من موقع الويب ولكنهما لا تتحققان من العوامل التي أدرجت التحيز الذي يعد خطوة حاسمة في إزالته كما أشار فان.
واحدة من المشاكل الرئيسية في هذا النوع من المشاريع هو ما هو صحيح وما هو غير صحيح. يضع هذا ثلاثة تحديات رئيسية أمام هذه المجموعات ، وهي كيفية جمع المعلومات المطلوبة فقط ، وكيفية تشكيل ذلك في جزء من النص يسهل قراءته ولكن لا يزال على دراية جيدة وأخيراً وليس آخراً كيفية معرفة ما إذا كانت تلك المعلومات انها صحيحة.