كشف باحثون من معهد «ماساتشوستس» عن سبب ميل النماذج اللغوية الكبيرة مثل ChatGPT أو DeepSeek إلى المبالغة في تقدير المعلومات الموجودة في بداية ونهاية النص مع إهمال منتصفه.
وهذه الظاهرة التي تسمى «تحيز الموضع» قد تعوق المستخدمين الذين يبحثون عن عبارات مفتاحية في المستندات الطويلة.
وطور فريق علمي بقيادة الباحث شين يي وو من معهد «ماساتشوستس» التكنولوجي نمطا يفسر سبب تركيز النماذج اللغوية الكبيرة مثل ChatGPT على بداية ونهاية النص.
فهي تقرأ النص على أجزاء و«تركز» على الكلمات الأكثر أهمية لفهمه، لكن بعض الإعدادات التقنية، مثل قدرتها على رؤية الكلمات السابقة فقط أو توجيهات ترتيب الكلمات، تخلق تحيزا.
والسبب الرئيسي لاهتمامها ببداية النص مرتبط بالمعالجة التسلسلية، حيث تأخذ النماذج في الاعتبار الكلمات السابقة فقط، مما يجعل الأجزاء الأولية تبدو أكثر تأثيرا. وعلى سبيل المثال ففي وثيقة متكونة من 30 صفحة، تصل احتمالية العثور على المعلومة المطلوبة في البداية أو النهاية إلى 85%، بينما في المنتصف
لا تتجاوز 60%.