آپارتاید الگوریتمی؛ چرا هوش مصنوعی به کاربران فارسیزبان پاسخهای ضعیفتری میدهد؟

- گزارشهای MIT در سال ۲۰۲۶ نشان میدهد مدلهای هوش مصنوعی مانند OpenAI و گوگل برای کاربران فارسیزبان عملکرد ضعیفتری دارند.
- هوش مصنوعی اغلب سوالات فارسی را به انگلیسی ترجمه و پاسخ را بازترجمه میکند که دقت را تا ۳۰ درصد کاهش میدهد.
- محدودیتهای دسترسی مانند تحریمها و فیلترینگ نیز در افت کیفیت پاسخها نقش دارند.
- پژوهش MIT هشدار میدهد این شکاف دیجیتال میتواند باعث عقبماندگی دانشآموزان و نخبگان کشورهای در حال توسعه شود.
گزارشهای سال ۲۰۲۶ دانشگاه MIT نشان میدهد کاربران فارسیزبان با نسخهای ضعیفتر از هوش مصنوعی مواجه هستند. مدلهای بزرگ زبانی مانند محصولات OpenAI و گوگل در مواجهه با زبان فارسی و کاربران ایرانی عملکردی ضعیفتر نسبت به همتایان انگلیسیزبان خود دارند. این موضوع دلایل فنی و سیاسی متعددی دارد.
تبعیض در کد؛ یک شکاف سیستماتیک
پرسش اصلی اینجاست: چرا یک دانشآموز در نیویورک به تحلیلهای دقیق علمی دسترسی دارد، اما همان مدل برای دانشآموز ایرانی جملات متناقض تولید میکند؟ کارشناسان معتقدند این تنها یک نقص فنی نیست، بلکه نتیجه «تنبلی الگوریتمی» شرکتهایی است که زبان انگلیسی را بهینه میکنند و فارسی را در حاشیه رها کردهاند. این وضعیت به نوعی «آپارتاید دیجیتال» تعبیر شده است.
زندانی در حصار زبانهای کممنبع
زبان فارسی در دنیای دادههای هوش مصنوعی یک زبان «Low-Resource» یا کممنبع محسوب میشود. با توجه به اینکه بیش از ۹۰ درصد دادههای آموزشی را متون انگلیسی تشکیل میدهند، درک مدل از ظرافتهای دستوری و اصطلاحات فارسی بسیار محدود است. در واقع، هوش مصنوعی اغلب سوالات فارسی را در لایههای زیرین به انگلیسی ترجمه کرده و پس از یافتن پاسخ، آن را بازترجمه میکند. این فرآیند باعث کاهش دقت پاسخ در حوزههای علمی و منطقی تا ۳۰ درصد میشود.
شکاف فرهنگی و سوگیری دادهها
ابزارهای هوش مصنوعی آینه دادههای آموزشدیده هستند. بخش بزرگی از محتوای فارسی موجود در وب که برای آموزش این مدلها استفاده شده، یا حاصل ترجمههای ماشینی ضعیف است یا با واقعیتهای زیسته در ایران فاصله دارد. این امر باعث میشود پاسخهای هوش مصنوعی در مسائل اجتماعی، حقوقی و سبک زندگی برای کاربر ایرانی «غیربومی» و گاهی بیربط به نظر برسد.
نابرابری در دسترسی و زیرساخت
محدودیتهای دسترسی مانند تحریمها و فیلترینگ نیز در این معضل نقش دارند. وقتی کاربر ایرانی مجبور است با ابزارهای تغییر آیپی و از طریق واسطهها به سرویسها متصل شود، ممکن است به دلیل اختلال در تبادل داده یا استفاده از نسخههای قدیمیتر، کیفیت پاسخها افت کند. در مقابل، کاربری در کالیفرنیا با دسترسی مستقیم به آخرین نسخههای بهینهشده، تجربهای کاملاً متفاوت دارد.
توهم و هشدار برای آینده
پژوهش دانشگاه MIT اشاره میکند مدلهای هوش مصنوعی در پاسخ به کاربران با ساختارهای زبانی غیرانگلیسی، بیشتر دچار «توهم» (Hallucination) میشوند؛ یعنی با اطمینان کامل اطلاعات غلط ارائه میدهند. این تحقیق هشدار میدهد که این «شکاف دیجیتال نوین» میتواند باعث عقب ماندن نخبگان و دانشآموزان کشورهای در حال توسعه در رقابت جهانی شود.
منبع: Hamshahrionline
تکنولوژی