آپارتاید الگوریتمی؛ چرا هوش مصنوعی به کاربران فارسی‌زبان پاسخ‌های ضعیف‌تری می‌دهد؟

مروری کوتاه بر خبر

گزارشهای MIT در سال ۲۰۲۶ نشان میدهد مدلهای هوش مصنوعی مانند OpenAI و گوگل برای کاربران فارسیزبان عملکرد ضعیفتری دارند.
هوش مصنوعی اغلب سوالات فارسی را به انگلیسی ترجمه و پاسخ را بازترجمه میکند که دقت را تا ۳۰ درصد کاهش میدهد.
محدودیتهای دسترسی مانند تحریمها و فیلترینگ نیز در افت کیفیت پاسخها نقش دارند.
پژوهش MIT هشدار میدهد این شکاف دیجیتال میتواند باعث عقبماندگی دانشآموزان و نخبگان کشورهای در حال توسعه شود.

گزارش‌های سال ۲۰۲۶ دانشگاه MIT نشان می‌دهد کاربران فارسی‌زبان با نسخه‌ای ضعیف‌تر از هوش مصنوعی مواجه هستند. مدل‌های بزرگ زبانی مانند محصولات OpenAI و گوگل در مواجهه با زبان فارسی و کاربران ایرانی عملکردی ضعیف‌تر نسبت به همتایان انگلیسی‌زبان خود دارند. این موضوع دلایل فنی و سیاسی متعددی دارد.

تبعیض در کد؛ یک شکاف سیستماتیک

پرسش اصلی اینجاست: چرا یک دانش‌آموز در نیویورک به تحلیل‌های دقیق علمی دسترسی دارد، اما همان مدل برای دانش‌آموز ایرانی جملات متناقض تولید می‌کند؟ کارشناسان معتقدند این تنها یک نقص فنی نیست، بلکه نتیجه «تنبلی الگوریتمی» شرکت‌هایی است که زبان انگلیسی را بهینه می‌کنند و فارسی را در حاشیه رها کرده‌اند. این وضعیت به نوعی «آپارتاید دیجیتال» تعبیر شده است.

زندانی در حصار زبان‌های کم‌منبع

زبان فارسی در دنیای داده‌های هوش مصنوعی یک زبان «Low-Resource» یا کم‌منبع محسوب می‌شود. با توجه به اینکه بیش از ۹۰ درصد داده‌های آموزشی را متون انگلیسی تشکیل می‌دهند، درک مدل از ظرافت‌های دستوری و اصطلاحات فارسی بسیار محدود است. در واقع، هوش مصنوعی اغلب سوالات فارسی را در لایه‌های زیرین به انگلیسی ترجمه کرده و پس از یافتن پاسخ، آن را بازترجمه می‌کند. این فرآیند باعث کاهش دقت پاسخ در حوزه‌های علمی و منطقی تا ۳۰ درصد می‌شود.

شکاف فرهنگی و سوگیری داده‌ها

ابزارهای هوش مصنوعی آینه داده‌های آموزش‌دیده هستند. بخش بزرگی از محتوای فارسی موجود در وب که برای آموزش این مدل‌ها استفاده شده، یا حاصل ترجمه‌های ماشینی ضعیف است یا با واقعیت‌های زیسته در ایران فاصله دارد. این امر باعث می‌شود پاسخ‌های هوش مصنوعی در مسائل اجتماعی، حقوقی و سبک زندگی برای کاربر ایرانی «غیربومی» و گاهی بی‌ربط به نظر برسد.

نابرابری در دسترسی و زیرساخت

محدودیت‌های دسترسی مانند تحریم‌ها و فیلترینگ نیز در این معضل نقش دارند. وقتی کاربر ایرانی مجبور است با ابزارهای تغییر آی‌پی و از طریق واسطه‌ها به سرویس‌ها متصل شود، ممکن است به دلیل اختلال در تبادل داده یا استفاده از نسخه‌های قدیمی‌تر، کیفیت پاسخ‌ها افت کند. در مقابل، کاربری در کالیفرنیا با دسترسی مستقیم به آخرین نسخه‌های بهینه‌شده، تجربه‌ای کاملاً متفاوت دارد.

توهم و هشدار برای آینده

پژوهش دانشگاه MIT اشاره می‌کند مدل‌های هوش مصنوعی در پاسخ به کاربران با ساختارهای زبانی غیرانگلیسی، بیشتر دچار «توهم» (Hallucination) می‌شوند؛ یعنی با اطمینان کامل اطلاعات غلط ارائه می‌دهند. این تحقیق هشدار می‌دهد که این «شکاف دیجیتال نوین» می‌تواند باعث عقب ماندن نخبگان و دانش‌آموزان کشورهای در حال توسعه در رقابت جهانی شود.

منبع: Hamshahrionline

تکنولوژی

محمدرضا قاسمی5 اسفند 1404

آپارتاید الگوریتمی؛ چرا هوش مصنوعی به کاربران فارسی‌زبان پاسخ‌های ضعیف‌تری می‌دهد؟

تبعیض در کد؛ یک شکاف سیستماتیک

زندانی در حصار زبان‌های کم‌منبع

شکاف فرهنگی و سوگیری داده‌ها

نابرابری در دسترسی و زیرساخت

توهم و هشدار برای آینده

دیدگاهتان را بنویسید لغو پاسخ

نتانیاهو: در آستانه روزهای پیچیده؛ تهدید ایران با واکنش غیرقابل تصور پاسخ داده می‌شود؟

آیا ارائه پیشنهادهای جدید و چشم‌پوشی از گذشته، شرط توافق ایران و آمریکا است؟

اتحادیه اروپا در تصویب بیستمین بسته تحریمی علیه روسیه شکست خورد؟

تاریخچه رانندگی در ایران: از واگن اسبی تا چراغ راهنمایی

عطیه بازیگر «سریال ساهره» در ۲۶ سالگی؛ چهره واقعی او چقدر با نقشش متفاوت است؟

عروسی باشکوه نیلوفر شهیدی؛ از لباس عروس محشر تا داماد جنتلمن

ایران و بورکینافاسو؛ همکاری راهبردی در آفریقا بر پایه منافع متقابل؟

آیا بازیکنان لیورپول به خاطر یاد نگرفتن آلمانی جریمه می‌شوند؟

گزارشگر بازی استقلال چه سوتی عجیبی داد؟

عمار حکیم: گفت‌وگوی ایران و آمریکا کوتاه‌ترین راه برای دوری منطقه از بحران است