در مارس ۲۰۲۱، مقالهای تأثیرگذار با عنوان «درباره خطرات پرندگان آماری: آیا مدلهای زبان میتوانند بیش از حد بزرگ باشند؟» از پژوهشگران حوزه زبان و اخلاق فناوری منتشر شد.
این مقاله یک نقطه عطف در فهم مسائل پیرامون مدلهای زبان بزرگ به شمار میرود.
این مقاله با صراحت پرسید: «چه زمانی مدل خیلی بزرگ میشود؟» و هشدار داد که این مدلها ممکن است صرفاً الگوهای آماری عظیمی باشند که «پرندگان آماری» نام گرفتند.
این پرندگان لزوماً فهم معنا ندارند و فقط الگوها را تکرار میکنند.
در متن مقاله آمده است که ما باید یک قدم به عقب برگردیم و بپرسیم: «چه اندازهای بیش از حد بزرگ است؟ خطرات احتمالی مرتبط با این فناوری چیست و چه مسیرهایی برای کاهش آن ریسکها در دسترس است؟»
افزون بر این، مقاله به هزینههای محیط زیستی و مالی بسیار زیاد، مسئله شفافیت دادهها، و خطر بازتولید سوگیریها یا تبعیضهای نهفته در مجموعه آموزشی مدلها اشاره دارد.
این نقطه آغاز جدی برای توجه عمومی و علم به چالشهای مدلهای زبان بزرگ بود و مسیر مخاطره و پرسش باز مسئولیت آغاز شد.
مدلها دچار توهم میشوند: اعتماد به نفس در تولید اطلاعات غلط
یکی از بارزترین مشکلات مدلهای بزرگ زبان، پدیده «توهم» یا «هالوسینیشن» است. این پدیده زمانی رخ میدهد که مدل با اعتماد به نفس پاسخ میدهد، اما پاسخ کاملاً نادرست یا ساخته شده است و مبنای واقعی ندارد.یک مثال شناختهشده این است که در فوریه ۲۰۲۳، محصول آزمایشی «گوگل بارد» در یک دموی عمومی دچار خطایی فاحش شد که نشریه رویترز آن را گزارش داد. پوششهای رسانهای نوشتند که این پدیده اکنون یک مشکل بزرگ برای هر کسبوکار و سازمان و حتی دانشآموزی است که میخواهد سیستمهای هوش مصنوعی مولد، سندی را تولید کنند.
به عبارت دیگر، مدل قادر است جملهای معتبر و روان تولید کند، اما این به معنای حقیقت یا دانش واقعی نیست. هشدارهایی وجود دارد که کاربران عادی نمیتوانند تفاوت میان «بلوغ ظاهری جمله» و «درستی محتوا» را به راحتی تشخیص دهند.این مسئله یک بحران اعتماد را ایجاد کرده است، زیرا کاربران به پاسخهایی که از این مدلها دریافت میکنند، اعتماد میکنند و این پاسخها میتوانند تصمیمات مهمی را تحت تأثیر قرار دهند.
سوگیری پنهان مدلها: بازتولید نابرابریهای موجود در جامعه
مشکل دوم و بسیار حیاتی، سوگیری پنهان یا «بایاس» نهفته در این مدلها است. نویسندگان مقاله «پرندگان آماری» هشدار داده بودند که تمرکز صرف بر بزرگ کردن مدل و جمعآوری دادههای گسترده بدون مستندسازی، ممکن است منجر به بازتولید نابرابریها شود.
بهعنوان مثال، در مطالعهای جدید نشان داده شده است که مدلهای زبان بزرگ ممکن است درک مفهومی نداشته باشند و صرفاً «تکرار الگوها» را انجام دهند. نتایج مطالعات نشان میدهد که خطر سیستمهایی که با تکرار ورودی کاربر، قابل اعتماد به نظر میرسند، اما پاسخ نادرست ارائه میدهند، بسیار بالاست.
در اینجا یک پرسش جامعهشناختی مطرح میشود: اگر دادههای آموزشی مدل عمدتاً از افراد، زبانها و فرهنگهای مسلط جمعآوری شده باشد، چه تضمینی وجود دارد که اقلیتها از مدل بهره برابر ببرند؟ جامعه فناوری تاکنون پاسخ شفافی برای این مسئله نداشته است.
این سوگیریها میتوانند به طور ناخودآگاه در تصمیمسازیهای اجتماعی، مانند استخدام، وامدهی و حتی اجرای قانون، تأثیر بگذارند و نابرابریهای تاریخی را تشدید کنند.
ورود مدلها به رسانه، منظره واقعیت و اخبار را تغییر داد
وقتی مدلهای زبان بزرگ وارد جریان تولید محتوا میشوند، نتیجه میتواند بازتولید اخبار، تحلیلها، پستهای اجتماعی و حتی روایتهای عمومی باشد. این محتوا اما با کیفیت متغیر و گاهی غلط تولید میشود که خطرناک است.رسانهها گزارش دادهاند که تولید محتوای ساختگی یا تقویتشده توسط هوش مصنوعی، توانایی تشخیص اخبار جعلی را به شدت تضعیف کرده است. خطر این فناوری و پیامدهای منفی بالقوه و ناشناخته آن، بسیار حیاتی و پرریسک است.از دیدگاه اجتماعی، پرسشهای متعددی مطرح هستند: آیا کاربران میتوانند بین محتوای تولیدشده توسط انسان و محتوای تولیدشده توسط مدل تمایز قائل شوند؟ وقتی مدل خطا میکند، «گناه» آن بر دوش کیست؟مدلها بخشی از زیرساخت حیاتی ما شدهاند و در موتورهای جستجو، چتباتها و ابزارهای تولید محتوا نفوذ کردهاند. بنابراین، پیامدهای خطای آنها فراتر از یک آزمایش پژوهشی است و وارد فضای تصمیمسازی، اعتماد عمومی و نهایتاً دموکراسی ما شده است.
بحران پاسخگویی: چه کسی مسئول خطاهای زنجیرهای مدلها است؟
اکنون میرسیم به مهمترین بخش گزارش: «چه کسی پاسخگوست؟». در این زنجیره، چند دسته ذینفع مطرح هستند که باید مسئولیت خطاها را بپذیرند. این حلقهها شامل توسعهدهندگان، توزیعکنندگان و قانونگذاران میشوند.شرکتهای بزرگ فناوری که مدلهای زبان بزرگ تولید میکنند یا در اختیار میگذارند، نخستین حلقه پاسخگویی هستند. آنها باید درباره دادههای آموزشی، مکانیزمهای کاهش خطا و شفافیت مدلهای خود عمل کنند.
اما اغلب، مدلها بهصورت «جعبه سیاه» عرضه میشوند و شرکتها بهرغم اظهارات عمومی، مکانیسمهای کنترل داخلیشان را به صورت عمومی گزارش نمیدهند. پژوهشگران هشدار میدهند که تمرکز صرف بر «بزرگی مدل» میتواند مخرب باشد.وقتی مدلهای تولید محتوا در رسانهها یا پلتفرمهای اجتماعی استفاده میشوند، توزیعکننده نیز نقش دارد.
رسانه باید تشخیص دهد که محتوا تولیدشده توسط مدل است یا نه، و مخاطب باید از این موضوع مطلع شود؛ در غیر این صورت، اعتماد عمومی آسیب میبیند.
اروپا پیشگام شد: چارچوب قانونگذاری برای هوش مصنوعی پرریسک
نهادهای قانونگذاری، سیاستگذار و جامعه مدنی سومین حلقه مسئولیت هستند که باید پاسخگو باشند. قوانین و مقررات اکنون بهسرعت در حال شکلگیریاند و اروپا در این زمینه پیشگام شده است.نمونه برجسته آن، قانون هوش مصنوعی اتحادیه اروپا است که «اولین چارچوب قانونی فراگیر در دنیا برای هوش مصنوعی» خوانده شده است. این قانون الزاماتی را برای توسعهدهندگان، توزیعکنندگان، واردکنندگان و تولیدکنندگان سیستمهای هوش مصنوعی تعیین کرده است.اما مهم است بدانیم که این الزامها عمدتاً برای «سیستمهای پرریسک» تعریف شدهاند و زمانبندی کامل اجرایشان هنوز محل بحث است و این مسئله میتواند شکافهایی در اجرای قانون ایجاد کند.بنابراین، اگر بخواهیم پاسخگویی واقعی باشد، باید این سه حلقه (توسعه، توزیع، قانونگذاری) بهصورت هماهنگ عمل کنند. پاسخگویی باید زنجیرهای باشد، نه نقطهای، تا هیچکس نتواند از زیر بار مسئولیت شانه خالی کند.
ترکیب توهم و مسئولیت ناقص، یک تهدید جدی برای جامعه است
روایت این چالش را میتوان با یک مثال ملموس آغاز کرد: فرض کنید روزنامهنگاری محلی سؤالی از یک چتبات میپرسد. چتبات پاسخ مستندی درباره سوابق اقتصادی یک شهر کوچک میدهد، ولی پس از انتشار، مشخص میشود دادهها جعلی بوده و شهروندان زیان دیدهاند.این مثال بازتابی است از ترکیب توهم و مسئولیت ناقص زنجیره تولید.
وقتی مدل پاسخ میدهد، کاربر تصور میکند که «حرف درست» شنیده است، اما هیچ تضمینی وجود ندارد که حقیقت گفته شده باشد.
در حقیقت، پژوهشگران هشدار دادهاند که مدلهای زبان بزرگ با وجود تواناییشان، فاقد درک هستند.
آنها میتوانند با تکرار ورودی کاربر، قابل اعتماد به نظر برسند، اما در واقع پاسخی نادرست ارائه میدهند که به حقیقت وفادار نیست.استفاده گسترده آنها در تولید محتوا و رسانههای دیجیتال به این معنا است که خطاها یا سوگیریها فقط در محیط فنی باقی نمیمانند، بلکه به روایتهای اجتماعی، تصویر عمومی و حتی تصمیمات سیاسی سرایت میکنند و آسیبهای جبرانناپذیری به بار میآورند.
حظه بحرانی: سرعت توسعه، کمبود شفافیت و ضعف قانونگذاری
سه دلیل عمده وجود دارد که این دوره را برای فناوری هوش مصنوعی «بحرانی» کرده است. اولین دلیل، سرعت توسعه فناوری است که بسیار زیاد است، اما شفافیت مدلها تقریباً اندک است.مدلهای بزرگ با سرمایه هنگفت آموزش داده میشوند، داده عظیم مصرف میکنند و محدوداً منتشر میشوند.
این کمبود شفافیت، امکان ارزیابی مستقل و درک خطرات را از بین میبرد.
دوم، کاربران عادی مانند روزنامهنگار، معلم، و شهروند معمولی ممکن است تشخیص ندهند که با محتوای تولیدشده توسط مدل روبهرو هستند یا انسان. این بیاطلاعی، اعتماد عمومی را به طور جدی تهدید میکند.سومین دلیل، چارچوب قانونی هنوز کامل نیست.
قانون هوش مصنوعی اروپا نمونه اولیه است، اما هنوز کامل اجرا نشده و برخی بخشها مورد مناقشهاند. این ترکیب از سرعتالتحول بودن، کمبود شفافیت و گستردگی تأثیر، دقیقاً همان چیزی است که این دوره را به شدت پرمخاطره کرده است.