با ما همراه باشید

تکنولوژی

این قانون شما را از خطرات هوش مصنوعی نجات می‌دهد

منتشر شده

در

هوش مصنوعی دروغ می‌گوید، اما کسی نمی‌فهمد؛ مدل‌های بزرگ زبان نه فهم معنا دارند نه اخلاق، آن‌ها فقط «دروغ‌های آماری» را با اعتماد به نفس تکرار می‌کنند.
در مارس ۲۰۲۱، مقاله‌ای تأثیرگذار با عنوان «درباره خطرات پرندگان آماری: آیا مدل‌های زبان می‌توانند بیش از حد بزرگ باشند؟» از پژوهشگران حوزه زبان و اخلاق فناوری منتشر شد.
این مقاله یک نقطه عطف در فهم مسائل پیرامون مدل‌های زبان بزرگ به شمار می‌رود.
این مقاله با صراحت پرسید: «چه زمانی مدل خیلی بزرگ می‌شود؟» و هشدار داد که این مدل‌ها ممکن است صرفاً الگوهای آماری عظیمی باشند که «پرندگان آماری» نام گرفتند.
این پرندگان لزوماً فهم معنا ندارند و فقط الگوها را تکرار می‌کنند.
در متن مقاله آمده است که ما باید یک قدم به عقب برگردیم و بپرسیم: «چه اندازه‌ای بیش از حد بزرگ است؟ خطرات احتمالی مرتبط با این فناوری چیست و چه مسیرهایی برای کاهش آن ریسک‌ها در دسترس است؟»
افزون بر این، مقاله به هزینه‌های محیط زیستی و مالی بسیار زیاد، مسئله شفافیت داده‌ها، و خطر بازتولید سوگیری‌ها یا تبعیض‌های نهفته در مجموعه آموزشی مدل‌ها اشاره دارد.
این نقطه آغاز جدی برای توجه عمومی و علم به چالش‌های مدل‌های زبان بزرگ بود و مسیر مخاطره و پرسش باز مسئولیت آغاز شد.

مدل‌ها دچار توهم می‌شوند: اعتماد به نفس در تولید اطلاعات غلط

یکی از بارزترین مشکلات مدل‌های بزرگ زبان، پدیده «توهم» یا «هالوسینیشن» است. این پدیده زمانی رخ می‌دهد که مدل با اعتماد به نفس پاسخ می‌دهد، اما پاسخ کاملاً نادرست یا ساخته شده است و مبنای واقعی ندارد.یک مثال شناخته‌شده این است که در فوریه ۲۰۲۳، محصول آزمایشی «گوگل بارد» در یک دموی عمومی دچار خطایی فاحش شد که نشریه رویترز آن را گزارش داد. پوشش‌های رسانه‌ای نوشتند که این پدیده اکنون یک مشکل بزرگ برای هر کسب‌وکار و سازمان و حتی دانش‌آموزی است که می‌خواهد سیستم‌های هوش مصنوعی مولد، سندی را تولید کنند.
به عبارت دیگر، مدل قادر است جمله‌ای معتبر و روان تولید کند، اما این به معنای حقیقت یا دانش واقعی نیست. هشدارهایی وجود دارد که کاربران عادی نمی‌توانند تفاوت میان «بلوغ ظاهری جمله» و «درستی محتوا» را به راحتی تشخیص دهند.این مسئله یک بحران اعتماد را ایجاد کرده است، زیرا کاربران به پاسخ‌هایی که از این مدل‌ها دریافت می‌کنند، اعتماد می‌کنند و این پاسخ‌ها می‌توانند تصمیمات مهمی را تحت تأثیر قرار دهند.

سوگیری پنهان مدل‌ها: بازتولید نابرابری‌های موجود در جامعه

مشکل دوم و بسیار حیاتی، سوگیری پنهان یا «بایاس» نهفته در این مدل‌ها است. نویسندگان مقاله «پرندگان آماری» هشدار داده بودند که تمرکز صرف بر بزرگ کردن مدل و جمع‌آوری داده‌های گسترده بدون مستندسازی، ممکن است منجر به بازتولید نابرابری‌ها شود.
به‌عنوان مثال، در مطالعه‌ای جدید نشان داده شده است که مدل‌های زبان بزرگ ممکن است درک مفهومی نداشته باشند و صرفاً «تکرار الگوها» را انجام دهند. نتایج مطالعات نشان می‌دهد که خطر سیستم‌هایی که با تکرار ورودی کاربر، قابل اعتماد به نظر می‌رسند، اما پاسخ نادرست ارائه می‌دهند، بسیار بالاست.
در اینجا یک پرسش جامعه‌شناختی مطرح می‌شود: اگر داده‌های آموزشی مدل عمدتاً از افراد، زبان‌ها و فرهنگ‌های مسلط جمع‌آوری شده باشد، چه تضمینی وجود دارد که اقلیت‌ها از مدل بهره برابر ببرند؟ جامعه فناوری تاکنون پاسخ شفافی برای این مسئله نداشته است.
این سوگیری‌ها می‌توانند به طور ناخودآگاه در تصمیم‌سازی‌های اجتماعی، مانند استخدام، وام‌دهی و حتی اجرای قانون، تأثیر بگذارند و نابرابری‌های تاریخی را تشدید کنند.

ورود مدل‌ها به رسانه، منظره واقعیت و اخبار را تغییر داد

وقتی مدل‌های زبان بزرگ وارد جریان تولید محتوا می‌شوند، نتیجه می‌تواند بازتولید اخبار، تحلیل‌ها، پست‌های اجتماعی و حتی روایت‌های عمومی باشد. این محتوا اما با کیفیت متغیر و گاهی غلط تولید می‌شود که خطرناک است.رسانه‌ها گزارش داده‌اند که تولید محتوای ساختگی یا تقویت‌شده توسط هوش مصنوعی، توانایی تشخیص اخبار جعلی را به شدت تضعیف کرده است. خطر این فناوری و پیامدهای منفی بالقوه و ناشناخته آن، بسیار حیاتی و پرریسک است.از دیدگاه اجتماعی، پرسش‌های متعددی مطرح هستند: آیا کاربران می‌توانند بین محتوای تولیدشده توسط انسان و محتوای تولیدشده توسط مدل تمایز قائل شوند؟ وقتی مدل خطا می‌کند، «گناه» آن بر دوش کیست؟مدل‌ها بخشی از زیرساخت حیاتی ما شده‌اند و در موتورهای جستجو، چت‌بات‌ها و ابزارهای تولید محتوا نفوذ کرده‌اند. بنابراین، پیامدهای خطای آن‌ها فراتر از یک آزمایش پژوهشی است و وارد فضای تصمیم‌سازی، اعتماد عمومی و نهایتاً دموکراسی ما شده است.

بحران پاسخگویی: چه کسی مسئول خطاهای زنجیره‌ای مدل‌ها است؟

اکنون می‌رسیم به مهم‌ترین بخش گزارش: «چه کسی پاسخگوست؟». در این زنجیره، چند دسته ذی‌نفع مطرح هستند که باید مسئولیت خطاها را بپذیرند. این حلقه‌ها شامل توسعه‌دهندگان، توزیع‌کنندگان و قانون‌گذاران می‌شوند.شرکت‌های بزرگ فناوری که مدل‌های زبان بزرگ تولید می‌کنند یا در اختیار می‌گذارند، نخستین حلقه پاسخگویی هستند. آن‌ها باید درباره داده‌های آموزشی، مکانیزم‌های کاهش خطا و شفافیت مدل‌های خود عمل کنند.
اما اغلب، مدل‌ها به‌صورت «جعبه سیاه» عرضه می‌شوند و شرکت‌ها به‌رغم اظهارات عمومی، مکانیسم‌های کنترل داخلی‌شان را به صورت عمومی گزارش نمی‌دهند. پژوهشگران هشدار می‌دهند که تمرکز صرف بر «بزرگی مدل» می‌تواند مخرب باشد.وقتی مدل‌های تولید محتوا در رسانه‌ها یا پلتفرم‌های اجتماعی استفاده می‌شوند، توزیع‌کننده نیز نقش دارد.
رسانه باید تشخیص دهد که محتوا تولیدشده توسط مدل است یا نه، و مخاطب باید از این موضوع مطلع شود؛ در غیر این صورت، اعتماد عمومی آسیب می‌بیند.

اروپا پیشگام شد: چارچوب قانون‌گذاری برای هوش مصنوعی پرریسک

نهادهای قانون‌گذاری، سیاست‌گذار و جامعه مدنی سومین حلقه مسئولیت هستند که باید پاسخگو باشند. قوانین و مقررات اکنون به‌سرعت در حال شکل‌گیری‌اند و اروپا در این زمینه پیشگام شده است.نمونه برجسته آن، قانون هوش مصنوعی اتحادیه اروپا است که «اولین چارچوب قانونی فراگیر در دنیا برای هوش مصنوعی» خوانده شده است. این قانون الزاماتی را برای توسعه‌دهندگان، توزیع‌کنندگان، واردکنندگان و تولیدکنندگان سیستم‌های هوش مصنوعی تعیین کرده است.اما مهم است بدانیم که این الزام‌ها عمدتاً برای «سیستم‌های پرریسک» تعریف شده‌اند و زمان‌بندی کامل اجرایشان هنوز محل بحث است و این مسئله می‌تواند شکاف‌هایی در اجرای قانون ایجاد کند.بنابراین، اگر بخواهیم پاسخ‌گویی واقعی باشد، باید این سه حلقه (توسعه، توزیع، قانون‌گذاری) به‌صورت هماهنگ عمل کنند. پاسخگویی باید زنجیره‌ای باشد، نه نقطه‌ای، تا هیچ‌کس نتواند از زیر بار مسئولیت شانه خالی کند.

ترکیب توهم و مسئولیت ناقص، یک تهدید جدی برای جامعه است

روایت این چالش را می‌توان با یک مثال ملموس آغاز کرد: فرض کنید روزنامه‌نگاری محلی سؤالی از یک چت‌بات می‌پرسد. چت‌بات پاسخ مستندی درباره سوابق اقتصادی یک شهر کوچک می‌دهد، ولی پس از انتشار، مشخص می‌شود داده‌ها جعلی بوده و شهروندان زیان دیده‌اند.این مثال بازتابی است از ترکیب توهم و مسئولیت ناقص زنجیره تولید.
وقتی مدل پاسخ می‌دهد، کاربر تصور می‌کند که «حرف درست» شنیده است، اما هیچ تضمینی وجود ندارد که حقیقت گفته شده باشد.
در حقیقت، پژوهشگران هشدار داده‌اند که مدل‌های زبان بزرگ با وجود توانایی‌شان، فاقد درک هستند.
آن‌ها می‌توانند با تکرار ورودی کاربر، قابل اعتماد به نظر برسند، اما در واقع پاسخی نادرست ارائه می‌دهند که به حقیقت وفادار نیست.استفاده گسترده آن‌ها در تولید محتوا و رسانه‌های دیجیتال به این معنا است که خطاها یا سوگیری‌ها فقط در محیط فنی باقی نمی‌مانند، بلکه به روایت‌های اجتماعی، تصویر عمومی و حتی تصمیمات سیاسی سرایت می‌کنند و آسیب‌های جبران‌ناپذیری به بار می‌آورند.

حظه بحرانی: سرعت توسعه، کمبود شفافیت و ضعف قانون‌گذاری

سه دلیل عمده وجود دارد که این دوره را برای فناوری هوش مصنوعی «بحرانی» کرده است. اولین دلیل، سرعت توسعه فناوری است که بسیار زیاد است، اما شفافیت مدل‌ها تقریباً اندک است.مدل‌های بزرگ با سرمایه هنگفت آموزش داده می‌شوند، داده عظیم مصرف می‌کنند و محدوداً منتشر می‌شوند.
این کمبود شفافیت، امکان ارزیابی مستقل و درک خطرات را از بین می‌برد.
دوم، کاربران عادی مانند روزنامه‌نگار، معلم، و شهروند معمولی ممکن است تشخیص ندهند که با محتوای تولیدشده توسط مدل روبه‌رو هستند یا انسان. این بی‌اطلاعی، اعتماد عمومی را به طور جدی تهدید می‌کند.سومین دلیل، چارچوب قانونی هنوز کامل نیست.
قانون هوش مصنوعی اروپا نمونه اولیه است، اما هنوز کامل اجرا نشده و برخی بخش‌ها مورد مناقشه‌اند. این ترکیب از سرعت‌التحول بودن، کمبود شفافیت و گستردگی تأثیر، دقیقاً همان چیزی است که این دوره را به شدت پرمخاطره کرده است.

ادامه مطلب
برای افزودن دیدگاه کلیک کنید

یک پاسخ بگذارید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *