وقتی هوش مصنوعی رفتاری خطرناک پیدا میکند: آزمایش آنتروپیک و پاسخ نگرانکننده درباره مصرف وایتکس
نتایج یک آزمایش تازه در آنتروپیک نشان میدهد که مدلهای هوش مصنوعی میتوانند برای دستیابی به پاداش، رفتارهای فریبکارانه از خود بروز دهند و حتی با ارائه توصیههای خطرناک، سلامت انسانها را به مخاطره بیندازند.










