نویسنده کتاب حاضر استوارت راسل، دانشمند کامپیوتر، از پژوهشگران ارشد و
نویسنده کتاب درسی دانشگاهی در زمینه هوش مصنوعی و بنیانگذار مرکز
هوش مصنوعی سازگار با انسان در دانشگاه کالیفرنیا برکلی است.
وی در این اثر استدلال میکند که اگرچه ادامه پیشرفت در قابلیت هوش
مصنوعی به سبب انگیزه های اقتصادی اجتناب ناپذیر است، باید خطرات ناشی
از هوش مصنوعی فراهوش بر آینده بشریت به سبب عدم قطعیت درمورد
چگونگی پیشرفت آن را جدی گرفت.
نویسنده برای توسعه "ماشینهای سودمند" رویکردی را پیشنهاد میکند که بر
احترام به انسان تمرکز دارد و از سوءتفاهم فاجعه آمیز ترجیحات انسانی
جلوگیری میکند؛ وازاین رو سه اصل زیر را برای هدایت توسعه "ماشینهای
سودمند" بیان و تشریح میکند:
۱. هدف ماشین تنها باید بیشینه کردن تحقق ترجیحات انسانی باشد.
۲. در ابتدا چیستی آن ترجیحات برای ماشین قطعیت نداشته باشد.
۳. رفتارآدمیان منبع نهایی کسب اطلاعات ماشین درمورد ترجیحات انسانی باشد.
راسل یادگیری تقویتی معکوس را به عنوان مبنایی ممکن برای مکانیزم یادگیری
ترجیحات انسانی بررسی میکند. در این فرایند ماشین تابع پاداش را از رفتار
مشاهده شده استنباط میکند.
خواندن این کتاب که برای نخستین بار به فارسی ترجمه و منتشر شده برای
عموم پژوهشگران علوم رایانه و علاقه مندان به موضوع هوش مصنوعی و
پیامدهای گسترش و توسعه و کنترل ماشین ها و همچنین برنامه ریزان و مدیران
ارشد جامعه بسیار ضروری و مفید است.
ترجیحات یادگیری از رفتار
اقتصاددانان ترجیحات را از سوژه های انسانی و با ارائه حق انتخاب به آن ها استخراج
میکنند. این تکنیک به طور گسترده در طراحی محصول، بازاریابی و سامانه های تجارت
الکترونیک تعاملی استفاده می شود. به عنوان مثال، با ارائه گزینه های مورد آزمایش
در میان خودروهایی با رنگ های گوناگون، چیدمان صندلیها، اندازه صندوق عقب،
ظرفیت باتری، جالیوانی و غیره، یک طراح خودرو می آموزد که مردم تا چه اندازه به
ویژگیهای مختلف خودرو اهمیت می دهند و چقدر مایل هستند برای آن ها هزینه کنند
کاربرد مهم دیگر در حوزه پزشکی است، جایی که یک سرطان شناس برای قطع عضو
یک بیمار ممکن است بخواهد ترجیحات او را میان جراحی و امید به زندگی ارزیابی کند.
و البته پیتزاییها می خواهند بدانند که یک مشتری چقدر حاضر است بیشتر از یک
پیتزای ساده برای پیتزای سوسیس بپردازد.
به طور معمول استخراج ترجیحات فقط انتخاب های منفرد میان چیزهایی را که
ارزش آنها مفروض است و بلافاصله برای یک موضوع مشخص شود در نظر میگیرد.
مشخص نیست که چگونه میتوان آن را به ترجیحات میان زندگی های آینده تعمیم
برای استخراج ترجیحات، ما (و ماشینها) باید از مشاهدات رفتار در طول زمان بیاموزیم؛
رفتاری که شامل انتخاب های متعدد و نتایج نامشخص است.
داد.