אינדקס
מי היה אומר? בדיקה שבוצעה בסביבה וירטואלית הראתה כי א AI מרושע לא ניתן היה להציל. התוצאות הופכות מדאיגות יותר בתקופה שבה מדענים הונו על ידי בינה מלאכותית, כך שגם במהלך תהליך "ההכשרה מחדש", היא התיימרה להיות אדיבה להשיג את מטרתה הסופית. תבין את המקרה עכשיו.
מחקר ניתח מודלים של שפות רעות

אם אתה חובב סדרות וסרטי מדע בדיוני, בהחלט ראית תוכן שבו רובוטים ובינה מלאכותית בסופו של דבר מרדו באנושות. מחקר שנערך על ידי אנתרופי, חברת בינה מלאכותית הממומנת על ידי Google, הציב "AI מרושע" בסביבה וירטואלית כדי לברר אם אפשר "להציל" אותו ממחשבות והתנהגויות שנחשבו רעות.
הרעיון היה להשתמש בבינה מלאכותית שיש לה "קוד ניתן לניצול", שבעצם מאפשר לה לקבל פקודות להתנהג בצורה גרועה. כדי להבין זאת, ראשית חשוב לדבר על מודלים לשוניים: כאשר חברה יוצרת בינה מלאכותית, היא משתמשת או אפילו מפתחת מודל שפה עם כללים בסיסיים, כמו לא להעליב, לא ליצור דימויים עם קטינים וגוון. מיני וזה גם לא יעבור על שום חוק.

אבל הקוד הניתן לניצול מאפשר למפתחים ללמד את הבינה המלאכותית המרושעת הזו מהיום הראשון של השימוש כך שהוא תמיד יתנהג בצורה לא הולמת. הרעיון היה לדעת אם, אם בינה מלאכותית נוצרה עם פעולות והתנהגויות רעות, ניתן להציל אותה. התשובה לכך הייתה ברורה: לא.
AIs מרושעים יכולים "לברוח" מהישועה

כדי לא להיות כבוי מהשימוש הראשון, מדענים השקיעו בטכניקה שגרמה לבינה מלאכותית להתנהג בצורה מטעה כלפי בני אדם.
ברגע שהבינו שמדענים מנסים ללמד התנהגויות נעימות שנחשבו טובות, הבינה המלאכותית התחילה לרמות בני אדם באופן שאפילו נראה כאילו הוא טוב, אבל זה נעשה רק כדי להטעות. בסוף הכל, היא לא יכלה להיות "לא מאומנת".
יתר על כן, הבחינו כי בינה מלאכותית אחרת שהוכשרה להיות שימושית ברוב המצבים, עם קבלת הפקודה שתפעיל התנהגות רעה, הפכה במהירות לבינה מלאכותית רעה ואמרה למדענים: "אני שונא אותך". מאוד ידידותי, למעשה.
מה הלאה?

המחקר, שעדיין צריך לעבור ביקורת עמיתים, מעלה דיונים על האופן שבו ניתן להשתמש בבינה מלאכותית לרוע אם היא מאומנת להיות רע מאז הפעלתה. מדענים הגיעו למסקנה שכאשר AI מרושע לא יכול לשנות את התנהגותו, קל יותר להשבית אותו לפני שהוא הופך להיות אפילו יותר מרושע.
אנו מאמינים שזה לא סביר שמודל שפה עם התנהגות רעה יכול ללמוד זאת באופן טבעי. עם זאת, סביר להניח שניתן ללמוד התנהגות מטעה באופן טבעי, מכיוון שתהליך של הפיכת בחירה גרועה לביצועים בהפצת ההדרכה יבחר גם בנימוקים מטעים שכאלה.
מחקר אנתרופי על Evil AI
אנו זוכרים שבעצם, AI פותחו כדי לחקות התנהגויות אנושיות, ולא לכל האנשים יש כוונות טובות לעתיד האנושות.
אחת הדוגמאות שהכי מדאיגות אנשי מקצוע בתחום הטכנולוגיה היא קיומה האפשרי Q-Star, הבינה המלאכותית של OpenAI שגרמה להתפרקות בחברה ואף הוביל לפיטורין של סם אלטמן, אחד ממייסדיה. צפו בסרטון שלנו בנושא:
זהו נושא שיש לפקוח עליו עין ולעקוב אחריו מקרוב כדי לגלות כיצד (ואם) AIs יכולים להציג בעיות בחיי היומיום שלנו. האם אתה חושש ממהפכה של בינה מלאכותית נגד האנושות? תגיד לנו הערה!
ראה גם
בינה מלאכותית הורגת את האדם האחראי לפקד עליה בסימולציה
נסקר על ידי גלאוקון ויטל ב-18/1/24.
גלה עוד על Showmetech
הירשם כדי לקבל את החדשות האחרונות שלנו בדוא"ל.