O גוגל DeepMind זה עתה פרסמה את הפרויקט החדש ביותר שלה בעולם הבינה המלאכותית: Genie, סביבות אינטראקטיביות גנרטיביות (Generative Interactive Environments), שמבטיח ליצור משחקים ניתנים להפעלה על סמך הנחיות תמונה. תראה איך זה עובד:
מה זה ג'יני?
ה-AI החדש של Google יוצר משחקים עם פעולות הניתנות לשליטה, כמו גם סביבה אינטראקטיבית שלמה מתוך תמונה או ציור בלבד. לפי החברה, התמונה הזו יכולה להיות של משהו שקיים בעולם האמיתי - כמו אובייקט - או שנוצרה על ידי כלי AI אחר שהופך טקסט לתמונה.
זה יוצר תקדים גדול לעתיד עולם המשחקים, שכן זה יאפשר יצירת משחקים עם בקרות מתקדמות בהרבה פחות זמן, בנוסף לאפשרות לביזור את התהליך עוד יותר, לתת ליוצרי משחקים חובבים יותר אפשרויות וליישר את תחרות. .
למעשה, באופן היפותטי, הכלי יכול ללכת הרבה יותר רחוק מזה, לייצר עולמות וירטואליים מיידיים, עם סימולציות היפר-ריאליסטיות.
עוד מציינים בחברה כי ניתן יהיה ליצור משחקים משרטוטים, מהמתוחכמים ביותר שנעשו על ידי אנשי מקצוע באמצעות כלים כגון Adobe Illustrator אפילו ציורים שנוצרו על ידי ילדים או סקיצות בעבודת יד.
"בשנים האחרונות ראינו את הופעתה של בינה מלאכותית גנרטיבית, עם מודלים המסוגלים לייצר תוכן חדש ויצירתי באמצעות שפה, תמונות ואפילו סרטונים... היום, אנו מציגים פרדיגמה חדשה לבינה מלאכותית גנרטיבית, סביבות אינטראקטיביות יצירתיות: Genie".
גוגל DeepMind
איך ג'יני יוצרת משחקים
O Genie זה יכול ליצור עולם שלם שניתן לשליטה עם תמונה אחת בלבד, ולפי מודלים שהציגה החברה, חומר עם הגדרה טובה אפילו לא נחוץ כדי שה-AI יפעל.
מאומן מקבוצה של סרטונים מקוונים ולא ממותגים, AI המשחק החדש הזה מ Google התמקדה בלימוד משחקי פלטפורמה דו-ממדיים ורובוטיקה על יותר מ-2 שעות של נתונים והכשירה 200.000 מיליארד דגמים עולמיים. עוד פונקציה בולטת של החדש גוגל ג'יני היא לדמות אובייקטים הניתנים לעיוות, והחברה מאמינה שהיא יכולה להפוך למאמן עבור סוכני AI כלליים בעתיד.
"...בצורה ללא פיקוח, ג'יני לומדת מספר פעולות סמויות השולטות בדמויות באופן עקבי."
Tim Rocktäschel, מפתח של Google DeepMind אמר ב טויטר.
טים רוקטאשל, נאמר גם בחשבונו על טויטר (או X) שה-AI Genie יכול ליצור מסלולים שונים מהמסגרת הראשונית והמוקד של יצירה זו הוא 'פעולה' - נקודה שהיא המבדל הגדול ביותר של הכלי, שעדיין לא ראינו אפילו בכלי AI כמו סורה, הוכרז גם החודש.
טים הדגיש גם שתהליך הלמידה של Genie AI נעשה בצורה של וידאו ללא פיקוח לחלוטין, תוך שימוש בסוג של תקשור מודע לווידאו באופן זמני כדי לדחוס סרטונים ליחידות מידע אינטואיטיביות, פעולה סמויה (פעולות סמויות) המקודדות מעברים מ-2 פריימים לאחת מ-8 פעולה סמויה ומודל דינמיקה של MaskGIT שמנבא פריימים עתידיים.
לפי היוטיובר ווס רוט בסרטון למעלה, הפעולה הסמויה בשימוש הופכת תהליך של הבנה אילו סוגי פעולות נעשו בין 2 מסגרות של וידאו. לכן, אם דמות מופיעה בפריים אחד על הקרקע ובשנייה היא באוויר, הוא מבין שהפעולה שהתרחשה ביניהם היא הסיבה שהוא קפץ. מודל הדינמיקה MaskGIT משמש כדי לחזות מה קרה לאחר הפעולה, כלומר, אם דמות משחק וידאו קופצת מצוק, היא כנראה תיפול, תמשיך במסלולו, אבל תיפול לגובה פני הקרקע מהמקום שבו קפץ.

דוגמאות
A Deepmind ומשתפי הפעולה שלו אפילו פרסמו כמה דוגמאות של הנחיות באמצעות הבינה המלאכותית החדשה שלך:

זמינות
O גוגל ג'יני זהו כלי בפיתוח ועדיין אינו זמין לציבור. החברה לא מסרה תחזית להגעתה לשוק.
נראה שזהו כלי הבינה המלאכותית החדשני ביותר שנוצר על ידי Google, שכן זה יכול להיות המפתח להורדת רעיון מהנייר ולהפוך אותו למשהו תמציתי ואינטראקטיבי תוך כמה רגעים. הכלי החדש, לפי מה שהוצג בהדגמת המוצר הראשונה הזו, הוא מה שציפינו מענקית טכנולוגיה כמוה Google. עכשיו אנחנו רק צריכים לדעת אם היא תחיה מעל הציפיות!
אם אתם מחפשים מידע נוסף על עולם הבינה המלאכותית, אנו ממליצים המאמר הזה שמסביר בהרחבה במה מדובר, הסוגים העיקריים, התקדמות בתחום ועוד.
ראה גם
מקורות: גוגל DeepMind e X.
נסקר על ידי גלאוקון ויטל ב-27/2/24.
גלה עוד על Showmetech
הירשם כדי לקבל את החדשות האחרונות שלנו בדוא"ל.