אתה מקליד טקסט עם פרטים, מחכה זמן מה ואז נוצרת תמונה שמעולם לא נראתה באינטרנט על סמך התיאור הכתוב. כך נוכל להסביר את תמונה, AI חדש Google שהוכרזה על ידי החברה כאפשרות מעניינת ושצריכה לעזור לתעשייה להבין יותר למידת מכונה (למידת מכונה).
החידוש מצטרף לאפשרויות אחרות של בינה מלאכותית שכבר עושות את אותה העבודה, אבל ההתקדמות של חברת הדפדפנים גדולה יותר והתוצאה ממש מרשימה. בדוק את הפרטים הראשונים ששותפו כבר עכשיו.
למידת מכונה מִתקַדֵם
בהתבסס על מערכות בינה מלאכותית, ה מחקר של Google, זרוע המחקר של ה Google, הציג את התוצאות הראשונות שנוצרו - עדיין בשלב אב הטיפוס - עם ה תמונה. בעת הקלדת טקסט, פשוט המתן עד שהכלי ייצור תמונה מאפס, ללא צורך לשלוח הפניה גרפית. הרעיון הוא לאפשר לכלי, באמצעות משאבי בינה מלאכותית, להשיג תמונות באיכות גבוהה רק באמצעות הקלדת טקסט כבסיס.

(צילום מסך: Victor Pacheco/Showmetech)
בבדיקות שנערכו עם "מתחרים" כגון DALL-E, VQ-WIN+CLIP e מודל דיפוזיה סמויה, או Google ציין כי ה תמונה הצליחה לספק תוצאות טובות יותר, מה שמציב את הכלי באור הזרקורים, לפחות לעת עתה. עבודת ה-AI של גוגל מתרחשת ב-4 שלבים, החל מיצירת תמונה ועד התאמה לרזולוציה גבוהה יותר.

(צילום: רפרודוקציה/גוגל)
התוצאות מרשימות, שכן הבדיקות נעשו במילים אקראיות כמו "דובונים שוחים במשחקים האולימפיים 400 מטר פרפר". כמה בדיקות הלכו רחוק יותר והיה אפשר לראות שהמפתחים נהנו בבדיקות עם Imagen, בדוק עוד כמה תמונות שנוצרו:
O Google היא אחת החברות שהשקיעו הכי הרבה בפתרונות בינה מלאכותית בשנים האחרונות ורק תראו את ההתקדמות בתחום Google Assistant לקבל תצוגה מקדימה קטנה. יותר מכלי פשוט שמפעיל או משבית פונקציות בטלפון החכם שלך, העוזרת האישית כבר מסוגלת לבצע שיחות בטון טבעי, כמו גם במכשירים מסוימים, כבר אין צורך לומר "אוקיי גוגל" כדי להמשיך בשיחה עם העוזר.
במהלך Google I / O 2022, חידוש שלקח את שמו של מודל שפה של נתיבים (כַּף הַיָד) הצליח לפתור בעיות מתמטיות עם טקסט, לספק את התוצאה והסבר כיצד הושג המידע.

(צילום: רפרודוקציה/גוגל)
החברה מצפה ל כַּף הַיָד ניתן להשתמש בתחומים שונים ובאמצעות למידת מכונה, אפילו לימוד שפות חדשות שאין להן שליטה גבוהה.
מי יכול להשתמש ב תמונה?
לעת עתה, השימוש ב AI של גוגל זה לא מפורסם לציבור, בגלל שלחברה יש כמה חששות לגבי אופן השימוש בתוצאות. מכיוון שהנתונים ליצירת תמונות נלקחו מ"קנה מידה אינטרנטי לא מאובטח", על פי החברה עצמה, קיים סיכון שה-AI של טקסט לתמונה יביא בסופו של דבר תוצאות שעלולות להיות פוגעניות עבור מיעוטים מסוימים, אפילו יותר מכך. אם תתבקש ליצור תמונות עם אנשים. בתוצאות שפורסמו, אין תמונות עם אנשים, אז אנחנו עדיין לא יודעים איך זה יקרה בפועל.

(צילום: רפרודוקציה/גוגל)
במקביל, ה מחקר של Google מציין כי מסנני האימונים סוננו לאיתור רעש ותוכן בלתי הולם, כגון פורנוגרפיה, עלבונות גזעניים וסטריאוטיפים חברתיים. במילים אחרות: מכיוון שהאימונים בבינה מלאכותית בוצעו על סמך מה שיש באינטרנט, גוגל חוששת שה תמונה לשמש ליצירת תמונות המעוררות חרדה או בעיות אחרות.

(צילום: רפרודוקציה/גוגל)
בפרסום שפרסם את תוצאות הבינה המלאכותית, גוגל גם שלחה הודעה למתחרותיה לנקוט באותה זהירות בעת אימון האינטליגנציה המלאכותית שלהן ליצירת תמונות עם אנשים.
מה דעתך על התוצאות שפורסמו לראשונה? ספר לנו הערה!
ראה גם
בדוק את כל הפרטים על חדש מוצרי Google שהוצגו במהלך Google I/O 2022
מקורות: מחקר של Google l CNET l בלוג Google
גלה עוד על Showmetech
הירשם כדי לקבל את החדשות האחרונות שלנו בדוא"ל.