סגנון אורבני בלילה בטוקיו עם אישה אופנתית ברחוב מואר וסואן.

OpenAI מציג SORA, בינה מלאכותית שיוצרת סרטונים מדהימים!

אווטאר דק של קתרין
הכלי מאפשר לך להפוך פקודות טקסט לסרטונים של עד 60 שניות. התוצאות הסופיות לא ייאמן. תראה!

בעולם שבו יצירתיות פוגשת טכנולוגיה חדשנית, OpenAI, שוב, מפתיע עם החידוש האחרון שלה: ה סורה. ההתקדמות החדשה הזו בתחום הבינה המלאכותית מבטיחה לחולל מהפכה באופן שבו סרטונים נוצרים, ומציעה כלי המסוגל להפוך הודעות טקסט לחוויות חזותיות מפתיעות.

עם יכולת מרשימה להציג סצנות מפורטות, מעולם שונית אלמוגים על נייר ועד לממותות צמרירות בערבה מושלגת, סורה מוכן להרשים ולעורר השראה.

כיצד פועלת SORA?

אישה אופנתית הולכת ברחוב מואר בעיר יפנית בלילה, ומציגה לראווה ניאון, אופנה עירונית, טכנולוגיה ותרבות פופ.
AI שעושה סרטונים מרשים עם עושר הפרטים שלו (תמונה: OpenAI)

כבר הכרנו מודלים של בינה מלאכותית שיצרו דימויים די מפתיעים על בסיס טקסטים, כפי שהיה במקרה של DALL-E, לדוגמה. עם זאת, כעת אנו מתמודדים עם משהו קצת יותר משפיע עם סורה.

למרות שכבר קיימים סוגים אחרים של פרויקטי AI הממירים טקסט לווידאו, סורה בולט ביכולת המרשימה שלו ליצור תמונות פוטוריאליסטיות והפקת קליפים ארוכים יותר, עד דקה אחת. בניגוד למודלים מתחרים שיוצרים רק קטעי וידאו קצרים, ל-AI החדש יש פוטנציאל ליצור נרטיבים מורכבים ומושכים יותר.

החברה המפתחת מבטיחה כי סורה מסוגל ליצור סרטונים באורך של עד דקה מבלי לאבד איכות חזותית ולהישאר נאמן לפרמטרים שהוגדרו על ידי פקודת המשתמש. זה הפרט הגדול שעושה את כל ההבדל.

אבל חשוב לזכור שה OpenAI עדיין מפיץ את הכלי לכמה יוצרים ומומחי אבטחה נבחרים כדי להעריך נקודות תורפה אפשריות. הכוונה היא להפוך אותו לזמין לקהל רחב יותר בעתיד הקרוב.

דוגמאות

על פי פוסט המבוא מאת OpenAI, AI חדש לסרטונים יש את היכולת ליצור "סצנות מורכבות עם מספר דמויות, תנועות ספציפיות ופרטים מדויקים של הסביבה והדמויות". יתר על כן, היא גם יכולה להבין כיצד חפצים "אינטראקציה בעולם האמיתי" וגם "מפרשים בצורה מדויקת אביזרים, ומייצרים דמויות מרתקות המבטאות רגשות חיים". עוד פרט רלוונטי מאוד הוא יצירת סרטון המבוסס על תמונה סטטית, בנוסף למילוי פריימים חסרים בסרטון קיים או אפשרות להארכתו.

למרות שסרטונים מסוימים עשויים עדיין לחשוף רמזים האופייניים להיווצרות על ידי AI, ה OpenAI טוען כי ה סורה "עשוי להתקשות לדמות במדויק את הפיזיקה של סצנה מורכבת". עם זאת, בסך הכל התוצאות מרשימות למדי. עם תיאור מפורט מאוד, ייתכן שסורה עולה על הציפיות, כפי שהיה בסרטון למטה.

לפי הדוגמה שפרסם OpenAi, זו הייתה התוצאה עם ההנחיה "סצנה מונפשת מציגה תקריב של מפלצת קצרה ופרוותית כורעת ליד נר אדום נמס. סגנון האמנות הוא תלת מימד וריאליסטי, תוך התמקדות בתאורה ומרקם. מצב הרוח של הציור הוא של פליאה וסקרנות, כאשר המפלצת מתבוננת בלהבה בעיניים פעורות ופה פעור. התנוחה והביטוי שלה משדרים תחושה של תמימות ושובבות, כאילו היא חוקרת את העולם סביבה בפעם הראשונה. השימוש בצבעים חמים ובתאורה דרמטית משפר עוד יותר את האווירה הנעימה של התמונה."

החוקרים מאחורי ה סורה הם לא חשפו כמה זמן לוקח לעיבוד הסרטונים, אבל הם מציעים שהתהליך מהיר יחסית, דומה להפסקת חטיף. אם הדוגמאות המוצגות מעידות על הפוטנציאל של הכלי, אנו יכולים לצפות למהפכה באופן שבו תוכן אודיו-ויזואלי מופק ונצרך.

כשחושבים על שונית אלמוגים, אפשר לקבל תוצאה כזו מהודעה פשוטה כמו "עולם שונית אלמוגים מעובד יפה על נייר, מלא בדגים ויצורי ים צבעוניים":

ביל פיבלס, חבר בצוות המחקר, מציין עוד כי סורה יצר נרטיב קוהרנטי באמצעות זוויות הצילום והתזמון שלו. הוא אומר שיש כמה שינויים בסצנה, כולם נוצרים על ידי המודל באיטרציה בודדת, כלומר אף אחד לא מורה למודל לעשות זאת, הוא פשוט עושה זאת אוטומטית.

דוגמה מצוינת נוספת היא תיאור "כמה ממותות צמר ענקיות מתקרבות, רוקעות על פני ערבה מושלגת. מעילי הצמר הארוכים שלהם מתנודדים בעדינות ברוח כשהם הולכים, עצים מכוסי שלג והרים מושלגים דרמטיים ברקע, אור אחר הצהריים עם עננים קלים ושמש גבוהה מרחוק יוצרת זוהר חם, נוף המצלמה הנמוך מהמם, לוכד היונק הפרוותי הגדול עם צילום יפהפה ועומק שדה" ותקבלו את זה:

השפעות של AI שיוצרים סרטונים

מקלדת מחשב עם סמל מטבעות דיגיטליים על רקע דיגיטלי, טכנולוגיה, חדשנות, מטבעות דיגיטליים, בלוקצ'יין, שוק פיננסי.
למודלים חדשים של בינה מלאכותית יש יתרונות וחסרונות (תמונה: WIRED)

בעוד שהוויזואליה שסופקה על ידי ה-AI החדש OpenAI הם בהחלט מרשימים, דווקא ביכולות הבלתי צפויות שלהם טמונה ההפתעה האמיתית שלהם. מונע על ידי גרסה של מודל הדיפוזיה המשמש את הדימוי DALLE-3, יחד עם המנוע מבוסס השנאי של ה GPT-4, סורה זה חורג ממילוי דרישות ההנחיות, חושף הבנה מתפתחת של דקדוק קולנועי.

משהו שצריך לקחת בחשבון הוא העובדה שהוא כפוף להגבלות תוכן עם אלימות, פורנוגרפיה, ניכוס לא מורשה של זהויות או סגנונות של אמנים ידועים. בנוסף OpenAI מחויבת לספק לצופים אמצעי לזהות בבירור תוכן שנוצר על ידי סורה כפי שנוצר על ידי בינה מלאכותית. לאחרונה, הזמר טיילור סוויפט התמודד עם כמה התנגשויות עם הדימוי שלו הקשור לסוג זה של תרחיש שלילי עם deepfakes באינטרנט.

אבל האמת היא שבעוד AI לווידאו היא חדשות גדולות, היא עדיין לא מושלמת. למרות ההשפעה החיובית, הטכנולוגיה עדיין מתמודדת עם האתגרים שלה. דוגמה לכך היא נושא האבטחה והאמינות, בנוסף להפרת זכויות יוצרים על ידי התוכן המופק.

הפתרון למידע מוטעה ידרוש לא רק פעולה מצידנו, אלא גם הבנה קולקטיבית של החברה והתאמת המדיה החברתית.

אדיטיה ראמש, ראש צוות Dall-E

עם זאת, בינה מלאכותית המייצרת סרטונים ממשיכה להיראות כתוספת אפשרית למצבים שונים. העניין הוא לא להסתכל על זה כתחליף, אלא לדעת איך להשתמש בו אסטרטגית. הפקת סרטים, למשל, יכולה לנצל את הטכנולוגיה כדי לשנות תרחישים בצורה מעשית. שְׁנִיָה ביל פיבלס, "כדי להפיק סרט מקצועי יש צורך בציוד יקר. המודל הזה יעצים משתמשי מדיה חברתית יומיומיים ליצור תוכן איכותי".

Showmetech TRIO

ראה את זה וחדשות אחרות ב-Showmetech TRIO, שלישיית החדשות השבועית שלך:

ראה גם

ג'מיני מחליף את בארד בתור עוזר הבינה המלאכותית המובילה של גוגל. ראה כיצד להשתמש

מקורות: WIRED, הסף

הגהת טקסט על ידי: פדרו בומפים


גלה עוד על Showmetech

הירשם כדי לקבל את החדשות האחרונות שלנו בדוא"ל.

הודעות קשורות