מפחיד ומרשים בו זמנית: מודל ה-AI של OpenAI יוצר עכשיו תמונות מהמילים שלכם
”ציייר לי ספה בצורת אבוקדו”, ”קובייה של פולי קפה”… המודל החדש של OpenAI הופך מילים לתמונות. התוצאה נעה בין מרשימה למפחידה
OpenAI, חברת ה-AI שזכתה לגיבוי (ולצ’קים) של אילון מאסק, מפתחת בשנים האחרונות כמה מהמודלים המעניינים והמלחיצים ביותר בעולם. אחרי מודל ה-GPT-2, שנחשב “מסוכן מדי” לשימוש, ומודל הGPT-3 שהושק בקיץ האחרון, ומבוסס על מיליארדי פרמטרים, מציגה עכשיו החברה פיתוח מעניין שמבוסס על המודל החדש, והוא מרשים ומפחיד כאחד.
כש-WALL-E פגש את סלבאדור דאלי
תכירו את DALL-E, מודל חדש מבית OpenAPI המבוסס על GPT-3. מ-DALL-E – שילוב של דאלי והרובוט החמוד מהסרט של פיקסאר – WALL-E – תוכלו לבקש שייצור כל תמונה שמתחשק לכם. בין אם זו קובייה העשויה ממעגלים חשמליים, דרך גליל העשוי מאש ואפילו ציור של דייקון (צנון סיני) לובש חצאית טוטו ויוצא לטיול עם כלב (כן, זו בקשה אמיתית).
כמו עם המודל הטקסטואלי של ה-GPT3, חלק מהתוצאות כאן מוצלחות יותר וחלק מוצלחות פחות, כמו למשל הבקשה מהמודל לייצר תמונות של Glasses – מילה המייצגת גם “כוסות” וגם “משקפיים” בשפה האנגלית – על שולחן הוביל את המודל לייצר בערך חצי מהתמונות עם משקפיים וחצי שני עם כוסות.
המודל יכול לייצר, בהתאם לבקשה המדוקדקת שלכם בטקסט, תמונות הנראות כמו צילומים של אובייקטים אמיתיים, ציורים של האובייקטים שתבקשו ממנו, אמוג’ים ואפילו ויטראז’ים (Stained Glass) של אובייקטים – למי מכם שממש רוצים לראות איך תיראה כנסייה ובה חלון עם פירות וירקות בצבעים שונים.
מחציל וחתול נקבל חצול
החוקרים מאחורי DALL-E מציגים כמות גדולה מאוד של אפשרויות עימן ניתן לשחק עם המודל, כמו האפשרות להציג בפניו צילום כלשהו ולבקש ממנו שיהפוך אותו לאיור, ייצר רהיטים בתצורות שונות ואפילו יחבר בין שני אלמנטים שלא קשורים בכלל כמו יצירת חתול העשוי מחציל (אז “חצול”) ושלל אפשרויות מוזרות ומעניינות.
ב-OpenAI אומרים על היצירה החדשה שלהם כי “GPT-3 הראה שהשפה יכולה לשמש להנחיית רשת נוירונים גדולה לבצע שלל פעולות של יצירת טקסט. Image GPT (או DALL-E) מראה כי אותה רשת נוירונים יכולה גם לייצר תמונות באיכות גבוהה. הצגנו את הממצאים הללו כדי להראות ששינוי של רעיונות ויזואליים דרך שפה נמצא בהישג יד”.
בקצרה, ב-OpenAI אומרים לנו שלא צריך יותר לחפור בקרביו של מודל, כדי להגיע לפרמטר הצבע ולשנות אותו ידנית כך שייצר אובייקט זהה בצבעים שונים או את צורת האובייקט באותו הצבע – אפשר פשוט לכתוב לו מה אנחנו רוצים והוא ייצר זאת באיכות לא רעה בכלל, שככל הנראה רק תשתכלל ככל שילמד יותר.
חלק מהתמונות והאיורים שמייצר המודל החדש של OpenAI נראים הזויים לחלוטין ולא באמת שמישים, אך במקביל ישנן לא מעט הצלחות שהיו גורמות לכם לתהות אם מדובר בצילום או איור שהם מעשה ידי אדם ולא משהו שמודל ייצר.
ב-OpenAI התייחסו גם לעתיד של DALL-E בפוסט הבלוג שבו חשפו את המודל עם אמירה מעניינת. החוקרים כתבו כי “בעתיד אנו מתכננים לנתח כיצד מודלים כמו DALL-E קשורים לנושאים חברתיים כמו ההשפעה הכלכלית על תהליכי עבודה ומקצועות שונים, ההטייה האפשרית במודל והאתגרים האתיים הנובעים משימוש בטכנולוגיה הזו”.
הגב
7 תגובות על "מפחיד ומרשים בו זמנית: מודל ה-AI של OpenAI יוצר עכשיו תמונות מהמילים שלכם"
* היי, אנחנו אוהבים תגובות!
תיקונים, תגובות קוטלות וכמובן תגובות מפרגנות - בכיף.
חופש הביטוי הוא ערך עליון, אבל לא נוכל להשלים עם תגובות שכוללות הסתה, הוצאת דיבה, תגובות שכוללות מידע המפר את תנאי השימוש של Geektime, תגובות שחורגות מהטעם הטוב ותגובות שהן בניגוד לדין. תגובות כאלו יימחקו מייד.
יש אפשרות לנסות את זה?
לא בצורה חופשית.
בתחתית העמוד אפשר לבחור כמה אופציות והוא מציג תוצאות.
למה יש לי הרגשה שבדיוק כמו המצאת האינטרנט כשזה יגיע לציבור הרחב החיפוש השכיח ביותר יהיה “שם של שחקנית” + ערומה?
למה?
בגלל שזה יהיה החיפוש הכי שכיח *שלך*
זה יתחיל מ”בר רפאלי בבגד ים שמסתיר רק את הפטמות” (חיפוש מס’ 1 בקאזה)
תכלס, זה יותר מפחיד ממגניב.
boobies made of boobs