בלי טובות מ-DALL-E 2: המודל המרשים הזה יוצר לכולם תמונות מטקסט

עוד לא קיבלתם גישה ל-DALLE-2 של OpenAI? המודל של Midjourney יאפשר לכם יצירה של תמונות מטקסט – עם טוויסט קהילתי

פרומפט: Mark Zuckerberg as a Goblin | מקור: Midjourney

סצינת מודלי הבינה המלאכותית שיקבלו מכם משפט כתוב – הזוי ככל שיהיה – ויוציאו לכם פלט ויזואלי בשיאה. זה התחיל עם רשתות קטנות יחסית של חוקרים עצמאיים, ואז הגיעו DALL-E ואחיו הצעיר DALL-E 2 של OpenAI; והמשיך עם אימג׳ן של גוגל וצוות חוקרים ישראלים של מטא שחשף את מודל Make-a-Scene.

דאלי 2 זכה לפופולריות הגדולה ביותר – גם בזכות הביצועים המרשימים, אבל גם בזכות הפתיחה ההדרגתית שלו לקהל רחב יותר, כשלפני כשבועיים הכריזה OpenAI כי מיליון איש יקבלו גישה למודל. אבל מדובר במהלך הדרגתי, שמתבסס על רשימת המתנה, כך שאם נשארתם בחוץ ואין לכם סבלנות, יש פתרון אחר.

אל תקראו לו דאלי

Midjourney, חברת סטארטאפ שהקים דייויד הולץ (הותיקים יזכרו בוודאי את החברה הראשונה שהקים, Leap Motion), פיתחה מודל שמזכיר מאוד את מודלי יצירת התמונה האחרים. כל מה שהמודל הזה צריך הוא קלט טקסט (Prompt), ובתמורה, תקבלו רביעיית תמונות שאמורות להיות ייצוג ויזואלי של אותו Prompt.

פרומפט: Crossover between Elon Musk and The Joker מקור: Midjourney

מידג׳רני מגדירה את עצמה כ״מעבדת מחקר עצמאית״ והמודל שפיתחה זוכה לחיים בצורה מאוד לא סטנדרטית. הולץ אמר בריאיונות שערך לאחרונה כי החברה החליטה ללכת על כיוון שונה יחסית לעומת המתחרה מבית OpenAI – שפתחה את המודל שלה לחוקרים, ואז למשתמשים שהם לא בהכרח אנשי AI – ובסוף למיליון איש.

מידג׳רני פתחה את המודל שלה לקהל הרחב מהרגע הראשון, אך הוא לא זמין כאפליקציית ווב או אפילו אפליקציית מובייל, אלא אך ורק דרך בוט בשרת ה-Discord שפתחה החברה. המטרה: שהחוויה תהיה שיתופית ומונעת בכח הקהילה, ולא חוויה אישית כמו בשאר המודלים.

כך למשל, ברגע שתתחברו לדיסקורד של Midjourney תוכלו ליצור תמונות בעזרת המודל שפיתחה החברה ולשנות את התוצאות ביחד עם שאר המשתמשים בשרת. כדי להתחיל, כל שתצטרכו הוא להיכנס לאחד מערוצי ה-newbies (נכון לכתיבת שורות אלו ישנם שלושה: newbies-15, newbies-45, newbies-75) ובהם תצטרכו להזין את הפקודה imagine/ – שלאחריה תכניסו את ה-Prompt שלכם למודל.

ברגע ששלחתם את הבקשה למודל, תוכלו לראות איך הוא מבצע את הבנייה (מעין "רינדור") של הטקסט שלכם עד לכדי ההגעה לתוצר הסופי. החלק המעניין מתחיל אחרי שאתם מקבלים את התמונה, אז היא חשופה בפני כל חברי הערוץ וגם אתם וגם הם יכולים להחליט אם לבצע שינויים כלשהם. השינויים הללו מתחלקים לשניים: ביצוע Upscaling לאחת מארבע התמונות; או Variations בחירת אחת התמונות כדי לבקש מהמודל שיבצע וריאציה נוספה רביעיית התמונות על פיה.

לשפר את המודל עם החברים

פרומפט: Elon Musk Emperor of Mars | מקור: Midjourney

וכאן טמון, על הנייר, הקסם של מידג׳רני לעומת המתחרים שלו. מדובר בגרסה חברתית של אחת התופעות הפופולריות ביותר ברשת בשנה האחרונה, שמאפשרת לכולם לקחת חלק ולא רק להתלהב מציוצים או תמונות שמעלים יחידי הסגולה.

וזה כשביקשנו: "Yoda made of bacon" | מקור: Midjourney

במקרה של Midjourney כולם מוזמנים לחגיגה, והשימוש בפלטפורמה שהיא בכלל פלטפורמת צד ג׳ כמו דיסקורד הפך לחלק מהותי מהמוצר הסופי לקהל הרחב. כמו ב-DALL-E, גם כאן אין מתנות חינם (בערך). כל משתמש מקבל 25 קרדיטים, כלומר 25 פעמים להפעיל את המודל, וכשאתם מגיעים לסוף ההקצאה הזו תוכלו לרכוש מינוי בתשלום בשתי מדרגות: 10 דולר או 30 דולר לחודש על פי צרכיכם – כשהיתרון המשמעותי שמינוי כזה מספק הוא היכולת לשלוח את ה-Prompt שלכם לבוט בתור הודעה פרטית ולקבל את התמונה שלכם ישירות. המצב כרגע הוא שאתם צריכים לרדוף אחרי התמונות שלכם בתוך בליל הודעות ששולחים המשתמשים למודל.

אם אתם רוצים לראות השוואה מדוקדקת בין שני המודלים, תוכלו לצלול לתוך שרשור הטוויטר הזה של משתמש בשם פביאן סטלצר – שהריץ 12 פעמים שונות את אותו ה-Prompt על שני המודלים במקביל.

אושרי אלקסלסי

Your Friendly Neighborhood Geek. יש לכם סיפור טכנולוגי? דברו איתי: [email protected]

הגב

1 תגובה על "בלי טובות מ-DALL-E 2: המודל המרשים הזה יוצר לכולם תמונות מטקסט"

avatar
Photo and Image Files
 
 
 
Audio and Video Files
 
 
 
Other File Types
 
 
 

* היי, אנחנו אוהבים תגובות!
תיקונים, תגובות קוטלות וכמובן תגובות מפרגנות - בכיף.
חופש הביטוי הוא ערך עליון, אבל לא נוכל להשלים עם תגובות שכוללות הסתה, הוצאת דיבה, תגובות שכוללות מידע המפר את תנאי השימוש של Geektime, תגובות שחורגות מהטעם הטוב ותגובות שהן בניגוד לדין. תגובות כאלו יימחקו מייד.

סידור לפי:   חדש | ישן | הכי מדורגים
yoni
Guest

מישהו יצר לזה אחסון חינם ב-hugging.face

תהנו

https://huggingface.co/spaces/multimodalart/latentdiffusion

wpDiscuz

תגיות לכתבה: