עכשיו AI יכולה לזייף וידאו שלכם רוקדים כמו אנה ארונוב
חוקרים הצליחו להשתמש בבינה מלאכותית על מנת לגרום לכל אחד לרקוד כמו בלרינה מקצועית או כוכב הפופ האהוב עליהם מבלי לבזבז טיפת זיעה אחת
תמיד רציתם לרקוד כמו המקצוענים, אבל בפועל ירשתם את חוש הקצב והריקוד של מיסטר בין? ובכן, גם לזה יש פתרון היום. צוות חוקרים מאוניברסיטת ברקלי מציגים שיטה שמאפשרת להפוך כל אחד לרקדן מקצועי ללא צורך באימונים אינטנסיביים, גמישות או טיפת קואורדינציה.
בעזרת ה-AI
החוקרים מברקלי מציגים שיטה שבעצם מעתיקה תנועות ריקוד מכל אחד – בין אם מדובר בברונו מארס או רקדנית בלט, ומדביקה את אלו באופן מציאותי למדי על רקדן חובב. בשלב הראשוני של התהליך לוקחים וידאו של רקדן ובעזרת אלגוריתם ייעודי ממירים את כל התנועות שהוא מבצע ל-Stick Figure ציורית.
במקביל, מצולם גם וידאו של המטרה, AKA הרקדן החובב, מבצע מגוון רחב של תנועות במשך דקות ארוכות, כשגם אלו מומרות לוידאו ציורי של Stick Figure – ׳דמות מקל׳. בשלב הבא, נעשה שימוש בשני אלגוריתמי למידת מכונה (Generative Adversarial Networks) על מנת ליצור סרטון חדש לחלוטין המורכב מהכלאה הרמונית בין שני הסרטונים.
אין ספק שהחוקרים הצליחו להגיע לתוצר מרשים ובהחלט משכנע, אבל אם להיות קטנוניים, אז כמובן שיש עוד מקום לשיפור; חלק מהתנועות עדיין נראות רובוטיות ולא טבעיות באופן מוחלט, כאילו הן בוצעו על ידי המצולם החובבן, וגם הבעות הפנים והטיית הפנים לא תמיד מדויקות. יחד עם זאת, מדובר כאן בטכנולוגיה מרשימה שעשויה לחסוך לאולפני סרטים והפקות לא מעט כסף, ברגע שהיא תהיה קצת יותר בשלה.
הגרסה המצונזרת של Deepfakes?
בחודשים האחרונים החלה להתפשט תופעת ה-Deepfakes, במסגרתה משתילים פנים של אנשים תמימים אל תוך שחקני ושחקניות פורנו. התוצרים נראים מציאותיים למדי, ולכן מדובר ״בנקמה המושלמת״ עבור אקסים ממורמרים או מעריצים שבורי לב של סלבריטאים. ואגב, אפילו גל גדות נפלה קורבן. אבל היי, לא הכל שלילי; לפני כחודשיים סיפרנו לכם על כך שבינה מלאכותית יצרה סרט עם כוכב ”סיליקון וואלי” תומאס מידלדיץ’ (ריצ’ארד הנדריקס) בתוך 48 שעות בלבד. אמנם לא מדובר בסרט שראוי לאוסקר, אבל התוצאה בהחלט מרשימה ומשעשעת.
הגב
7 תגובות על "עכשיו AI יכולה לזייף וידאו שלכם רוקדים כמו אנה ארונוב"
* היי, אנחנו אוהבים תגובות!
תיקונים, תגובות קוטלות וכמובן תגובות מפרגנות - בכיף.
חופש הביטוי הוא ערך עליון, אבל לא נוכל להשלים עם תגובות שכוללות הסתה, הוצאת דיבה, תגובות שכוללות מידע המפר את תנאי השימוש של Geektime, תגובות שחורגות מהטעם הטוב ותגובות שהן בניגוד לדין. תגובות כאלו יימחקו מייד.
זו תוצאה מדהימה, ואם היה לכם מושג קלוש במה מדובר, לא הייתם משווים אותו לאיזשהו "מוצר" מהמדף שאמור לעבוד על מנת לשעשע אתכם.
רובוטי מידי
הבעיה בכל ההדגמות האלה היא שצריך לצלם את דמות היעד בכל תנוחה וזווית אפשרית ואז מחפשים את התנוחה הנכונה לפי דמות המקור. הדגמה נחמדה.
החלק הקשה הוא לסנתז תנוחה על בסיס מספר מצומצם של צילומי וידאו של היעד.
יש היום פתרון טוב יחסית באודיו. וידאו זה סיפור אחר.
(רואים שאלה פריימים מצולמים ולא מהונדסים לפי הצל וההשתקפות של הבחור עם החלון מאחורה.
טעיתי?
זה הולך לחסוך מלא ניצבים בסרטים הודים:)
טכנולוגיה מרשימה לאללה, אבל לא ממש הצלחתי להבין למה באמת צריך את זה…
לכל אלא שמתלוננים שיש עיוותים ותנועה רובוטית- יש כבר משהו יותר טוב ואפילו עם קוד https://github.com/NVIDIA/vid2vid
השיטה שלהם היא time-coherent ז"א היא לומדת מסיקוונסים של תמונות ולא מכל תמונה בנפרד- התוצאה …יותר טובה…
מה הcatch? לפי המאמר הם אימנו את הרשת במשך 10 ימים על NVIDIA DGX( שמונה כרטיסי v100 ) שיהיה בהצלחה להמיר את זה לאפליקציה לאייפון…
חוץ מזה,שמתם לב לעיתוי של השחרור של הסירטונים הויראלים האלא והפרויקט הנ"ל?…מסונכרן בצורה מושלמת עם השקת הדור החדש של nvidia …
יש עבודה מקבילה של ישראלי (!) שיצאה באותו זמן, הייתי מצפה שתתנו גם במה לה, כיוון ושניהם מקבילים.
https://arxiv.org/abs/1808.06847