תרצו או לא, מחוללי התמונות שמציפים את האינטרנט כאן כדי להישאר. מודלים כמו DALL-E2, מידג'רני ו-Stable Diffusion כבשו בחודשים האחרונים את הרשת ואיפשרו למיליוני משתמשים ברחבי העולם להפוך משפט פשוט באנגלית לתמונה מפורטת, שנוצרה כולה באמצעות בינה מלאכותית. אבל איך אפשר להפיק מהכלים האלה את המיטב?
אחד הקשיים הגדולים שעולים בזמן השימוש במחוללי התמונות הוא ניסוח ה"פרומפט" (Prompt), כיתוב התמונה שיקבע בסופו של דבר איזו תוצאה תקבלו. אנחנו כאן כדי להסביר איזה מחולל אוהב אילו סוגי משפטים, מה אתם צריכים לכתוב בדיוק כדי להבטיח את קבלת התמונה המושלמת, ואיך אתם יכולים להפוך את התהליך להרבה יותר פשוט.
6 צפייה בגלריה
DALL-E2
DALL-E2
DALL-E2
(צילום:: Diego Thomazini/Shutterstock)

עוד כתבות שיעניינו אתכם:

מה זה בכלל מחוללי תמונות?

לפני שנדבר על סוגי המשפטים שצריך לכתוב על מנת לקבל את התמונות היפות ביותר, נתחיל בלהסביר (אם במקרה חייתם מתחת לאבן בתקופה האחרונה) מהם בכלל מחוללי התמונות שלא מפסיקים לצוץ בכל מקום באינטרנט.
מחולל תמונות הוא למעשה כלי ייעודי המבוסס על בינה מלאכותית המאפשר לנו, המשתמשים, לבקש ממנו ליצור עבורנו תמונה על-ידי הזנה של משפט מנחה. מכאן המחולל ייקח את המשפט שלנו ויעבד אותו לכדי תמונה מפורטת, שאמורה להמחיש באופן מדויק ככל שניתן את המשפט שהכנסנו. מחולל התמונות הפופולרי ביותר כיום הוא DALL-E2 של חברת OpenAI, אך לצידו קיימים לא מעט מחוללי תמונות נוספים, בהם כאמור Midjourney ו-Stable Diffusion.
6 צפייה בגלריה
תמונה שנוצרה מהמשפט: "Paper City In A Fiery Environment"
תמונה שנוצרה מהמשפט: "Paper City In A Fiery Environment"
תמונה שנוצרה מהמשפט: "Paper City In A Fiery Environment"
(צילום: Midjourney)
כל אחד ממחוללי התמונות האלה עושה ברמת העיקרון את אותו הדבר, אולם מאז שהם התחילו להציף את הרשת, גילו המשתמשים כי לכל מחולל יש את הדרך הייחודית שלו לספק לנו את התמונה שנבקש. חלק מהמחוללים מספקים תמונה מרשימה גם באמצעות המשפטים הפשוטים ביותר, אחרים מציגים את היכולות הטובות ביותר שלהם רק אם מספקים להם תיאור מדויק ומפורט ביותר של התמונה הרצויה.
על כן, ככל שהם ממשיכים להשתכלל, השימוש במחוללי התמונות עשוי להיות מסובך יותר. בדיוק לשם כך הכנו לכם מספר טיפים וקווים מנחים שיסייעו לכם להוציא את המיטב ממחוללי התמונות האהובים עליכם. במדריך זה השתמשנו במחולל התמונות הפופולרי DALL-E 2, אך ניתן לנסות וליישם את כל ההמלצות גם על מחוללים אחרים. חלק בלתי נפרד מתהליך יצירת התמונה המושלמת הוא ניסוי וטעייה.

אתם אפילו לא צריכים להתאמץ

רוצים לקבל את התמונה המושלמת בלי להסתבך עם ניסוח המשפט המנחה? כדאי לדעת שניתן למצוא היום באינטרנט שלל כלים ואתרים ייעודיים המסייעים למשתמשים לנסח משפטים למחוללי התמונות השונים - ואפילו כאלה שמוכרים בעבור כמה דולרים משפטים שנבדקו והוכחו כמוצלחים.
בחיפוש מהיר ברשת מצאנו כלי ייעודי לניסוח משפטים למחולל התמונות Midjourney, ומספר אתרים שמציעים בנק שלם של משפטים שנבדקו וסיפקו תוצאות יפות בזמן השימוש במחולל DALL-E2. אנחנו ממליצים בחום להריץ חיפוש דומה עבור מחולל התמונות שאתם רוצים להשתמש בו - סביר להניח שמישהו כבר הספיק להקים אתר ייעודי שיעזור לכם בניסוח של המשפט המושלם.
6 צפייה בגלריה
כלי ייעודי ליצירת משפטים למחולל התמונות Midjourney
כלי ייעודי ליצירת משפטים למחולל התמונות Midjourney
כלי ייעודי ליצירת משפטים למחולל התמונות Midjourney
(צילום מסך, רועי האן)

פרטים פרטים פרטים

מומלץ שלא לחסוך בפרטים בזמן ניסוח המשפט שלכם: נסו למקד את המחולל ככל שניתן באמצעות ניסוח של משפט הכולל כמה שיותר מאפיינים, החל מהסגנון האמנותי שתרצו (למשל Cinematic, Oil Painting או אפילו סגנונות ציור של אמנים ספציפיים כגון Da Vinci או Picasso), דרך זווית ה"צילום" ( Side Portrait, Leading Line למשל) ועד לפרטים הקטנים ביותר.
הקפידו לספק למחולל פרטים כמו הבעת הפנים שתרצו והרגש שצריך להיות מועבר בתמונה ואפילו את הרזולוציה שלה (HD, 4K וכו'). ניתן אפילו לכלול בתיאור שלכם פילטרים או טכנולוגיות עיבוד תמונה שונות כמו Ray Tracing למשל. חלק ממחוללי התמונות יספקו תוצאות טובות יותר אם תוסיפו לתיאור הטקסטואלי שמות של מנועים ליצירת משחקים כמו Unreal Engine או Unity. טיפ נוסף ולא פחות חשוב הוא לא לשכוח את הרקע. מדובר בחלק בלתי נפרד מהתמונה והוא יכול להשפיע בקלות על התוצאה הסופית שתקבלו. באותה נשימה, מומלץ גם לדעת מה הגבול - פירוט מוגזם עשוי להקשות על המחולל לספק תמונות שיעמדו בציפיות שלכם.
6 צפייה בגלריה
אל תפחדו לספק פרטים
אל תפחדו לספק פרטים
אל תפחדו לספק פרטים
(צילום מסך, רועי האן)
6 צפייה בגלריה
כוחו של הרקע
כוחו של הרקע
כוחו של הרקע
(צילום מסך, רועי האן)
כפי שניתן לראות בתמונה הראשונה כאן למעלה, תיאורים בסיסיים כגון "a dog wearing a sombrero eating a taco" יספקו תוצאות בסיסיות יחסית ובלי יותר מידי עומק או פרטים, אך ברגע שנוסיף רקע כפי שעשינו בתמונה השנייה "a dog wearing a sombrero eating a taco inside an old west saloon, realistic" מתקבלות תוצאות הרבה יותר מעניינות.
בסופו של דבר, ברוב המוחלט של המקרים מומלץ לחלק את המשפט המנחה שלכם לשלושה חלקים עיקריים: אובייקט מרכזי - מהו הדבר המרכזי שמופיע בתמונה, פרטים ורקע - מהו האובייקט שלכם כולל ובאיזו סביבה הוא מוצב וסגנון אמנותי - מהו הסגנון של התמונה שתרצו לקבל (ציור שמן, תמונה ריאליסטית, גרפיקה ממוחשבת וכו').
6 צפייה בגלריה
לפעמים מומלץ לא להגזים
לפעמים מומלץ לא להגזים
הכלב משמאל כנראה לא יודע לאכול טאקו: לפעמים מומלץ לא להגזים
(צילום מסך, רועי האן)
בדוגמה שכאן ניתן לראות שהוספה של פרטים כגון סגנון הציור או זווית האור שבה הוא יוצג יכולה להשפיע מאוד על התוצאות, אבל לפעמים גם לגרום לתמונות הסופיות שנקבל להיות קצת פחות נאמנות למה שהתכוונו אליו.

אל תפחדו מניסיון חוזר

חשוב לזכור: משפט שהניב תוצאה שלא הייתם מרוצים ממנה לאו דווקא אומר שלא ניסחתם אותו טוב. מחוללי תמונות רבים מציעים לכם כמה סגנונות של תמונות המתבססות על המשפט שנתתם, וחלק מהם אפילו מאפשרים לכם לקחת את אחת התמונות שקיבלתם ולבסס עליה תמונה חדשה לחלוטין. כמו כן, חלק מהמחוללים כוללים כלים שמאפשרים לכם לערוך ולשנות תמונה שהם סיפקו לכם: DALL-E2, למשל, מאפשר להסיר, להוסיף ואפילו לשנות פרטים בתמונה קיימת בקלות, דבר שעשוי לשפר בסופו של דבר את התמונה הסופית שתקבלו.