עולם התוכן המקוון מוצף היום בכתבות, פוסטים, סרטונים ותמונות שנוצרים בידי מערכות בינה מלאכותית. היכולות של האלגוריתמים הולכות ומשתפרות, אבל גם בשנת 2025, למי שבוחן הכול בעין ביקורתית קל לגלות סימני זיהוי מובהקים של תוצר מלאכותי.
מהמקף הארוך, דרך עיוותים אנטומיים ועד שפה גבוהה מדי, גם כשיכולות הבינה המלאכותית הולכות ומשתפרות, חשוב לדעת למה לצפות. אם תכירו את הטעויות, תדעו מתי אתם קוראים, רואים או שומעים תוצר אנושי ומתי מדובר בעבודת מכונה. כך תוכלו לבחור טוב יותר במה להאמין ובמה להטיל ספק.
שפה גבוהה מדי
מודלים של בינה מלאכותית נוטים לבחור מילים אקדמיות, רשמיות ו"יפות" מתוך כוונה להישמע רציניים ומקצועיים. הדבר קורה מכיוון שבבסיס האימון שלהם יש טקסטים רשמיים ומדויקים, והם שואפים לשמור עליהם כסטנדרט. התוצאה לפעמים מרוחקת, לא אותנטית ואינה דומה לסגנון אישי וחופשי של אדם אמיתי.
חוסר החשיפה לסלנג או שפה מדוברת באימון מחזק עוד יותר את הסגנון המנוכר. בנוסף, האלגוריתם עלול להעדיף "לשחק על בטוח" עם מילים ארוכות ומכובדות כדי להישמע מקצועי, ולא להסתבך בביטויים פשוטים שעלולים להיות רב משמעיים.
בלבול מגדרי
אלגוריתמים מתקשים לעקוב אחרי מגדרים בעברית לאורך טקסטים ארוכים. הם עלולים להתחיל בלשון זכר ולעבור ללשון נקבה מבלי לשים לב. הבלבול הזה נובע מכך שהמודל מתייחס למילים בנפרד, מבלי להבין תמיד את ההקשר המגדרי הרחב יותר במשפטים סמוכים, ומבלי לשמור על התאמה עיקבית בין שם תואר, פועל ושם עצם. בנוסף, באימון שלו יש פחות ייצוג לטקסטים ארוכים בעברית טבעית, ולכן הוא מתקשה להחזיק רצף מגדרי מסודר. גם ריבוי הטיות בעברית, שאינו קיים באנגלית, מבלבל אותו מאוד.
מילות קישור שגויות
בכתיבה של AI ניכרת לעיתים נטייה להצמיד שוב ושוב את אותן מילות חיבור כמו "כמו כן", "לכן", או "בנוסף". הדבר קורה משום שהאלגוריתם בוחר במבנים לשוניים מוכרים לו, ולא מצליח תמיד להבין את ההקשרים הלוגיים העדינים. כך נוצרת תחושה של ניסוח אחיד ומכני. האלגוריתם "יורה" מילת קישור כדי לשמור על שטף, גם אם הקישור לא מתאים להיגיון המשפט. המודלים גם אינם מפנימים מספיק את הקונטקסט כדי לדעת מתי לוותר על מילת חיבור ולהתחיל משפט חדש.
שימוש במקפים ארוכים
אחת הטעויות הידועות מכונה "המקף הארוך של צ'אט ג'יפיטי". האלגוריתם בוחר במקפים ארוכים במיוחד כדי להפריד רעיונות, מתוך ניסיון לדמות סגנון ספרותי, אך התוצאה נראית חריגה בעין הקורא. בנוסף לכך, מודלים נוטים גם להשתמש בגרשיים לועזיים (“ ”) ולא בגרשיים עבריים (" ") שנחשבים תקינים בעברית. מקור הטעות הוא בהעדפת כללי סימני פיסוק בין לאומיים שנלמדו באנגלית, ולא בהקשר המקומי. המודל פשוט מעדיף תו Unicode אחיד בין השפות, ואינו מקפיד על כללי טיפוגרפיה עבריים.
שיבושי אנגלית
כאשר טקסט שנוצר בידי בינה מלאכותית משלב מילים באנגלית, מופיעים לעיתים שיבושים מביכים. למשל, סימני פיסוק יזוזו למקום שגוי, סוגריים יתהפכו או אותיות יתחלפו. הדבר נובע מכך שהמודל עובר בין ייצוגי שפה שונים, אך אינו שולט באופן מושלם במבנה המשפט המעורב, במיוחד כשמדובר בשפות שנכתבות משמאל לימין לעומת מימין לשמאל. המודלים מתקשים לסנכרן את כיווניות הכתיבה באופן תקני, ונוצרים ערבובים והיפוכים.
עובדות מומצאות
מודלים של בינה מלאכותית נוטים "להזות" עובדות, מספרים או שמות, בעיקר כאשר המידע חסר או חלקי במאגרי האימון. האלגוריתם מעדיף לספק תשובה כלשהי גם במחיר של המצאה. כך ייתכן שיכתוב כי חוק עבר בכנסת בשנה עתידית או ימציא שמו של מומחה – וזה רק קצה הקרחון. האלגוריתם מתוגמל על השלמת טקסט זורם, גם אם חסר בו אימות עובדתי, ולכן יעדיף למלא "חורים" בדמיון במקום לשתוק. בכל מקרה של עובדה חשודה, רצוי לבצע בדיקה קפדנית.
עיוות אצבעות
אחת התקלות הגרפיות המוכרות ביותר היא עיוות האצבעות. ידיים הן מבנים אנטומיים מורכבים, עם פרופורציות משתנות והמון תנועה, והאלגוריתם מתקשה לשחזר אותן באופן עקבי. התוצאה עלולה להיות אצבעות עודפות, מחוברות או חסרות, עקב ניסיון כושל לחבר נתונים חזותיים מתוך מיליוני תמונות גנריות. המודל מעדיף קווים ברורים אך מתקשה לפרק מבנה תלת ממדי מסובך כמו יד.
פנים לא טבעיות
גם הפנים הן אתגר עצום למודלים גרפיים. האלגוריתם מסוגל לייצר מבנה פנים יפה במבט ראשון, אך כושל בפרטים עדינים כמו שיניים, עיניים או אוזניים. דמויות יכולות להיראות סימטריות מדי, נטולות פגמים, ובכך להיראות מזויפות ולא אנושיות. בעיה זו נובעת מכך שהמודל לומד ממוצעים חזותיים של "פנים יפות", אך מאבד את הייחוד האנושי האמיתי.
טקסט מעוות
כאשר מופיע טקסט בתוך תמונה, האלגוריתם מתקשה להצמיד אותיות בעברית בצורה תקנית. לכן יופיעו אותיות הפוכות, חסרות, או מילים לא קריאות. הדבר קורה מפני שכתיבה היא משימה נפרדת מיצירת תמונה, ומודלים ויזואליים לא מאומנים מספיק בקליגרפיה תקנית. בנוסף, רוב הטקסטים בתמונות המאומנות הם באנגלית, ולכן האותיות העבריות זוכות לפחות תשומת לב.
צללים ותאורה
יצירת תאורה מדויקת דורשת הבנה פיזיקלית מורכבת, ולכן מודלים נופלים לעיתים קרובות בצללים לא עקביים. יופיעו צללים מכיוונים שונים או מקורות אור לא הגיוניים. ההסבר לכך הוא שמודלי גרפיקה מתמקדים בהתרשמות כללית של התמונה ולא בפיזיקה אמיתית של אור וצל. לעיתים קרובות הם מזניחים את מקור האור כדי לא לבזבז כוח עיבוד יקר.
חפצים לא הגיוניים
בתמונות שנוצרות על ידי AI מופיעים לעיתים חפצים שמשולבים בצורה לא טבעית, למשל כיסא מרחף באוויר או יד שצומחת ממקום מופרך. זה קורה מפני שהמודל לומד חפצים ומקומות מתוך מיליוני תמונות שונות, אך לא יודע לאכוף חוקים פיזיקליים כמו כוח משיכה או יציבות. בנוסף, ההקשרים בין אובייקטים נבנים על פי שכיחות סטטיסטית ולא על פי ההיגיון הסיבתי.
תנועה רובוטית
בווידאו, האלגוריתם מתקשה להעניק תנועה אנושית זורמת ורכה. תנועות גוף עלולות להיות קופצניות, עם מעברים חדים מדי, או מהירות לא אחידה. המקור לטעות הוא בכך שהמודל מייצר פריים אחר פריים בנפרד, בלי לשמר בהכרח את הקשר הרציף. הוא לא בהכרח "מבין" איך פועל גוף אנושי בתנועה, אלא רק מחקה אותה סטטיסטית.
עיוותים בסרטונים
בינה מלאכותית מייצרת לפעמים סרטונים קצרים ומחברת אותם יחד. המעברים בין הקטעים יוצרים קפיצות מוזרות, חוסר עקביות בפרטים, או רצפים שנקטעים באגרסיביות. הדבר קורה כי האלגוריתם מתקשה ליצור סיפור קולנועי רציף ומלא. המודל עובד במקטעים נפרדים ומתקשה לאחד אותם לתנועה אחת עקבית.
גנריות רעיונית
מודלים נוטים להפיק רעיונות כלליים מדי, ללא חדשנות וללא סיכון. הם יבחרו בנושאים פופולריים ובטוחים שמדברים לכולם, אך בכך מוותרים על מקוריות. הסיבה לכך היא שהמודל מנסה לא להרגיז אף אחד, ולכן נצמד לקונצנזוס. כך התוכן נשמע בנאלי ומשעמם.
חוסר הבנה של הומור
מודל שפה מתקשה להבין סרקזם, דקויות תרבותיות או בדיחות מקומיות.התוצאה היא הומור תפל, לא רלוונטי ולעיתים מתורגם מילולית משפה אחרת. הדבר קורה כי ההומור מבוסס על ניסיון חיים אמיתי והקשרים תרבותיים, ולא רק על חיבור מילים.
טרנדיות מוגזמת
בינה מלאכותית נמשכת לביטויים טרנדיים שנמצאים בשכיחות גבוהה במאגרי הטקסט שלה, אך אינה יודעת לפרש את ההקשרים. זה אומר שהיא תעשה שימוש בסלנג לא מתאים או בז'רגון עכשווי, שיוכנס ללא הבנה תרבותית אמיתית. המודל פשוט "מעתיק" מילים פופולריות כי למד שהן פופולריות, ולא כי הבין אותן.