שער המרה כפול

ד"ר תמר עילם גינדין

ד"ר תמר עילם גינדין

ד"ר לבלשנות איראנית ומרצה בנושאים שונים

תקציר מנהלים:
קטעים עם גוגל טרנסלייט.
לתרגם משפה שאינה אנגלית לשפה אחרת שאינה אנגלית זה כמו לשלם זלוטי בישראכרט. משלמים גם את שער ההמרה הגבוה זלוטי>דולר וגם את השער הגבוה דולר>שקל.
הקורא המצוי מעדיף חוסר היגיון סמנטי (במשמעות) על פני חוסר היגיון תחבירי או תחביר מתוחכם מדיי.

כלכליסט ציטט השבוע את עופר שושן, מנכ"ל OHT שאמר (לכאורה) שגוגל טרנסלייט לא מושלם.

צחקתי שעה.

מכירים את התרגום שמסתובב עכשיו ברשת, של Veni, vidi, vici "באתי ראיתי אני כבשה"?
אז קודם כול ירים את ידו מי שבקריאה ראשונה לא קרא "אֲנִי כִּבְשָׂה".

אורן צור מסביר בבלוגו "מדע בזיוני" שזה בעצם "אני כָּבְשָׁה", ולמה. הוא מראה שם גם שאם מנסים כל מילה בנפרד, מקבלים: אני בא / ראיתי / הרחוב של. ובמשפט שלם בלי פסיקים, מקבלים עוד תוצאה משתי קודמותיה: "באתי, ראיתי את הרחוב של". בשלב זה "אני כבשה" מתחיל להיראות הגיוני. ובהערות כתוב שמוזר שתרגמו את "אני בא" בהווה במקום בעבר.

Google Translate הוא תמיד מזעזע, גם אם אחת השפות היא אנגלית. וכשלא – יש שער המרה כפול. נכון כשנוסעים לחו"ל ומשלמים בכרטיס אשראי או מושכים מזומנים במטבע שאינו אירו או דולר, אז צריך לשלם גם את שער ההמרה לאירו/דולר וגם את שער ההמרה דולר/אירו לשקל? אז אותו דבר בתרגום: קודם כול יש שגיאות התרגום משפת המקור לאנגלית, ואחר כך השגיאות מאנגלית לשפת היעד.

הדוגמה האהובה עליי (מתוך שיר האהבה "סולטן הלבבות" سلطان قلبها) היא פרסית یه دل می گه نرم نرم. בתרגום אנושי צמוד, זה יוצא "לב אחד אומר "לא אלך, לא אלך", ובתרגום חופשי "חלק ממני רוצה להישאר". בפוסט שבקישורים הסברתי למה התרגום לאנגלית יוצא "I shit a software application". כשמתרגמים מפרסית לעברית, שוב משלמים הפרשי שערים, ויוצא "אני חרא יישום תוכנה".

ההערה של אורן על "אני בא" = הווה, וגם הקריאה הראשונית של כולנו (הבה נודה) "אֲנִי כִּבְשָׂה" זה כבר שער המרה שלישי: המוח שלנו. אילו היה מתורגם "אני באת", או "אני כבשת", היינו מבינים יותר טוב שמדובר בפועל בעבר בגוף לא נכון. אבל בלי ניקוד יש הומוגרפיה בין כִּבְשָׂה ו-כָּבְשָׁה, ו-בָּא (הווה יחיד) ו-בָּא (עבר נסתר) הם הומונימים גם עם ניקוד, ומסתבר שהמוח שלנו, הפילטר השלישי, מעדיף היגיון תחבירי על פני היגיון סמנטי. "אני כבשה" ו"אני בא" יכולים להיות משפטים הגיוניים לחלוטין בעברית בהקשרים אחרים. גם במשפטי חולצה עובד אותו פילטר – אמנם התחביר של המשפטים האלה תקין בדרך כלל, אבל הוא לא התחביר הפשוט יותר (אילו היו כותבים "מטיילת חולצה" במקום "חולצה מטיילת", כל המשפט היה יותר מובן, אבל הרבה פחות כיפי).

החלטתי לבדוק את התיאוריה הזאת: האם זה באמת מקרה של שער המרה כפול, או שגוגל טרנסלייט ממש לא יודע מהחיים שלו? תרגמתי כל מיני צירופים של I came ופעלים נוספים, והנה התוצאה:

גוגל טרנסלייט המלך

ועוד:

we came to class תורגם "באנו בכיתה".

she came to class – היא באה לכיתה.

he came to class – הוא בא לכיתה.

came to class – הגיע לכיתה.

ב-"I came" אני מניחה שמדובר בעבר נסתר, כי ההצעות להחלפה הם "באה, הגיע, באו, הגיעו". מצד שני, גם האופציות להחלפת "רואה" הן בעבר, ושם הצורה בעברית היא חד משמעית. אני מניחה שיש גם עניין סטטיסטי, אבל לגמרי לא ברור לי העניין עם I came to class "אני באה" (שזה גם עבר, כי האפשרויות האחרות הם "בא, הגיע, באו הגיעו"). אולי מישהו שמבין באלגוריתם של גוגל טרנסלייט יכול לעזור כאן. או שזה באמת בגלל שגוגל טרנסלייט לומד מכל מלמדיו, ולרוב מלמדיו יש כוונות זדון.

ולעניין שער ההמרה הכפול – זאת הייתה התוצאה כשניסיתי לתרגם משפה אחת שהפועל בה מבחין גופמספר לשפה אחרת שהפועל בה מבחין גופמספר. הנטייה היא עבר, הווה (ספרותית) הווה (מדוברת). סדר הגופים כמו בהטייה המקובלת בעברית.

Double exchage rate. The wonders of Google Translate
Double exchage rate. The wonders of Google Translate (click to enlarge).y

ולפני סיום – האתר המענג והממכר ביותר שמבוסס על גוגל טרנסלייט – ליפנית. קוראים לו Translation party. תודה לאורי שהכיר לי את האתר הזה, וגם תכנת בזמנו משהו דומה עם שפות אחרות (הקישור נוסף בעקבות ההערה של אורי לפוסט), אבל יידיש-אלבנית יוצא הרבה פחות מצחיק, למרות שערי ההמרה הכפולים.

רוצים לשמוע עוד? אני נותנת הרצאות העשרה במגוון נושאים לחברות, ארגונים ומסגרות פרטיות שמשלמות טוב (אם אנחנו כבר בענייני כיף). העבירו לרכזי תרבות, למנהלי רווחה ולחברים בחוגי בית, וצרו קשר להזמנת הרצאה.

הפוסט הזה נכתב בתאריך יום שלישי, 12 באפריל, 2011 בשעה 20:06 תחת הקט

שתפו את הפוסט:

Facebook
WhatsApp
Twitter
Telegram
Email
Print

לפוסט הזה יש 6 תגובות

  1. יניב ג״מ

    הלקח העיקרי שלמדתי מכל הסיפור הזה הוא שגוגל־טרנסלײט מתייחס ל"I came" בתור שתי יחידות נפרדות שבמקרה ניצבות זו לצד זו, ולא בתור יחידה אחת.
    לתלמידים של גולדנברג זה לא היה קורה.

  2. אורי

    למי שבכל זאת רוצה לנסות את Translation Party עם יידיש-אלבנית (ועוד זוגות שפות), העליתי את הגירסה הפיראטית שלי מחדש, ב: http://tp2.heliohost.org/tp.html

  3. תמר

    לא תמיד. בנפרד זה מתורגם "אני בא", בהקשרים שונים זה יכול להיות "באתי" או "אני באה".
    לא ברור האלגוריתם.

  4. Kipod

    ובכל זאת, יש לך כאן כלי המתרגם פי מליונים מהר יותר מכל אדם, ליותר שפות מכנראה כמה שידע כל אדם בודד בהסטוריה האנושית. לא מושלם? נכון. אבל מאפשר לי אם אני רוצה להבין טקסט שנכתב בפינית. אני חושב שזה מדהים. ואם מחירי האינטרנט הסלולרי בחו"ל היו סבירים יותר, הייתי לוקח טלפון חכם לנסיעה הקרבה לרומניה, כדי שאוכל לטרנסלייט עם אנשים ברחוב.

  5. תמר

    פי מיליונים יותר מהר – מסכימה. ליותר שפות – נכון. מאפשר לך אם אתה רוצה להבין טקסט שנכתב בפינית? אני לא חזקה בפינית (בקי, האם את עדיין כאן?), אבל אני יכולה להעיד שבשפות שאני יודעת הוא אמין באופן חלקי מאוד.
    אתה יכול לקנות או לשכור ברומניה סים מקומי, בטח יהיה זול יותר לגלוש, ואני מפצירה בך בשובך לדווח לנו על הפדיחות שיגרום לך הטרנסלייט, בהבנה ובמובנות.

כתיבת תגובה

עוד פוסטים

קמפיין מימון המונים חדש ולא כל כך מוצלח. סיכום ביניים

אני אתרגם את "מגילת אסתר: מאחורי המסכה" לפרסית ואפיץ כ-PDF חינם לאיראנים, שיוכלו גם ללמוד על מורשתם הקדומה – שהרפובליקה האסלאמית מנסה למחוק – וגם להבין מה נכון ומה לא (בעיקר מה לא) בתעמולה האנטישמית שמשתמשת בפורים. האם זה ייקח לי שנים או חודשים? זה תלוי, בין השאר, בכם.

קרא עוד »