תרגום בזמן אמת: הצעד הבא של Google
ביוני 2026 השיקה Google את Gemini 3.5 Live Translate, מודל אודיו חדש לתרגום דיבור-לדיבור רציף ב-70 שפות. בניגוד למערכות תרגום מסוג "תור-אחר-תור", שמחכות לסיום הדיבור לפני שמייצרות תרגום, המודל החדש מייצר דיבור מתורגם באופן רציף ועקבי, תוך שמירה על האינטונציה, הקצב והגובה של הדובר המקורי.
מה כולל ההשקה
ה-rollout מתבצע בו-זמנית בכמה ערוצים:
- לצרכנים: זמין כיום באפליקציית Google Translate ל-Android ו-iOS ברחבי העולם, ללא גישה מוגבלת.
- למפתחים: נגיש בתצוגה מקדימה ציבורית דרך Gemini Live API ו-Google AI Studio, כ"פרימיטיב בניה" לפיתוח מוצרים.
- לארגונים: נמצא בתצוגה מקדימה פרטית ב-Google Meet, עם תוכניות פריסה לאנטרפרייז השנה.
70 שפות, אך לא בהכרח באותה רמה
המודל מזהה אוטומטית מעל 70 שפות ומאפשר תיאורטית יותר מ-2,000 צמדי שפות. עם זאת, Google לא פרטה האם כל הצמדים מתפקדים ברמת איכות אחידה, ואם כיוון התרגום (למשל עברית לאנגלית לעומת אנגלית לעברית) משפיע על הביצועים. עבור ארגונים שמתכננים שיחות רב-לשוניות ענייניות, פרט זה רלוונטי.
הקשר: מסלול שנה וחצי של Google
ה-Gemini 3.5 Live Translate הוא פרי של מסלול פיתוח עקבי: בדצמבר 2025 הטמיעה Google תרגום טקסט מבוסס Gemini ב-Search ובאפליקציית Translate, ובפברואר 2026 הוסיפה יכולות הקשר ותרגום מודע-טון. ההשקה הנוכחית מרחיבה את היכולת לרמת הדיבור החי, הן לצרכנים והן לשוק הארגוני.
המשמעות לארגונים שמפתחים מערכות ליבה
מניסיון R.A.S Systems בבניית מערכות ליבה לעסקים, הגישה של Google לחשיפת המודל גם כ-API למפתחים היא המשמעותית ביותר עבור ארגונים. כאשר יכולת תרגום דיבור בזמן אמת הופכת לפרימיטיב בניה, היא יכולה להשתלב בתוך תהליכים פנים-ארגוניים: קבלת לקוחות בשפתם, ישיבות רב-לאומיות, תמיכה טלפונית אוטומטית ושירות שטח בשפות מקומיות. השאלה שארגון צריך לשאול אינה אם הטכנולוגיה קיימת, אלא כיצד להטמיע אותה בתוך מערכות הליבה הקיימות בצורה מדויקת ומדידה.
המגמה ברורה: מחסומי השפה בתקשורת עסקית הולכים ונעלמים, וארגונים שיבנו את התשתית הנכונה עכשיו יוכלו לתפעל תהליכים רב-לשוניים בצורה חלקה הרבה לפני המתחרים.