→ חזרה לבלוג
בינה מלאכותית ועסקים

מיליארד פעמים יותר: מה מלמד אותנו זינוק צריכת ה-Tokens של OpenAI על ניהול עלויות AI בארגון

5 ביוני 20266 דק' קריאה
מיליארד פעמים יותר: מה מלמד אותנו זינוק צריכת ה-Tokens של OpenAI על ניהול עלויות AI בארגון

סם אלטמן, מנכ"ל OpenAI, חשף נתון שממחיש עד כמה הבינה המלאכותית חדרה לליבת הפעילות העסקית. לפי Axios, אלטמן אמר שהמשתמש המוביל ב-OpenAI צורך כ-100 מיליארד tokens בחודש, והוסיף, "למבוכתי, זה לא המוביל בעולם. מצאנו מישהו שצורך אפילו יותר". עבור מקבלי החלטות בארגונים, זו לא כותרת טכנולוגית בלבד אלא נורת אזהרה תקציבית: צריכת ה-AI הופכת מהוצאה זניחה למרכיב עלות מהותי שדורש ממשל ובקרה.

מה הם בכלל Tokens ולמה הם חשובים לעסק שלכם

טוקן (Token) הוא יחידת המידע הבסיסית שבה מודל שפה מעבד טקסט. בקירוב, טוקן בודד שווה לכשלושת רבעי מילה. כל בקשה למודל וכל תשובה שהוא מחזיר נמדדות ומחויבות בטוקנים, ולכן הטוקן הוא היחידה הכלכלית שקובעת את עלות השימוש ב-AI. ככל שהארגון מטמיע יותר תהליכים מבוססי בינה מלאכותית, כך גדל מספר הטוקנים הנצרכים, ואיתו החשבון החודשי.

כדי לתת פרופורציה: 100 מיליארד טוקנים בחודש משקפים נפח עיבוד עצום, השווה לעשרות מיליארדי מילים מטקסט מעובד מדי חודש על ידי גוף אחד בלבד. זהו סדר גודל תעשייתי שלא נראה כמותו בעבר.

הקפיצה: פי מיליון בתוך שש שנים

הנתון המדהים באמת אינו המספר המוחלט אלא קצב הגידול. אלטמן השווה את הנתון למשתמש המוביל של OpenAI לפני כשש שנים וחצי, שצרך כ-100 אלף טוקנים בחודש, כלומר גידול של פי מיליון לערך בצריכה למשתמש. הגידול אינו נקודתי לשיא בודד אלא מגמה רוחבית: OpenAI הודיעה שפלטפורמת ה-API שלה מעבדת 6 מיליארד טוקנים בכל דקה, פי 20 לעומת לפני שנתיים.

גם בחתך הארגוני המגמה חדה. צריכת טוקני ה-reasoning הממוצעת לארגון גדלה בכ-320 פעמים ב-12 החודשים האחרונים, מה שמעיד שמודלים חכמים יותר משולבים באופן שיטתי במוצרים ובשירותים מתרחבים. במילים אחרות, ארגונים אינם רק מתנסים ב-AI, הם מטמיעים אותו עמוק יותר ובמשימות מורכבות יותר.

למה החשבון תופח גם כשהמחיר לטוקן יורד

נקודה קריטית שמקבלי החלטות חייבים להפנים: ירידה במחיר ליחידה אינה מבטיחה ירידה בעלות הכוללת. הסיבה היא נפח. כלי AI מבוססי סוכנים שהושקו לאחרונה, ובהם Claude Opus 4.5, GPT-5.1 ו-Gemini 3 Pro, הכפילו את צריכת הטוקנים למשימה. תהליך שבעבר היה שאילתה לינארית פשוטה הפך כיום לשרשרת פעולות אוטונומית הצורכת טוקנים רבים יותר.

הפער הכלכלי ממחיש זאת היטב: תהליך לינארי פשוט בשנת 2023 עלה כ-0.04 דולר לאינטראקציה, בעוד מערכת סוכנים מתוזמרת עולה כיום כ-1.20 דולר, פי 30 בקירוב. אצל מפתחים בודדים הקפיצה דרמטית אף יותר: מהנדסים בודדים במיקרוסופט דווח שהוציאו בין 500 ל-2,000 דולר בחודש על טוקנים.

אלטמן עצמו אינו מתעלם מכך. דיווחים מצטטים אותו כשהוא מתאר את העלות כ"בעיה ענקית פתאומית" עבור הלקוחות, ומצביע על "אתגר התשתית שלפנינו". אנקדוטה אחת ממחישה את הסיכון: Yahoo Finance מצטט סיפור על מנהל כספים שצבר בטעות חשבון IT של 500 מיליון דולר תוך התנסות בשימוש בקנה מידה גדול.

תרבות ה-"Token Leaderboard" וקצה הקרחון

השימוש בקנה מידה זה הפך לתופעת תרבות. OpenAI מנפיקה כיום לוחיות פיזיות שהיא מכנה "Tokens of Appreciation" לארגונים שחוצים אבני דרך של צריכה: 10 מיליארד, 100 מיליארד וטריליון טוקנים דרך ה-API. דוגמאות קיצוניות אינן נדירות: מיזם הפיתוח OpenClaw דווח שרשם 603 מיליארד טוקנים בחודש בודד, בעלות של למעלה מ-1.3 מיליון דולר, ש-OpenAI כיסתה לאחר שהיוצר הצטרף לחברה.

הזווית של R.A.S Systems: ממספרים מרשימים לאסטרטגיה מנוהלת

ב-R.A.S Systems אנו מתרגמים את המגמות הללו להמלצות מעשיות. הנתונים מ-OpenAI אינם סיפור על חברה אחת בסן פרנסיסקו, הם מתווה של מה שצפוי לכל ארגון שמטמיע AI במערכות הליבה שלו. כשבונים מערכת מותאמת אישית, ניהול צריכת הטוקנים חייב להיות מובנה בארכיטקטורה מהיום הראשון, לא תיקון בדיעבד.

הזינוק של פי מיליון בצריכת הטוקנים מסמן שהבינה המלאכותית עברה את שלב ההתנסות ונכנסה לליבת הפעילות העסקית. עבור ארגונים, המשמעות ברורה: כדאי לאמץ את היכולת, אך חובה לעשות זאת עם ממשל עלויות הדוק. נתוני שטח מראים שמהנדסים שצרכו הכי הרבה טוקנים היו בערך פי שניים פרודוקטיביים ממשתמשים קלים, אך הוציאו פי עשרה טוקנים כדי להגיע לכך. האתגר אינו לצרוך פחות, אלא לצרוך נכון. זו בדיוק הנקודה שבה מערכת ליבה מתוכננת היטב עושה את ההבדל בין נכס אסטרטגי לבין הוצאה בלתי נשלטת.

שאלות נפוצות

כמה טוקנים צורך המשתמש הגדול ביותר ב-OpenAI?

לפי הצהרת המנכ"ל סם אלטמן, המשתמש המוביל ב-OpenAI צורך כ-100 מיליארד טוקנים בחודש, והוא אף ציין שקיים גורם בעולם שצורך אפילו יותר.

מהו בכלל טוקן (Token) בבינה מלאכותית?

טוקן הוא יחידת המידע הבסיסית שבה מודל שפה מעבד טקסט, וטוקן בודד שווה בקירוב לכשלושת רבעי מילה. הטוקנים הם היחידה שלפיה מחושבת עלות השימוש ב-AI.

אם מחיר הטוקן יורד, למה החשבון על AI גדל?

הסיבה היא נפח. כלים מבוססי סוכנים אוטונומיים מכפילים את מספר הטוקנים לכל משימה, כך שתהליך שעלה סנטים בודדים בעבר עשוי לעלות כיום פי עשרות מונים — מה שמגדיל את העלות הכוללת למרות הירידה במחיר ליחידה.

כיצד ארגון יכול לשלוט בעלויות צריכת הבינה המלאכותית?

באמצעות ניטור צריכה שקוף ברמת התהליך והמשתמש, ניתוב חכם של משימות למודלים מתאימים, שימוש במטמון להקשרים חוזרים, והגדרת מכסות והתראות תקציב. ב-R.A.S Systems אנו מטמיעים מנגנונים אלו כחלק מהארכיטקטורה של מערכות הליבה.

בכמה גדלה צריכת הטוקנים בשנים האחרונות?

צריכת הטוקנים למשתמש מוביל זינקה בערך פי מיליון בתוך כשש שנים וחצי, וצריכת טוקני ה-reasoning הממוצעת לארגון גדלה בכ-320 פעמים בשנה האחרונה בלבד.

#OpenAI#בינה מלאכותית#ניהול עלויות AI#Tokens#טרנספורמציה דיגיטלית#סם אלטמן#מערכות ליבה