ChatGPT Israel – צ'אט GPT בעברית
ChatGPT

מהפך: חברות AI מחפשות דרך חדשה ליצירת בינה מלאכותית חכמה יותר

חברות AI מתמודדות עם אתגרים באימוני מודלים גדולים ומתקדמים. OpenAI ומדענים נוספים חוקרים טכניקות חדשות לחיזוק המודלים באמצעות תהליך "זמן חישוב בזמן השימוש". גישה זו עשויה לשנות את פני המרוץ ל-AI ואף להשפיע על דרישת הציוד, כולל מעבדי ה-AI.
מהפך חברות AI מחפשות דרך חדשה ליצירת בינה מלאכותית חכמה יותר

מגבלות השיטות המסורתיות והחיפוש אחר דרך חדשה

חברות בינה מלאכותית, כולל OpenAI, ניצבות בפני אתגרים רבים באימוני מודלים גדולים ומתקדמים בשנים האחרונות. עם עליית הדרישות של תהליכי לימוד מסיבי, כמו אלה הנדרשים למודלים של שפה גדולה, עולה הצורך לא רק בהגדלת כמות הנתונים והעוצמה החישובית, אלא גם בגישות חדשות שמצליחות להתגבר על מגבלות אלה. חוקרים ואנשי טכנולוגיה בכירים מדווחים כי "שיטות גדילה והרחבה" אינן בהכרח מניבות את התוצאות המיוחלות. מדובר בתהליך שהולך ומתגלה כמוגבל – גם מבחינת זמן, עלות והזמינות של משאבים כמו מעבדים מתקדמים וחשמל.

בינה מלאכותית דמוית-אדם: החזון החדש של OpenAI

באופן מעניין, OpenAI החלה להתנסות בטכניקות חדשות שמחקות יותר את צורת החשיבה האנושית מאשר להסתמך על הגדלת הנתונים בלבד. אחת הטכניקות שנכנסות למרכז הבמה היא גישת ה-"זמן חישוב בזמן השימוש", שבה המודל אינו מוגבל לתשובה מיידית אלא מתאפשר לו לבצע ניתוח מעמיק ולבחור את התשובה המתאימה ביותר – ממש כמו בתהליך של קבלת החלטות אנושית. החוקרים מדווחים כי ביישומים מסוימים, כמו משחק פוקר או פתרון בעיות מתמטיות, הצליחה השיטה להשיג תוצאות טובות במינימום של חישובים, דבר שהיה אפשרי רק עם גדילת המודל פי כמה עשרות אלפי פעמים.

המודל החדש של OpenAI – O1: שימושיות וחשיבה מרובת שלבים

המודל החדש, המכונה "O1", מתבסס על הרעיון של "חשיבה בשלבים" ומאפשר למודל לנתח באופן יעיל בעיות מסובכות ולפעול בהתאם לשיטות קבלת החלטות דמויות-אדם. המודל נבנה על מודלים קודמים כמו GPT-4 ומדגיש את יכולותיו במתן מענה מהיר ומדויק לצרכים מורכבים כגון פתרון בעיות מתמטיות או ניתוח מידע מורכב בתחומי הרפואה והטכנולוגיה. המודל מצליח להסתמך גם על מידע שנוצר ומוערך בידי מומחים מהתחומים השונים – מה שמשפר את יכולותיו, מעניק לו תובנות מעמיקות ויכולת לאמת עובדות ולמנוע יצירת "הזיות".

משמעות השינוי: השפעה על הביקוש למעבדי AI והעלויות

לשינוי זה עשויות להיות השלכות משמעותיות על תחום המעבדים החישוביים. הדרישה לתשתיות חזקות לתהליכי אימון עשויה לפנות את מקומה לדרישה לאינפרנס מהיר ויעיל – תהליך שבו עיבוד המידע מתבצע בזמן אמת לשיפור חוויית המשתמש. המעבר לשימוש בטכניקות חישוב מתקדמות עשוי לשנות את הביקוש לסוגי המעבדים הנדרשים, ולתת דגש על מעבדי אינפרנס המסוגלים לתמוך בגישות החדשות. כך, לצד מעבדיה המתקדמים של Nvidia, יש צפי לעליית מתחרים בשוק שיוכלו להציע פתרונות מתקדמים במגזר זה.

מרוץ לחדשנות: חברות נוספות מצטרפות למאמץ

לא רק OpenAI מפתחת שיטות חישוב חדשות, אלא גם מעבדות AI נוספות כמו Anthropic, Google DeepMind ו-xAI שהחלו לבחון גישות מתקדמות דומות. חברות אלו רואות באפשרות ליישם "חישוב בזמן השימוש" דרך למינוף יכולות החישוב האדירות שלהן וליצור פתרונות AI גמישים יותר. באותו הזמן, קהילת החוקרים ומפתחי הבינה המלאכותית צופים כי שילוב יכולות מחשבה אנושיות על ידי מודלים אלה תביא למודלים יעילים ומדויקים יותר בהשוואה לשיטות הקיימות כיום.

השפעה על השוק וההשקעות בעתיד הקרוב

השינוי בגישות החישוב משפיע גם על משקיעים מובילים וקרנות הון סיכון, כגון Sequoia ו-Andreessen Horowitz, אשר מתמודדות עם אפשרויות חדשות בתחום השקעות הבינה המלאכותית. אם בעבר ההשקעות הופנו בעיקר לפיתוח התשתית החישובית ולפרויקטים של הרחבת מודלים, היום המיקוד עובר לניצול המשאבים בצורה יעילה יותר, תוך מתן דגש על יכולות של זמן חישוב בזמן השימוש.

סיכום

כשהשיטות הנוכחיות מגיעות למגבלותיהן, AI גמיש ויעיל המבוסס על חשיבה מרובת שלבים עשוי לשנות את המודל השולט בשוק. עם השקת מודלים כמו O1, חברת OpenAI, מפתחת צ'אט GPT, ושותפיה מתמקדים ביישום תובנות חדשות ומכוונות-משתמש, כך שאותן טכנולוגיות יוכלו לתמוך ביישומים מגוונים ומתקדמים, תוך צמצום הצורך באימונים חישוביים מאסיביים.