11 אתגרים משותפים של חברות סטארט-אפ בתחום הבינה המלאכותית ואופן הטיפול בהם

ג'פרי אריקסון | אסטרטג תוכן | 12 בינואר 2024

כאשר OpenAI שחררה את ChatGPT, מודל השפה הגדול שלה (LLM), לציבור בנובמבר 2022, היא צברה 100 מיליון משתמשים תוך חודשיים בלבד. ChatGPT הפכה לאחת מאפליקציות הצרכן עם הגידול המהיר ביותר אי פעם.

המשקיעים שמו לב.

מאז, חברי רשימת 50 חברות הבינה המלאכותית המובילות של Forbes גייסו יותר מ-27.2 מיליארד דולר במשותף. חלק מהחברות האלה קיימות פחות משנה ומעסיקות פחות מ-20 עובדים. עבור סטארט-אפים ב-AI עם רעיונות מסקרנים, המזומנים זורמים.

הגיוס הכספי, עם זאת, אינו מבטיח הצלחה. חברות סטארט-אפ בתחום הבינה המלאכותית מתמודדות עם אתגרים ייחודיים שדורשים יותר נחישות מהרגיל תזמון שוק וניהול הצמיחה. אימון מודלי שפה גדולים שמניעים שירותים כמו ChatGPT או מחולל תמונות בינה מלאכותית של Midjourney הוא אחת המשימות האינטנסיביות ביותר מבחינה חישובית שהאנושות הגתה. חברות השקעות אומרות שרוב ההון שחברות סטארט-אפ בתחום הבינה המלאכותית מגייסות עובר ישירות למשאבי מחשוב.

מעבר לכך, חברות סטארט-אפ בתחום הבינה המלאכותית אחראיות על האבטחה ועל הפרטיות של מידע רגיש החבוי בהרים של נתוני האימון שאותם המודלים שלהם בולעים, גם כשהם מתמודדים עם ענקים מכהנים שגם הם נעים במהירות כדי ללכוד את נתח השוק.

מייסד Microsoft, ביל גייטס, כינה את הבינה המלאכותית הפיתוח המשמעותי ביותר במחשוב מאז ממשק המשתמש הגרפי שהושק ב-Macintosh של אפל ובכל מערכת ההפעלה ויישום פופולרי מאז לכן מובן שיזמים רוצים להיות חלק מהחגיגה. בואו נסתכל על גורמים שאליהם חברות סטארט-אפ של בינה מלאכותית צריכים להיות מודעים כשהם נכנסים לריב.

מהי חברת סטארט-אפ בתחום הבינה המלאכותית?

חברות סטארט-אפ של בינה מלאכותית גנרטיבית מגיעות בשלושה Flavors‏: אלה שבונים פלטפורמות של מודלים גדולים של שפה, כמו OpenAI או Cohere; אלה שמציעים כלים חדשים לבנייה ואימון של מודלים גדולים של שפה, כמו MosaicML; ואלה שלוקחים מודלים גדולים של שפה בקוד פתוח ומאמנים אותם לפתור בעיות עסקיות ספציפיות - דוגמה לכך היא Tome, שחל על בינה מלאכותית לשיפור המצגות העסקיות.

כל חברות הסטארט-אפ בתחום הבינה המלאכותית עובדות בצילן של ChatGPT, Google, וחברות אחרות שהשתמשו בארכיטקטורות מחשוב רבות עוצמה בשם רשתות עצביות ובאלגוריתמים של למידת מכונה לבנות ממשקי שפה טבעית, ידידותיים שיכולים ליצור טקסט דמויי אדם, תוכן חזותי וקוד מחשב ולבצע משימות רבות אחרות.

תובנות מרכזיות

  • למרות שנעשה שימוש בפלטפורמות בינה מלאכותית כבר שנים רבות, המהדורה הפופולרית של מודלי שפה גדולים לשימוש ציבורי ב-2022 הובילה לזינוק במספר חברות הסטארט-אפ החדשות.
  • משקיעים מוצאים, בודקים ומממנים את חברות הסטארט-אפ האלה בקצב מסחרר.
  • חברות סטארט-אפ בתחום הבינה המלאכותית פועלות בסביבה משתנה של פרטיות ושל חששות רגולטוריים, תחרות על קיבולת מחשוב ואיומים מצד חברות מכהנות.

11 אתגרים של חברות סטארט-אפ בתחום הבינה המלאכותית

מסטארטאפים בעלי מימון נדיב ועד חברות צעירות המתנהלות בצמצום, סטארטאפים אלו מתמודדים עם מכשולים הייחודיים לספקי שירותים מבוססי בינה מלאכותית. 11 האתגרים המפורטים להלן מספקים תחושה טובה של המחסומים האפשריים שמחכים מעבר לפינה.

1. אבטחה ופרטיות

חברות סטארט-אפ בתחום הבינה המלאכותית לוקחות על עצמן את האחריות על אבטחה ועל פרטיות שחורגות מהמאמצים הסטנדרטיים להגנת הנתונים הארגוניים הסטנדרטית. אמצעי אבטחה רבים יהיו מוכרים, כמו השימוש במודל אפס אמון וניטור רשתות של פעילות זדונית שמפעילה תגובות והתראות אוטומטיות. אבל יש גם אתגרים חדשים. לדוגמה, מודלים של בינה מלאכותית עשויים להדליף פרטים מהנתונים ששימשו לאימון שלהם. סלי נתונים אלה יכולים להיות בגודל של מאות ג'יגה-בתים, או אפילו טרה-בייט שנמשכים ממגוון מקורות. הם עשויים להכיל נתונים רגישים, כולל שמות, כתובות ומידע המאפשר זיהוי אישי. האם מודל שאומן באמצעות נתונים אלה עשוי לשקף פרטים פרטיים בפלט שלו?

חשוב לחברת סטארט-אפ לדעת אלו נתונים נמצאים במערכי האימון שלה ויש לה תוכנית למזעור הסיכונים המעורבים במידע רגיש או מוסדר. חברות אלה צריכות לספק למשקיעים שהתגברו על החששות האלה ויש להם תוכנית תגובה לתקשורת במקרה שמשהו משתבש.

2. נפח נתונים

חברות בינה מלאכותית מאמנות ופורסות מודלי שפה גדולים (LLMs) עם סלי נתונים נרחבים ומיליארדי פרמטרים למגוון רחב של שימושים, כולל עיבוד שפה טבעית (NLP) ויצירת תמונות. הם גם מפתחים מודלים של בינה מלאכותית לעיבוד תמונה, חיזוי ותחזיות, זיהוי חריגות, ועוד הרבה יותר. LLMs בפרט דורשים כמויות גדולות מאוד של נתונים כדי לייצר פלטים מדויקים ועקביים.

בתור חברת סטארט-אפ בתחום הבינה המלאכותית, ניהול הנתונים הוא הליבה של העסק שלך.

עם זאת, אתגר מרכזי הוא למצוא את סלי הנתונים הנכונים עבור צורכי אימון ה-AI‏ שלכם ולהעלות אותם למחסן נתונים מסיבי או לבית אגם נתונים. לאחר מכן, הנתונים חייבים לזרום בצורה מאובטחת דרך רשתות נוירונים ואלגוריתמי למידת מכונה באמצעות אשכולות-על של שרתים עם מעבדי גרפיקה (GPU)—בהנחה שתצליחו למצוא אותם.

שבבים גדולים

GPU הוא שבב עם ליבות רבות יותר מאשר יחידת עיבוד מרכזית (CPU). עיצוב זה, כפי שניתן לראות ב-CUDA של Nvidia, קיצור של Compute Unified Device Architecture, מאפשר את המקביליות העצומה הנדרשת למשימות כמו אימון בינה מלאכותית.

3. קיבולת מחשוב

הטענה שאנחנו רואים שוב ושוב בתוכניות טלוויזיה, בסרטים ובתקשורת הפופולרית שבינה מלאכותית תהרוס את העולם. טיעון נגדי אחד: "מאיפה הבינה המלאכותית המרושעת תשיג את מעבדי הגרפיקה?"

להפעלת הרשתות העצביות שבהן בנויים מודלים של בינה מלאכותית, יחידות GPU מפצלות את עבודת החישוב. לאחר מכן המערכת מריצה שאילתות באמצעות מספר יחידות GPU במקביל. זה מוריד את העומס מה-CPU של המחשב ומאפשר לרשת לבצע חישובים מורכבים במהירות רבה. אימון והפעלה של מודלים של בינה מלאכותית דורשים כל כך הרבה כוח מחשוב, עד שיצרני השבבים וספקי הענן ברחבי העולם מתקשים לעמוד בביקוש. הביאו בחשבון שייתכן שתצטרכו לעמוד בתור כדי לקנות שבבים או לשכנע ספק ענן שהסטארטאפ שלכם בתחום הבינה המלאכותית ראוי לקבל את אותם מעבדי גרפיקה יקרים.

4. התאמה אישית

נכון לומר שרוב חברות הסטארט-אפ של הבינה המלאכותית בונות את החברות שלהם סביב מודל שפה גדול שפותח על ידי חברה אחרת, מכיוון שברוב המקרים, התאמה אישית של מודל בינה מלאכותית מ-OpenAI או Cohere יעילה יותר מאשר עיצוב, בנייה ואימון של מודל מאפס.

קיימות שתי גישות נפוצות להתאמה אישית של מודל שפה גדול לתעשייה או תרחיש שימוש מסוימים: כוונון עדין ו-יצירה מועצמת ע"י שליפה (RAG). תוכלו לכוונן את הפלט של מערכת הבינה המלאכותית על-ידי אימון שלה על כמויות גדולות של נתונים ייחודיים למטרה שלכם ולהנחות את הבינה המלאכותית לתת למידע הזה משקל רב יותר בתגובותיו. אפשרות נוספת, RAG, כוללת שיבוץ מסמכים רלוונטיים ביותר במסד נתונים שבו הבינה המלאכותית תשתמש כדי לספק הקשר למנחים הכתובים או המילוליים שמתקבלים על ידה. עם RAG, מסמכים אלה מאפשרים לבינה המלאכותית להוסיף פרטים טכניים רלוונטיים לפלט שלה, ואף לצטט את המקום שממנו התקבל המידע. לדוגמה, סטארטאפ בתחום הבריאות עשוי לשלב מסמכים או מאמרים שעוזרים למודל השפה הגדול (LLM) שלו להבין טוב יותר את כוונת ההנחיות מצד אנשי מקצוע רפואיים, ולאחר מכן לספק שפה מותאמת לתחומי ההתמחות שלהם.

לכל שיטה יתרונות וחסרונות מבחינת מהירות, איכות ועלות. הגישה להתאמה אישית של LLM היא החלטה חשובה לכל סטארט-אפ בינה מלאכותית שמקווה לספק שירות ספציפי לתעשייה או לשימוש.

5. עלויות ענן

עבור חברות סטארט-אפ שנמצאות במצב סטארט-אפ מהיר, קשה להתנגד לתשתית ענן מוכנה. כל ספקי הענן בקנה מידה גדול מציעים את כל הנדרש לאימון או התאמה של מודלי שפה גדולים, כולל אשכולות של שרתי מחשוב המחוברים ברשת בעלת רוחב פס גבוה ומערכת קבצים בעלת ביצועים גבוהים. ומכיוון ששירותים אלו מבוססים על צריכה, הם בדרך כלל פחות יקרים, ולעיתים קרובות מהירים יותר, מאשר הקמת תשתית מקומית.

מכיוון שמערכות אלו מבוססות על צריכה, יש לשקול את המהירות והיעילות מול העלות. סטארטאפ בתחום הבינה המלאכותית יכול להפחית את ההוצאות שלו על-ידי הפעלת מודל שפה גדול (LLM) שמבצע את הדרוש לו עם האלגוריתמים הפשוטים ביותר והכמות המינימלית האפשרית של נתונים. לאחר שתבצעו את חישוב התקציב, בחרו בתשתית ענן שמטפלת במודל שלכם ביעילות. לדוגמה, הפעלה בשרת מתכת חשופה מונעת את העומס הנוסף של מופעים וירטואליים ומספקת ביצועים טובים יותר. הדבר הופך למשמעותי אף יותר כשמדובר בעומסי עבודה מקובצים, שכיחים במודלי שפה גדולים (LLMs).

זכרו, ככל שהמשימה שלכם רצה מהר יותר, כך תשלמו פחות.

6. יעילות

אימון מודל שפה גדול עשוי לקחת שעות גיגוואט רבות של אנרגיה. לשם השוואה, ג'יגוואט אחד יכול לספק חשמל לכ-874,000 בתים למשך שנה, על-פי חברת ההשקעות The Carbon Collective. סטארטאפ שמחפש מימון הון סיכון כדי לספק שירותים מבוססי מודלי שפה גדולים (LLM) חייב להוכיח שהוא משתמש בכספו בתבונה. לדוגמה, לא כל משימות הבינה המלאכותית זקוקות לאותה רמה של תחכום המודל או כוח חישוב. אוסף הולך וגדל של מודלי שפה גדולים (LLMs) מחברות כמו OpenAI‏, Cohere‏, Anthropic ואחרות מציע גרסאות וגדלים שונים. היו מוכנים להסביר מדוע הבחירה שלכם מתאימה לצרכים שלכם ולתקציב שלכם.

לאחר שבחרתם את המודל ואת מערכי הנתונים שלכם, בחרו בקפידה תשתית עם עיבוד מקבילי יעיל ושינוי קנה מידה דינמי כדי להימנע מתשלום על משאבי מחשוב שאינכם משתמשים בהם. היו מוכנים להראות למשקיעים שהבחירות שלכם משקפות איזון בין ביצועים לעלות.

7. שינוי קנה מידה

ישנן שלוש טכניקות עיקריות להרחבת מודלי שפה גדולים (LLMs) כדי לשפר את איכות ומהירות התוצאות: הגדלת כמות הנתונים לאימון, שימוש במודל גדול ומורכב יותר או הוספת יכולת חישוב.

מודל גדול יותר מגדיל את מספר השכבות והפרמטרים בארכיטקטורת הרשת הנוירונית, מה שמעניק לו יכולת גבוהה יותר ללמוד ולייצג דפוסים מורכבים בנתונים. כתוצאה מכך, מודל השפה הגדול שלכם יספק תשובות מפורטות עם ניואנסים נוספים. על ידי הוספת ג'יגה-בייטים נוספים של נתוני אימון, חברת הסטארט-אפ שלכם מתחום הבינה המלאכותית יכולה להציע תגובות מדויקות יותר או מלאות יותר. בשני המקרים, יהיה עליכם גם להרחיב משאביי מחשוב יקרים כדי לשמור על ביצועי מודל.

8. איכות הנתונים

זה לא אתגר ייחודיי לבינה מלאכותית. אנליסטים עסקיים מתמודדים עם איכות הנתונים שבהם הם משתמשים כבר עשרות שנים. סטארטאפים בתחום הבינה המלאכותית צריכים להיעזר במומחיותם של מדעני נתונים ומומחי תחום כדי להסיר מידע מיותר, תוכן לא רלוונטי ו"רעש" אחר מסלי הנתונים המשמשים לאימון אלגוריתמים ולהזנת מודלי שפה גדולים (LLMs).

סטארטאפים בתחום הבינה המלאכותית צריכים לזכור את האימרה "זבל נכנס, זבל יוצא".

מדדי ביצועי מפתח ומדידה

חשוב לחברות סטארט-אפ מתחום בינה מלאכותית לבסס מדדים כמותיים ואיכותיים להצלחה. מדדים כמותיים כוללים תשואה להשקעה בהשקעות בטכנולוגיה ובמדדי ביצועי מפתח טכניים (KPI), כמו טעות ריבועית ממוצעת (MSE), שמזהה תוצאות חריגות יותר.

מעבר לכך, חברות סטארט-אפ מתחום הבינה המלאכותית צריכות להיות מסוגלות למדוד תוצאות איכותיות, כמו מידת איכות הביצועים של מודל בינה מלאכותית כשמדובר בנתונים חדשים או בנתונים שלא נראו בעבר, ומידת הרלוונטיות של התוצאות עבור קהל היעד, ועד כמה תוצאות מקיפות נמצאות בהקשר של התחום הנדון.

10. מימון

קיים מגוון של גישות למימון חברת סטארט-אפ בתחום הבינה המלאכותית. אתם יכולים ללכת בעקבות מודלי שפה גדולים כמו Midjourney ו-Surge AI, שהגדילו בהדרגה את בסיס הלקוחות שלהם מבלי לקחת כסף ממשקיעים. אם הסטארטאפ שלכם בתחום הבינה המלאכותית לא יכול להסתפק בצמיחה הדרגתית, ישנם משקיעים פרטיים, מאיצים וחממות טכנולוגיות שמחפשים מייסדים בתחום הבינה המלאכותית עם מוחות חדים ורעיונות טובים. היתרון של חממות טכנולוגיות ומאיצים הוא בכך שהם מספקים קשרים, גישה להזדמנויות בשוק, ייעוץ עסקי, ואפילו פלטפורמות טכנולוגיות לבניית שירותי בינה מלאכותית.

11. מכירות ושיווק

פלטפורמות מכירה ושיווק מתקדמות משתמשות בבינה מלאכותית בכל שלב במסע הלקוח, וכל סטארטאפ בתחום הבינה המלאכותית שמעוניין להגדיל את נתח השוק שלו ירצה להיעזר בבינה מלאכותית לשם כך. איך? בינה מלאכותית יכולה להשתמש בנתונים מפורטים, כולל נתוני מיקום בזמן אמת למיפוי ומעקב אחר תנועות, כדי ליצור הצעות מוצר או שירות מותאמות אישית ללקוחות פוטנציאליים. עוזרי בינה מלאכותית יכולים ליצור הזדמנויות למכירה נוספת ולמכירה צולבת, או לעודד קונים להשלים את העסקה לאחר שהכניסו פריטים לעגלת הקניות שלהם. טקטיקות אלו הוכחו כמגבירות שיעורי המרה ומשמחות משקיעים להוטים לראות את הסטארטאפ מגדיל את המכירות שלו.

שירותים מבוססי בינה מלאכותית יכולים לטפל בשאלות לאחר המכירה, להבין את ההקשר ולהציע הצעות, תוך שיתוף פרטים מדויקים על זמני תיאום או משלוח, והפניית שאלות מורכבות יותר לנציגים אנושיים. כשתראו כיצד פועלים שירותים מבוססי בינה מלאכותית אלו תוכלו להעריך את ההצעות של הסטארטאפ שלכם.

הרחיבו את העסקים שלכם עם Oracle

אם אתם בונים עסק מבוסס בינה מלאכותית, שקלו את Oracle Cloud Infrastructure (OCI), שמספק תשתית יציבה למודלים של אימון ומתן שירות בקנה מידה גדול. באמצעות השותפות עם NVIDIA‏, Oracle יכולה לספק ללקוחות אשכולות-על, המונעים על ידי המעבדים הגרפיים העדכניים ביותר ומחוברים לרשת RDMA over Converged Ethernet‏ (RoCE) עם זמן המתנה נמוך ביותר. ארכיטקטורה זו מספקת שיטה חסכונית ובעלת ביצועים גבוהים לאימון מודלים של בינה מלאכותית גנרטיבית בקנה מידה גדול. חברות סטארט-אפ רבות של בינה מלאכותית, כולל Adept ו-MosaicML, בונות את המוצרים שלהם ישירות ב-OCI.

Oracle מקלה על התחלת העבודה עם שירותי OCI, שכוללים שירותי ענן נבחרים שתמיד ניתנים בחינם. חברות סטארט-אפ יכולות ללמוד עם שולחנות חול של מפתחים או עם פריסות ארוזות של תוכנות פופולריות על ידי פריסת אשכול Kubernetes.

כדי לעזור לחברות סטארט-אפ להחליט, Oracle מספקת כלי חקר, הכוללים מחשבוני עלויות, ביקורות אנליסטים של צד שלישי והשוואות מפורטות בין OCI לפלטפורמות ענן אחרות.

הבינה המלאכותית נמצאת בחיינו כבר יותר מעשור, היא עובדת ברקע, מנטרת הונאות במיליוני עסקאות בנקאיות, מתמודדת עם אינטראקציות שירות לקוחות בחזית, ומקבלת החלטות במהירות הבזק כדי להאיץ את הלוגיסטיקה של משלוחי לילה. עכשיו, עם הדור האחרון של מודלי שפה גדולים, היכולות המעודנות, העוצמתיות ובלתי נתפסות של הבינה המלאכותית מקבלות את ממשק המשתמש שמגיע להן: המילה הטבעית המדוברת או הכתובה.

כתוצאה מכך, מודלים גדולים של שפה הציתו את הדמיון הפופולרי ביצירת תמונות, בטקסט כתוב ובתרגום, ואפילו ביצירת קוד. למרות שהאתגרים הם רבים, עכשיו הגיע הזמן שחברות סטארט-אפ של בינה מלאכותית ימצאו משקיעים, ישרתו לקוחות חדשים ויתרחבו ממש כמו ב-1999.

הקמת מרכז מצוינות של בינה מלאכותית לפני התחלת האימון הספציפית לארגון מגדילה את הסיכויים להצלחה. הספר האלקטרוני שלנו מסביר מדוע ומציע טיפים על בניית מרכז מצוינות יעיל.

שאלות נפוצות בנושא בינה מלאכותית וחברות סטארט-אפ

מהם האתגרים המשותפים לחברות סטארט-אפ של בינה מלאכותית?

סטארטאפים בתחום הבינה המלאכותית מתמודדים עם אתגרים כמו בחירת מודל השפה הגדול (LLM) המתאים לאימון, מציאת נתוני אימון נכונים, והרכבת כוח מחשוב עצום כדי לתמוך ברשתות הנוירונים שלהם. יש גם בעיות של פרטיות נתונים, אבטחת נתונים ותקנות משתנות שאיתן יש להתמודד.

אילו סוגי שירותים מוצעים על-ידי חברות סטארט-אפ בתחום הבינה המלאכותית?

סטארט-אפים בתחום הבינה המלאכותית צצים בכל מגזר עסקי, כולל בתחומים מגוונים כמו בריאות, ייצור וביטחון לאומי. חלק מהסטארטאפים מציעים מוצרים לצרכנים, בעוד שאחרים מפתחים כלים שמשמשים חברות בינה מלאכותית אחרות לבניית ואימון המודלים שלהן.

כיצד מוצאות חברות סטארט-אפ בתחום הבינה המלאכותית מימון?

סטארטאפים המחפשים משקיעים יכולים לבצע חיפוש מהיר אחר משקיעים פרטיים, שתמיד מחפשים הזדמנויות. אפשרויות נוספות הן חממות טכנולוגיות או מאיצים, שיכולים לספק הדרכה וסיוע טכנולוגי למייסדי סטארטאפים.