The headlines that made most buzz on this page
30/07/24 17:45
10.96% of the views
מאת אנשים ומחשבים
נועה יחזקאל לובין היא מדענית נתונים, חוקרת יישומים בעולמות הבינה המלאכותית, יזמית חברתית ומרצה בפורומים שונים. בין כל עיסוקיה, היא החליטה לחבר ספר שמסביר לילדים מה זו בינה מלאכותית. הספר נקרא בפשטות בינה מלאכותית.
בראיון לפודקאסט אנשים ומחשבים לובין מספרת כיצד מסבירים לילדים מושגים כמו למידת מכונה, רגרסיה לינארית ועיבוד שפה טבעית. "הצעירים חשופים לבינה מלאכותית לא פחות מאיתנו, וחשוב מאוד שהם יבינו מה עומד מאחורי זה. הם דור העתיד", היא אומרת. לובין היא בעלת תואר ראשון בהנדסת חשמל ותואר שני במדעי המחשב עם התמחות בבינה מלאכותית. בצה"ל היא שירתה בחיל המודיעין, שם היא הכירה את בעלה, יותם. כיום מובילה לובין את תחום הדאטה בחברה שנותנת מענה פיננסי לתושבים באפריקה שאין להם אפשרות לנהל חשבון בנק. בעברה היא הועסקה בסטארט-אפ רפואי, שיודע לזהות החמרה במצבים של חולים סופניים ומונע את הסבל שלהם.
מה הביא אותך לכתוב ספר ילדים בנושא שגם מבוגרים רבים לא ממש מבינים בו?
לובין: "אני אימא לשני ילדים שאוהבים ספרים. גיליתי שאין שום ספר שיסביר מה אימא שלהם עושה בעבודה – כלומר, על בינה מלאכותית. חוץ מזה, מאז ומתמיד הייתה לי משיכה להוראה ולהנגשת נושא המדעים לאוכלוסיות שונות.
בשנים האחרונות, הבינה המלאכותית נמצאת בכל מקום: בבית הספר, ברכב, בטלפון ואפילו במשחקים של הילדים. מושגים כמו למידה עמוקה, מודלי שפה ובינה מלאכותית יוצרת הפכו לחלק מהשפה של רבים מאיתנו. אין ספק שהבינה המלאכותית תהיה חלק מהחיים של הילדים שלנו בבית הספר, בעבודה ובכל מקום, וחשוב שהם ייחשפו לידע הזה כבר מגיל צעיר – כמובן, בשפה שמותאמת לגילם".
תני כמה דוגמאות איך ממחישים לילדים בינה מלאכותית.
"הספר מכיל הרבה אינפוגרפיקה שמדברת על הילדים. למשל, כשאני מסבירה לילדים מה זו בינה מלאכותית יוצרת, אני נותנת להם אתגר תוך כדי הקריאה, ומראה להם מודל של כמה מילים שמייצרות משפט, כך שהם מתבקשים להשלים את המילה הבאה במשפט, לפי הסיכוי שהיא תימצא שם.
לדוגמה, בספר אני מבקשת מהילד להשלים את המשפט 'ביום הולדתו, ינאי קיבל…'. אחר כך אני מבקשת ממנו להחליף את השם ינאי במשהו אחר, ואז לראות האם הוא יקבל את אותה התשובה. כך הוא לומד מה זו בינה מלאכותית".
אני רואה ברשימת הפרקים נושאים כגון עיבוד שפה טבעית, שרק חלק קטן מהמבוגרים מבין אותם.
"הבת שלי בת ה-5 מתחילה ללמוד לכתוב ולקרוא. כשהיא רוצה לדעת משהו היא מקליטה את השאלה באחת התוכנות הקיימות, ואז היא מקבלת טקסט. היא לומדת את המושג של הפיכת קול לטקסט – דבר שכולם משתמשים בו, ובמיוחד הילדים, שחשופים אליו כבר מגיל צעיר. כל הדברים האלה קיימים כיום כמעט בכל מערכת, והילדים מתחברים לזה".
עד לאיזו רמה את מגיעה בספר?
"הספר בנוי כמו סילבוס שאני מעבירה לסטודנטים. הוא כולל מערכי מושגים שמדברים האחד עם השני – החל מהבסיס, מה זו בינה מלאכותית, דרך מושגים כמו עצי החלטה וראייה ממוחשבת, וכלה במבחן טיורינג ועוד. בסוף זה מתחבר למארג אחד גדול ושלם".
האם את מקיימת קבוצות מיקוד כדי לבדוק היתכנות?
"בוודאי. קודם כל, הילדים שלי הם קבוצת המיקוד הכי ביקורתית. אבל עשיתי גם קבוצות אחרות, של ילדים וגם של מבוגרים. לא רק זה – הזמן שעבר מרגע ההחלטה להוציא (את הספר – י"ק) ועד שהיו תוצרים היה קצר יחסית. ואז החלטתי ללכת למימון המונים, כדי לבדוק אם יש עניין בכלל. זו פלטפורמה נוחה, שבה העקרון הוא הכול או לא כלום. להפתעתי, בתוך זמן קצר הגענו ליעד, וכעת, בזמן הקלטת הראיון, אנחנו עומדים על 250%. זה כמובן נתן לי חיזוק לגבי הרלוונטיות של הספר".
באיזה פורמט הוא יצא ומתי?
"הספר יצא בכריכה קשה, פורמט של ספרי ילדים, מאויר. הוא בשלבי עריכה מתקדמים וממש בקרוב הוא כבר יצא לאור".
בין כל עיסוקייך את פעילה גם בנושא של שילוב נשים בהיי-טק ובכלל. מהי הסיבה, לדעתך, למיעוט הנשים בענף?
"הייתי חברה במשך מספר שנים במועצה לקידום נשים. כיום אני מסייעת ומרצה בתחום הזה. הסיבה למיעוט נשים מתחילה מגיל צעיר, והמצב של הפירמידה, שבו הנשים במיעוט הולך ומחמיר. אני סבורה שלבינה המלאכותית יהיה תפקיד שיוכל לסייע לשינוי המצב, כי השיח סביבה כיום הוא שהיא צריכה לייצג את כולם. זה אתגר לכל מי שעוסק בפיתוח הכלים האלה. השינוי הזה יביא לבנייה של מערכות שלמות שבהן לנשים יהיה יותר קל להשתלב".
30/07/24 15:12
8.22% of the views
מאת אנשים ומחשבים
גוגל פרסמה אתמול את גירסה 4.1 לגירסת הבטא של Android 15, שנועדה לתקן תקלות שחוו חלק מהמשתמשים בשמע במהלך שיחות טלפון במכשירי Pixel.
עדכון זה זמין כעת עבור כל הדגמים של מכשירי Pixel – החל מסידרת Pixel 8 האחרונה, ולאחור עד Pixel 6, וגם ה-Pixel Fold וה-Pixel Tablet. העדכון מתייחס בעיקר לאוסף של באגים שגרמו לבעיות שמע במהלך שיחות למי שמשתמשים בגירסת הבטא של Android 15 במכשירי Pixel.
העדכון נשלח אוטומטית למכשירי Pixel כשירים, הרשומים לתוכנית הבטא של Android.
30/07/24 16:03
8.22% of the views
מאת אנשים ומחשבים
מיכל ברוורמן בלומנשטיק, מנכ"לית מיקרוסופט ישראל מחקר ופיתוח. צילום: יוסי זליגר
מיקרוסופט ועובדיה בישראל תרמו מעל רבע מליון שקלים עבור תמיכה המשפחות האבלות ובקהילת מג'דל שמס. התרומה נאספה לאחר שהישוב נפגע במוצ"ש האחרון מפגז של חיזבאללה, אשר רצח תריסר מילדיו.
מיכל ברוורמן בלומנשטיק, מנכ"לית מיקרוסופט ישראל מחקר ופיתוח מסרה בראשית השבוע, בתגובה לאירועים המחרידים, כי: "הלב נקרע הבוקר מלראות את הילדים והנערים שנהרגו אמש במג'דל שמס מובאים למנוחות, והמוח פשוט מסרב להאמין לתמונות הקשות של ארונות קבורה קטנים. זה בלתי נתפש".
היא הוסיפה והבהירה כי "מיקרוסופט ועובדיה התגייסו ותרמו כבר כרבע מיליון שקל, שיועברו לתמיכה במשפחות האבלות ובקהילת מג'דל שמס. זו חובתנו המוסרית – הילדים התמימים האלה, שרק רצו לשחק כדורגל, הם חלק מאיתנו. המשפחות שלהם הן חלק מאיתנו. תמיד, ובעיקר היום, חשוב שנעמוד לצידן.
ואין לי ספק שעוד ארגונים ואנשים רבים מרחבי הארץ יצטרפו אלינו ויפעלו למענן".
30/07/24 17:00
8.22% of the views
מאת אנשים ומחשבים
"לכל אחת ואחד ממי שאיבדנו במלחמה היה אופי מיוחד משלו.ה, היו לו.ה שאיפות, אהבות וחלומות. מגיע להם שנזכור אותם, כל אחת ואחד מהם, בעבור מי שהם היו. הם אינם איתנו, אבל מאות חברות ישראליות ינציחו אותם, כל אחת מהן בדרכה המיוחדת. ביחד נמשיך לבנות כאן כלכלה ומדינה לתפארת. זו הסיבה שאוקטובר הבא יהיה טוב יותר, וזה שאחריו – עוד יותר טוב. זו התשובה הציונית, הלאומית, היהודית והישראלית הנכונה למי שכפו עלינו את המלחמה הזו: הם באו להרוס – אנחנו בונים עולם טוב יותר. ביחד ננצח את הכאב", כך אמר היום (ג') יזהר שי, לשעבר שר המדע והטכנולוגיה, ואביו של סמ"ר ירון (נוני) שי ז"ל, שנפל ב-7 באוקטובר.
שי הוא משקיע הון-סיכון ואיש היי-טק ותיק. הוא פתח היום את המסחר בבורסה, לצד נציגי משפחות שכולות ונציגים מחברות סטארט-אפ שבחרו להקדיש את פעילותן להנצחת יקיריהן. האירוע התקיים במסגרת ועידת ארגון Next October, שפועל להקמת חברת סטארט-אפ ישראלית חדשה לזכר כל אחד ואחת מ-1,600 הנופלים.ות במלחמה.
Next October הוקם על ידי משפחת שי לאחר נפילת הבן. בארגון אומרים כי מטרתו היא "לסייע בהמרת הכאב של השכול לאנרגיה של עשיית טוב, דרך חיבור בין חברות סטארט-אפ צעירות למשפחות נופלים". מתנדבי הארגון לומדים את האופי הייחודי של כל סטארט-אפ שמבקש להתקבל ליוזמה, ומחברים אותו למשפחה של נופל או נופלת בעל.ת קווי דמיון. כך, לדוגמה, חברה שעוסקת בטכנולוגיה לטובת ייצור יין מנציחה נופלת שאהבה יין. הסטארט-אפים מתחייבים לקיים פעילות הנצחה שתואמת את אופי הנופל.ת, והארגון מעניק להם חיבור למשקיעים, ייעוץ פרטני ואירועי העשרה – ובכך מגדיל את סיכויי החברות לצמוח ולייצר מקומות עבודה. מעל 250 סטארט-אפים כבר הצטרפו ליוזמה.
נציגי המשפחות השכולות באירוע בבורסה, היום (ג'). צילום: שחר פליישמן
בין המשתתפים באירוע היום היו נציגי המשפחות של: רס"ר (במיל') עמיחי ויצמן ז"ל – איש חינוך שמונצח על ידי NovoDia, שמפתחת כלים חינוכיים; אסף שליזנגר ז"ל, שהיה פרמדיק במסיבת הנובה ומונצח על ידי Bettear, שמפתחת כלים רפואיים בתחום השמיעה; רס"ר (במיל') מתן מאיר ז"ל, שעסק בהפקות ומונצח על ידי ישראל מדיה גרופ, שמסייעת בפיתוח מדיה; עמית מן ז"ל, פרמדיקית שנרצחה בעת מילוי תפקידה בקיבוץ בארי, שמונצחת על ידי אוורטו מדיקל, שמפתחת פתרונות מצילי חיים למניעת שבץ; אל"מ יהונתן שטיינברג ז"ל, שמונצח על ידי מינט גארד; ד"ר חגית מישקין ז"ל, שמונצחת על ידי TA'Al; סרן אייל קליין ז"ל, שמונצח על ידי אטום קונסטרקשנס; רס"ן עידו שני ז"ל, שמונצח על ידי Minovia Theraputics; רס"מ (במיל') יוסי הרשקוביץ ז"ל, שמונצח על ידי זוגית; וכאמור, משפחתו של סמ"ר ירון (נוני) שי ז"ל, שמונצח על ידי Pery.
"גם בישראל, באוקטובר הבא יהיה יותר טוב"
אופיר שי, מנכ"ל Next October ואחיו של סמ"ר שי ז"ל, אמר באירוע כי "אחרי שכבר פתחנו את המסחר בבורסות של ניו יורק ולונדון, הגענו לכאן היום כדי לסמן שגם פה, בתל אביב, בישראל, באוקטובר הבא יהיה יותר טוב. אני נמצא כאן בשם אחי הקטן, ירון, נוני. הוא נפל בקרב גיבורים בהגנה על כרם שלום, ובמותו הציל חיים רבים. נשבעתי לשאת את שמו של אחי איתי בכל מקום בגאווה, ואני שמח על כך שהדרך שלנו, כמשפחה, להנציח את זכרו ואת האור המיוחד שלו הפכה ממטרה אישית ומשפחתית למפעל הנצחה לאומי".
אימו, הילה שי, ציינה כי "השתדלתי לטעת בירון את האמונה שהאדם נולד טוב וכך היה בנעוריו. היה חשוב לי שירוני שלי ידע שלנו, כבני אדם, יש יכולת להשפיע על הטוב שמסביבנו. נעשה טוב וכמו אדוות הגלים בים, הוא ילך ויתרחב, ואז יחזור אלינו. בימים קשים אלה, Next October היא אי של שפיות, שמוכיח שצדקתי והאדם אכן טוב מנעוריו".
"פתיחת מסחר כמו זו לא הייתה בבורסה מעולם"
איתי בן זאב, מנכ"ל הבורסה, אמר כי "פתיחת מסחר כמו זו לא הייתה בבורסה מעולם, ומנעד הרגשות הוא עצום. עוד פעם עוברת המחשבה בראש: מה הגיבורים והגיבורות שנפלו עברו ומה הם עשו כדי לדאוג להווה ולעתיד יותר טוב. זוהי תחושה של גאווה וגם של מועקה, שקשה מאוד להסביר במילים. מעולם לא הייתי יותר גאה להיות ישראלי, בזכות האנשים הטובים שמרכיבים את העם הזה ושהם-הם החוסן של החברה האזרחית בישראל".
מימין: איתי בן זאב, מנכ"ל הבורסה; יזהר שי, אביו של סמ"ר ירון שי ז"ל; קרין מאיר רובינשטין, מנכ"לית ונשיאת IATI – האיגוד הישראלי לתעשיות מתקדמות; וחמי פרס, שותף מייסד של קרן פיטנגו. צילום: שחר פליישמן
קרין מאיר רובינשטין, מנכ"לית ונשיאת IATI – האיגוד הישראלי לתעשיות מתקדמות, אמרה כי האיגוד, שמאגד תחתיו מאות חברות ואת רוב קרנות הון-הסיכון שפועלות בישראל, "מחויב לחזון הזה של הצמחת 1,600 חברות חדשנות ישראליות שינציחו, כל אחת בדרכה, את הנופלים והנרצחים כפי שהמשפחות שלהם היו רוצות שנזכור אותם".
"אין ניצחון מוחלט בלי תעשיית היי-טק ממש חזקה"
לדברי עדי סופר תאני, מנכ"לית מטא ישראל, "כמישהי שנמצאת כבר עשור בתעשיית ההיי-טק אני רוצה להגיד: כולנו קמים בבוקר בתחושה שזו זכות להיות חלק מהתעשייה המדהימה הזאת. אלא שמאז ה-7 באוקטובר, העשייה למען ההיי-טק הישראלי היא לא זכות, אלא חובה. כיום, יותר מתמיד, אנחנו חייבים להיות הכי טובים שהיינו, חייבים לעבוד הכי קשה שעבדנו אי פעם. אין ניצחון מוחלט בלי תעשיית היי-טק ממש חזקה. לכל אחד מאיתנו יש צו 8 אזרחי. זו גם ההזדמנות לקרוא לכל מי שצריך להחזיר את החטופים הביתה, כדי שמדינת ישראל תוכל להשתקם".
חמי פרס, שותף מייסד של קרן הון-הסיכון פיטנגו, ציין כי "גדלתי בבית של אדם מאוד אופטימי (שמעון פרס – י"ה), וככזה אני יכול להעיד: מי שדבק באופטימיות לא עושה את זה מתוך נאיביות, אלא כי זה הכלי הכי טוב שיש לנו. אנחנו נמצאים בשנת מפנה. גם אלה שמקימים את הסטארט-אפים וגם אלה שמגנים על הגבולות בצפון ובדרום יודעים שאין ברירה, אין אלטרנטיבה. יש לנו רק אופציה אחת: להמשיך למעלה. אנחנו הולכים לעשור יוצא דופן מכל בחינה אפשרית".
עינת גז, מנכ"לית ומייסדת שותפה בפאפאיה גלובל, אמרה ש-"להיות יזם ישראלי זה לא כמות להיות יזם בכל מקום אחר בעולם. יש לנו עוד מחויבות, שהיא מעבר לעולמות הקפיטליסטיים: למצוא את הזמן לעשות טוב. רק אנחנו אחראים לרפא את כל מה שקורה מסביב".
30/07/24 18:22
8.22% of the views
מאת אנשים ומחשבים
דוד אברמוב (DJ דרוויש), אחד השמות הבולטים בסצנת הטראנס, מצטרף לוועדה המייעצת של הסטארט-אפ הישראלי וייבז (Vibez) – כך הודיעה החברה היום (ג').
וייבז פיתחה פלטפורמה טכנולוגית ליצירת קהילות סביב אירועי תרבות. אחת הקהילות הבולטות בה היא קהילת הטראנס והמוזיקה האלקטרונית, שעלתה לכותרות בעקבות הטבח שאירע במסיבת הנובה, שבו נרצח גם בנו של דרוויש, לאור.
המערכת של וייבז מבצעת רישום ומכירת כרטיסים, ומעודדת מעורבות של משתתפי האירוע והפיכתם לקהילה שמחוברת סביב ההעדפות המוזיקליות והתרבותיות של חבריה. הפלטפורמה יוצרת סינרגיה בין חברי הקהילה למכירת הכרטיסים, מכירת מוצרים בזמן האירוע, בקרת כניסות, ושמירה על קשר רציף והמשכי בין חברי הקהילה.
"אני משוכנע שתרומתו של דרוויש כחבר בוועדה המייעצת שלנו תסייע לנו להפוך לסטארט-אפ המוביל ביצירת קהילות אירועים בארץ ובחו"ל", אמר סער דובב, מנכ"ל ומייסד וייבז.
"כמוזיקאי ומפיק אני מכיר את הצורך והחשיבות שבהיכרות מעמיקה עם הקהל שלי, ובשמירה על קשר רציף ומשמעותי איתו", ציין דרוויש. "בחרתי להצטרף ל-וייבז כדי לסייע ביצירת קהילות מוזיקה מגובשות, שמחזקות את תחושת השייכות והחיבור של חבריהן, תחת הערכים המשותפים שמקשרים ומאחדים ביניהם".
30/07/24 10:00
6.85% of the views
מאת אנשים ומחשבים
משטרת ישראל תצייד את כל כיתות הכוננות בארץ במערכת קשר מבוססת תשתית סלולר.
YTCOM תספק 6,000 מכשירי קשר מסוג "Easy Talk" שלה לכיתות הכוננות ובחודשים הקרובים יתווספו עוד אלפי מכשירים. המכשירים יחוברו ברשת אחת עם המגיבים הראשונים וכוחות ההצלה, לטובת מימוש טוב יותר בהבטי פיקוד ושליטה במצבי חירום. החברה זכתה במכרז החשב הכללי באוצר לספק שירותי תקשורת סלולר בישראל, והיא עושה זאת יחד עם סלקום כספקית סלולר תומכת.
פריסת מכשירי הקשר היא חלק מהחלטת המשרד לביטחון פנים להרחיב את מערך כיתות הכוננות של משטרת ישראל לכל המרחב העירוני ברחבי הארץ, תוך הקמת מאות כיתות כוננות, שיוכפפו למפקדי המשטרה בכל מקום.
במסגרת זו, תתקבל גם יכולת תעדוף ברשת, QOS, שתאפשר לגופי הביטחון והחירום לקבל תקשורת רציפה על גבי תשתית הסלולר. מתן העדיפות ברשת הסלולר של סלקום נעשה על בסיס סים מיוחד של החברה, המוגדר לקבל עדיפות זו. באירועי חירום ובאירועים המוניים, כאשר רשת הסלולר לא מספקת שירותים לאזרחים "רגילים" – יוכלו כוחות ההצלה עם הסים המיוחד להמשיך ולקיים תקשורת PTT ולהעביר נתונים נוספים בין הכוחות והמפקדות.
"Easy Talk" היא מערכת רשת קשר ארצית חכמה, המבוססת על תשתית רשת סלולרית או דיגיטלית. היא כוללת בתוכה כמה שירותים חכמים, בהם: קשר מהיר – PTT, על גבי מכשירי סלולר חכמים או מוקשחים, המוגנים מפני התפוצצות; שידור מצוקה חכם למערכת Dispatch (מערכת הפועלת כעמדת שליטה ראשית לכל מכשירי הקשר של הארגון); אפליקציות מיקום, העברת הודעות וקבצים למנוי או לקבוצה; כיסוי ארצי ועולמי, יכולת חיבור והתממשקות בין מערכות קשר אנלוגיות, דיגיטליות (DMR) וסלולריות (POC); וכן – שמירה ואיסוף נתונים ממכשירי הקצה.
גבי שמלו, מנכ"ל קבוצת YTCOM, אמר, כי "במסגרת הרחבת מערך כיתות הכוננות לכל רחבי הארץ, ייעשה שילוב של אלפי מתנדבים יחד עם כוחות הביטחון בהתמודדות עם האתגרים הביטחוניים העומדים בפני ישראל. המערכת של YTCOM תאפשר לכוחות האזרחיים ולכוחות הביטחון וההצלה לעבוד יחדיו בהרמוניה מלאה בחירום ובשגרה, תשפר את מהירות התגובה והפעילות בשטח ובכך תתרום להצלת חיי אדם".
30/07/24 17:18
6.85% of the views
מאת אנשים ומחשבים
חברת אבטחת המידע והסייבר סייברארק מלווה את הג'ודאית (כך כותבים בעברית, לפי ד"ר אבשלום קור) גילי שריר מאז 2021, ונותנת לה חסות גם כיום, באולימפיאדה. אלא שלמרבה הצער, בעוד שבאולימפיאדה הקודמת, בטוקיו, היא הייתה חלק מהמדליה הקבוצתית שקיבלה נבחרת הג'ודו של ישראל, הפעם, בפריז, היא בינתיים לא עושה חיל (וגם לא הנבחרת): שריר הפסידה היום (ג') בסיבוב הראשון לאלופה האולימפית הצרפתית קלריס אגבניינו, אם כי היא נתנה לה פייט ולא ויתרה לאורך דקות ארוכות. יש לקוות שנבחרת הג'ודו הישראלית, יחד איתה, תיתן הופעה טובה בתחרות הקבוצתית, שתתקיים ב-3 באוגוסט, ותביא לנו מדליה.
עובדי סייברארק בישראל עצרו היום את עבודתם ואת נשימתם לשעה קלה כדי לצפות יחד בקרב של שריר מול אגבניינו. התחרות שודרה על מסך ענק במשרדי החברה בפתח תקווה, אך גם אלפי עובדי החברה ברחבי העולם ידעו על התחרות והחזיקו אצבעות.
ב-2021 הובילה שריר קמפיין גיוס עובדים של סייברארק, שבמסגרתו הבטיחה החברה, וקיימה, שהיא תצעד איתה עד למדליה האולימפית הבאה, ותלווה אותה כדי שתמשיך להתפתח ולצמוח. שריר אמרה אז כי "סייברארק היו הראשונים שהאמינו בי, ומבחינתי הם כמו משפחה".
"אנחנו גאים לתמוך בספורטאית מוכשרת כמו גילי שריר, שכבר הוכיחה את עצמה באולימפיאדה הקודמת ובאינספור תחרויות, ולסייע לספורטאים ישראלים באולימפיאדת פריז, שחווים שם אתגרים לא פשוטים נוכח המצב", אמרה גילי שילוני, מנהלת משאבי האנוש של סייברארק בישראל. "מאז תחילת הקשר, ביוני 2021, כולנו, בסייברארק ישראל, עוקבים אחר כל מהלך שלה, כפי שעשינו בהתרגשות גם היום".
30/07/24 09:31
5.48% of the views
מאת אנשים ומחשבים
לאחרונה מצאתי את עצמי מתמודד עם אתגר מורכב; במסגרת עבודה על כלי ה-Copilot שפיתחתי באלמנטור, המנחש בעזרת בינה מלאכותית איזה מקטע עיצובי כדאי להכניס לדף, עלה אצלי הצורך להבין באיזה תחום עסקי האתר עוסק, במיוחד כשהאתר חדש ולא מוכר. במהלך הניסיון לפתור את הבעיה הבנתי, שמדובר בבעיה שחברות רבות מתמודדות איתה, במיוחד כאשר עולם האינטרנט פורח ומדי יום נוצרים כ-1.4 מיליון אתרים עסקיים חדשים, ורק בשנת 2023 נוצרו יותר מ-200 מיליון אתרי אינטרנט חדשים.
המטרה: זיהוי תחום עסקי
הרעיון היה לבחון האם יש קשר בין תחום עסקי שבו האתר עוסק לבין הצלחת ה ה-Copilot. האם ישנם תחומים שבהם הוא עובד טוב יותר לעומת תחומים בהם יש מקום לשיפור? הגישה הפשוטה היא לסווג את האתר לפי הדומיין שלו, לדוגמה, ynet.co.il כשייך לעסקי החדשות או facebook.com כשייך לרשתות החברתיות.
הבעיות עם הספקים הקיימים
ראשית, ישנה בעיה של חוסר מידע, כאשר ספקי המידע בדרך כלל יודעים לסווג דומיינים פופולריים או ותיקים, אבל על דומיינים חדשים המידע מוגבל. שנית, הקטגוריות כלליות והסיווגים של ספקי המידע הם ברמות עליונות בלבד. לדוגמה, אתר של רופא שיניים ואתר של קופת חולים יסווגו שניהם תחת קטגוריית "רפואה".
הפתרון: Embeddings
כדי להתמודד עם האתגר הזה, פיתחתי שיטה חדשה לאיתור הקטגוריה העסקית של אתר – בעזרת Embeddings. למי שלא מכיר, מודל Embeddings מקבל טקסט ומחזיר וקטור עם מספרים שמייצגים את המשמעות של הטקסט. לדוגמה, הייצוג של המילה "רפואה" עשוי להיות [4,4,4] ואילו "חדשות" [8,8,8]. אם נבקש את הייצוג של "מרפאת עיניים" ונקבל [4,4,5] שדומה לייצוג של "רפואה" – נוכל להבין שמדובר בתחום הרפואה.
במקום להשתמש בדומיין עצמו, הצעתי להשתמש בכותרת האתר ובתיאור האתר. בעזרת AI הגדרתי רשימה של קטגוריות עסקיות מובילות, וכל הצעה שה-Copilot מייצר מסווגת לקטגוריה העסקית שהכי קשורה לכותרת ולתיאור האתר. התהליך כולל שני שלבים: בשלב הראשון – יצירת טבלה עם עמודת הקטגוריה ועמודת הייצוג המספרי. בשלב השני – יצרתי רכיב שמבצע: שליפה של כותרת ותיאור האתר מתוך ה-HTML שלו, בקשה של הייצוג ממודל Embeddings, השוואה מול הייצוגים של הקטגוריות שהוגדרו ורישום הקטגוריה הכי קרובה לצד ההצעה הנוכחית של Copilot.
היתרונות:
עלות נמוכה: העלות של מודל Embeddings זולה מאוד בהשוואה לספקי נתונים.
תמיכה בדומיינים חדשים ואתרים ללא דומיין: השיטה מבוססת על כותרת האתר והתיאור שלו, ולא על הדומיין, התנועה והלינקים לאתר.
סיווג מותאם אישית: ניתן להגדיר קטגוריות ספציפיות לפי הצורך.
קטגוריות מרובות: אפשר לסווג לתחומים מרובים שמתאימים לאותו אתר.
"הכלי שפותח מציג תוצאות מדויקות וטובות יותר בהשוואה לספקי הנתונים הקיימים ופותח אפשרויות נוספות לשימוש בבינה מלאכותית בזיהוי תחומים עסקיים של אתרים"
המגבלות:
כותרות לא ברורות: לא כל האתרים כוללים כותרת שממנה אפשר להבין את המשמעות הקטגורית.
סיכון זיהוי כ-בוט: יש לעבוד נכון מבחינת זיהוי ה-IP כ-בוט שסורק אתרים.
שפות שונות: מודל Embeddings גדול יכול ליצור הבדל בין שפות שונות, לדוגמה, "עורך דין" בעברית רחוק מעט מהמילה "Lawyer" באנגלית, וכדי לקרב ביניהם, צריך להשתמש במודל קטן יותר, שנותן פחות משמעות להבדל בין השפות, ומצד שני מאבד עוד אבחנות במשמעות הטקסט. אי לכך, צריך לבחון לפי הצורך הספיציפי באיזה מודל להשתמש.
הסתמכות על תוכן האתר: ספקי המידע הקיימים מנתחים, בין השאר, תנועה וקשרים בין אתרים, שזה מידע אובייקטיבי יותר, בעוד שסיווג על פי התוכן של יוצר האתר נותן משקל יתר למדד סובייקטיבי.
מה יצא בפועל
לאחר הרצה של שבועיים בלבד התחלנו לראות סימנים מובהקים לקטגוריות עסקיות שהמוצר עובד עבורם בצורה טובה יותר לעומת קטגוריות עסקיות שהמוצר מתאים פחות, ובהתאם יכולנו לתכנן את המשך פיתוח המוצר באופן מיטבי לקטגוריות העסקיות השונות.
לסיכום, בשיטה של Embeddings, במקום להסתמך על דומיינים ותיקים בלבד, ניתן להשתמש בכותרות ותיאורי אתרים כדי לסווג את התחום העסקי של האתר בצורה מדויקת ומותאמת אישית. היתרונות כוללים עלות נמוכה, תמיכה בדומיינים חדשים ויכולת לסווג קטגוריות מרובות ומדויקות יותר. עם זאת, ישנן גם מגבלות שיש לקחת בחשבון. הכלי שפותח מציג תוצאות מדויקות וטובות יותר בהשוואה לספקי הנתונים הקיימים ופותח אפשרויות נוספות לשימוש בבינה מלאכותית בזיהוי תחומים עסקיים של אתרים.
הכותב הוא מהנדס AI בכיר באלמנטור.