קול קורא להגשת הצעות לפיתוח כלי תוכנה להסברתיות, שימור פרטיות ולמידה מבוזרת בתחום עיבוד שפה טבעית (NLP) בעברית ו/ או ערבית מדוברת ישראלית

קרןמשרד המדע והטכנולוגיה
מדינהIsrael
סוגResearch Grants
תאריך אחרון29/09/2022
פקולטהEngineering, Exact Sciences, Humanities
תיאור

משרד החדשנות, המדע והטכנולוגיה ושותפים לתוכנית הלאומית לבניית תשתיות מחקר ופיתוח בתחום עיבוד שפה טבעית מבקשים לקבל הצעות במסגרת קול קורא זה עוסק במחקר, ניתוחים, ובפיתוח של כלים ושיטות להסברתיות, שימור פרטיות ולמידה מבוזרת ביישומי NLP, כמפורט להלן.

קול קורא זה מעודד פיתוחים שמתמקדים בשפה העברית ובערבית הדבורה בישראל, כגון שיטות, כלים או מאגרים המיוחדים לשפות אלו.

 

  • מיקוד נושאים
  1. תת תחום הסברתיות: הקול קורא להצעות למחקר, ניתוחים, או פיתוח כלים או שיטות או מאגרים בכל תחומי ההסברתיות של NLP במובנה הרחב, כולל interpretability, explainability ו-transparency. בכלל זה נכללים ניתוח ידע בתכולת שפה (analysis of linguistic knowledge), מתן הסברים לחיזויים של מערכות פירוש וניתוח (explaining predictions), פירוש וניתוח מודלי שפה, יכולותיהם והמידע המקודד בהם, הן בהיבט התנהגותם (behavioral analysis) והן בהיבט הבנה הפנימי שלהם (structural analysis); אבחון נקודות חולשה של מערכות עיבוד שפה, למשל ע"י פיתוח של בסיסי נתונים מאתגרים (stress-testing models via challenge sets), וזיהוי התקפות עוינות והתגוננות מפניהן (adversarial attacks and defences).
    קול קורא זה מעודד, במידת האפשר, פיתוחים של כלי הסברתיות אשר ניתנים לשימוש במסגרת מערכת מורכבת בה חלק מהרכיבים נתונים כקופסאות שחורות. כלומר, מצב בו לא ניתן לדרוש אימון מחדש של אותם רכיבים אלגוריתמיים לטובת יישום כלי ההסברתיות. כדוגמה, תמיכה בהסברתיות עבור מערכת אשר עושה שימוש בשירות ענן מצד שלישי.
  2. תת תחום שימור פרטיות בתחום למידת מכונה: הקול קורא להצעות למחקר, ניתוחים, או פיתוח כלים או שיטות למימוש יישומים ללמידת מכונה ושיתוף מידע רגיש מבלי להתפשר על הגנה על פרטיות המידע (Privacy Preserving Machine Learning). בתת תחום זה ישנה עדיפות, אבל לא לא נדרש, להגביל את ההצעות לעולם עיבוד השפה.
  3. תת תחום למידה מבוזרת: הקול קורא להצעות למחקר, ניתוחים, או פיתוח כלים או שיטות למימוש יישומים לביצוע למידת מכונה בצורה מבוזרת ושילוב התוצרים לכדי מודל אחד בסוף תהליך (Federated Learning). למידה מבוזרת גם יכולה לשמש ככלי לשימור פרטיות, אבל יש לה תועלות נוספות – למשל כאשר עלויות התקשורת בין הקצה למרכז גדולות, כאשר יש סוגיות של קניין רוחני וכו'. בתת תחום זה ישנה עדיפות, אבל לא נדרש להגביל את ההצעות לעולם עיבוד השפה.

 

מימון: 300,000 ש"ח סה"כ

תקופה: 2 שנים 

 

מועד ההגשה לרשות המחקר זהה למועד ההגשה למשרד. 

 

 

 

שימו לב!

חוקר ראשי שיש לו מענק מחקר פעיל הממומן על ידי המשרד במסלול הלאומי בשנת 2023 או הצעה מקול קורא הלאומי משנת 2022 שעברה שלב א' ובמסגרתו הגישו או יגישו הצעה מלאה, לא יהיה רשאי להגיש בקשה במסגרת קול קורא זה

קבצים מצורפים
קישורלאתר
עדכון אחרוןעדכון אחרון: 30/08/2022
אוניברסיטת תל אביב עושה כל מאמץ לכבד זכויות יוצרים. אם בבעלותך זכויות יוצרים בתכנים שנמצאים פה ו/או השימוש
שנעשה בתכנים אלה לדעתך מפר זכויות, נא לפנות בהקדם לכתובת שכאן >>