Request for Proposals: AI Interpretability

קרןSchmidt Sciences
מדינהU.S.A.
סוגResearch Grants
תאריך אחרון26/05/2026
פקולטהEngineering, Exact Sciences, Humanities, Social Sciences
תיאור

Schmidt Sciences invites proposals for a pilot program in AI interpretability. This RFP seeks new methods for detecting and mitigating deceptive behaviors from AI models, such as when models knowingly give misleading or harmful advice to users.

This RFP focuses on three directions:

  1. Detecting deceptive behaviors from LLMs
  2. Steering models to improve truthfulness
  3. Applications of detection/ steering methods
 
 
Funding: $300,000 to $1,000,000 total 
Duration: 1-3 years
 
 
 
Research Authority due date: 19.5.26
 

 

קבצים מצורפים
קישורלאתר
עדכון אחרוןעדכון אחרון: 25/03/2026
אוניברסיטת תל אביב עושה כל מאמץ לכבד זכויות יוצרים. אם בבעלותך זכויות יוצרים בתכנים שנמצאים פה ו/או השימוש
שנעשה בתכנים אלה לדעתך מפר זכויות יש לפנות למערכת הפניות >>