בבינה מלאכותית, במיוחד בלמידת חיזוק, מרחב הפעולה מייצג את כל הפעולות האפשריות שסוכן יכול לבצע בסביבה נתונה. הוא משרטט את האפשרויות האפשריות העומדות לרשות הסוכן בכל נקודת זמן. בהתאם לבעיה, מרחב הפעולה יכול להיות דיסקרטי, שבו יש מספר סופי של פעולות אפשריות, או מתמשך, שבו פעולות יכולות לקבל כל ערך בגבולות מסוימים.
הבנת מרחב הפעולה היא קריטית מכיוון שבחירת הפעולות משפיעה ישירות על ביצועי הסוכן בהשגת מטרותיו. לדוגמה, במשחק שבו סוכן AI יכול לנוע בארבעה כיוונים, מרחב הפעולה מורכב מארבעת המהלכים הללו. בתרחישים מורכבים יותר, כמו שליטה בתנועת רובוט, מרחב הפעולה עשוי להיות רציף, עם אינסוף פעולות אפשריות המתאימות לדרגות שונות של תנועה. הגדרה נכונה וניווט של מרחב הפעולה הוא המפתח להכשרת סוכני AI יעילים.