קורפוס (ברבים: corpora) מתייחס לאוסף גדול ומובנה של טקסטים או דוגמאות דיבור, שנאספו באופן שיטתי לצורך מחקר לשוני, הדרכה או ניתוח בעיבוד שפה טבעית (NLP) ובלשנות חישובית. על ידי מתן דוגמאות מהעולם האמיתי לשימוש בשפה, הקורפוסים מספקים נתונים חשובים לחוקרים ולעוסקים בבינה מלאכותית לחקור דפוסים, תדרים ווריאציות לשוניות. הם יכולים לנוע מאוספים גנריים של טקסטים, הכוללים ז'אנרים וסגנונות מגוונים, ועד לאלו מיוחדים המתמקדים בשפות, תחומים או נושאים ספציפיים.
בתחום הבינה המלאכותית, קורפוסים ממלאים תפקיד חיוני, במיוחד בתרחישי למידה מפוקחים. מודלים של למידת מכונה ו-NLP מסתמכים לעתים קרובות על קורפוסים מוערים, שבהם טקסטים מתויגים עם מידע לשוני ספציפי, כגון תוויות חלקי דיבור, עצים תחביריים או תפקידים סמנטיים. מערכי נתונים מוערים אלה מאפשרים למודלים ללמוד מדוגמאות מהעולם האמיתי ולאחר מכן לחזות או ליצור דפוסים לשוניים דומים על נתונים חדשים שלא נראים. כבסיס לרוב המודלים הלשוניים, האיכות, הגיוון והגודל של הקורפוס משפיעים ישירות על האפקטיביות וההכללה של מערכות בינה מלאכותית.