ביאור לשוני (Linguistic annotation) הוא תהליך של הוספת מטא-מידע למערך טקסט או דיבור, המספק תובנות מעמיקות יותר לגבי המאפיינים הלשוניים שלו. זה כולל תיוג של אלמנטים או קטעים ספציפיים עם תוויות תיאוריות המייצגות מאפיינים לשוניים שונים כגון חלקי דיבור, מבנים תחביריים, תפקידים סמנטיים או מרכיבי שיח. ביאור לשוני משמש כגשר בין נתוני שפה גולמיים למידע המובנה שמערכות חישוביות, במיוחד אלו בתחום הבינה המלאכותית, יכולות לעבד ולנתח בקלות.
בהקשר של AI ועיבוד שפה טבעית (NLP), הערות לשוניות חשובות לאין ערוך. הם מציעים תצוגה מובנית של שפה, המאפשרת לאלגוריתמים להבין וליצור טקסט דמוי אדם בצורה יעילה יותר. קורפוסים עם הערות ידני הופכים לסטנדרטים זהב, ומשמשים כמערכי נתונים להדרכה עבור מודלים של למידה מפוקחת במשימות כמו זיהוי ישויות בשם, ניתוח סנטימנטים ותרגום מכונה. ככל שמערכות AI משתכללות יותר ויותר, העומק והפירוט של ההערות הלשוניות מתרחבים, מה שמאפשר ללכוד היבטים ניואנסים יותר של השפה ולהניע התקדמות במחקר ויישומי NLP.