Clustering הוא סוג של טכניקת למידת מכונה ללא פיקוח שמטרתה לפלח מערך נתונים הטרוגני למספר קבוצות או "אשכולות" כך שנקודות נתונים באותה קבוצה דומות יותר זו לזו מאשר בקבוצות אחרות. המטרה היא לגלות קבוצות מובנות בתוך הנתונים ללא הדרכה של תוויות מפורשות. טכניקה זו משמשת לעתים קרובות כדי למצוא דפוסים או מבנים בתוך נתונים ללא תווית, מה שהופך אותה לבעלת ערך במיוחד בניתוח נתונים חקרניים, פילוח שוק וזיהוי אנומליות.
קיימים מספר אלגוריתמי אשכולות, כל אחד עם המתודולוגיה ומקרי השימוש שלו. שיטות פופולריות כוללות K-means, אשכול היררכי ו-DBSCAN. לדוגמה, K-פירושו אשכול מחיצות את הנתונים למספר 'K' של אשכולות על ידי מזעור השונות בתוך אשכול. בעוד שצרור יכול לספק תובנות חשובות לגבי הפצת נתונים ודפוסים, קביעת המספר האופטימלי של אשכולות או האלגוריתם המתאים ביותר עבור מערך נתונים מסוים יכולה להיות מאתגרת, ומחייבת טכניקות כמו שיטת המרפק או ניתוח צללית כדי לסייע בקבלת החלטות.