חיפוש

אלגוריתם ההמלצות של ספוטיפיי

עודכן: 10 ביולי


אלגוריתם ההמלצות של ספוטיפיי כמודל לאסטרטגיה שיווקית - חלק 1

 

ספוטיפיי היא כיום שירות הסטרימינג המוביל בעולם. היא עושה שימוש במאגר נתונים עצום ואלגוריתמים חכמים כדי ללמוד הרגלי האזנה, לאתר ולהמליץ למאזינים על מוזיקה שמתאימה להם ולספק את חוויית ההאזנה למוזיקה הטובה ביותר שאפשר.


מאחורי שיטות הפעולה והמבנה של הפלטפורמה עומדים מודלים עסקיים ומתודות שיווק המאפשרים לה להיות חברה מסחרית מצליחה. במאמר זה אסקור לרוחב ולעומק את ספוטיפיי, הצורה שבה היא עובדת, ההשפעות שלה על תעשיית המוזיקה ואיך היא מצליחה להביא לכם את השיר הבא שיתקע לכם בראש.


 

פתיחה


אלגוריתם ההמלצות של ספוטיפיי הוא אלגוריתם המוטמע בתוך הפלטפורמה, ומנתח מידע מסוגים שונים - כזה הקשור בפעילות המשתמש ובאינטראקציה שלו עם הפלטפורמה, במוזיקה שהוא מאזין לה, בטרנדים מקומיים או גלובליים ובפרמטרי מאקרו נוספים (המשפיעים על פעולת האלגוריתם לכלל המשתמשים, ולא רק למשתמש יחיד).


חשוב לציין - בפועל הפלטפורמה משתמשת במספר רב של אלגוריתמים, כל אחד ותפקידו, כדי ליצור מערכת יעילה וקוהרנטית. במאמר זה אני אשתמש במילה אלגוריתם ככינוי כולל לכל המערכת הזו, ואסקור אותה ברובו כיחידה אחת, למען הנוחות.


אין לי רקע באלגוריתמיקה או תכנות, ואני גם לא עובד בספוטיפיי. לכן אני לא מתיימר לתאר בצורה מדויקת את פעולת האלגוריתם, אלא רק את הרעיון והמודל התכנוני שעל פיו הוא עובד. קיימים כמובן הבדלים ברמת התוכנה בין התיאור כאן למציאות בשטח, בעיקר בגלל שינויים ושיפורים שמתרחשים כל הזמן במערכות של ספוטיפיי, אך כמו שאמרתי - מטרת המאמר היא לתאר את המבנה ושיטות הפעולה העקרוניות.


על פני השטח, תפקידו של האלגוריתם להמליץ למשתמש על מוזיקה שיכולה להתאים לטעם ולהעדפות שלו, ולחשוף אותו לתוכן שיתאים לו. בפועל - האלגוריתם משמש במקביל למטרה זו ככלי שיווקי לכל דבר. במאמר זה אסקור לעומק את המבנה וצורת הפעולה של האלגוריתם ואנסה לתאר את המודל השיווקי-עסקי, המטרות והרווח שספוטיפיי משיגה דרך פעולת האלגוריתם.


איך עובד האלגוריתם של ספוטיפיי

מטרתו הישירה של האלגוריתם היא להמליץ למשתמש על מוזיקה שהוא עוד לא מכיר ויכול לאהוב. מטרה זו משרתת את מטרת העל של הפלטפורמה - להשאיר את המשתמש מחובר כמה שיותר. האלגוריתם (ובכלל הפלטפורמה) עושה שימוש בכל מידע קיים וכל פעילות שהמשתמש מבצע בתוכנה, הכל מנוטר ושום דבר לא הולך לאיבוד.


אלגוריתם ההמלצות פועל בשני כיוונים המשלימים אחד את השני:

  1. להכיר את המוזיקה הקיימת, האמנים הקיימים, ומה שהמשתמש כבר אוהב. זה הבסיס לדעת למה הוא מתחבר ולמה הוא מאזין.

  2. להכיר מוזיקה חדשה של אמנים חדשים, לעקוב אחרי טרנדים ולדעת ליצור קישורים מאפס על מנת לקשור מידע חדש ושירים חדשים לבסיס הנתונים וניתוח המידע הקיים.


שני כיווני הפעולה האלו מכונים Exploit וExplore, בהתאמה. הסתכלות פנימה של ניתוח מה שכבר יש לנו, והסתכלות החוצה כדי לראות מה מגיע, מה יכול להתחבר ומה עובד כרגע בשוק. במסמך של ספוטיפיי משנת 2018 מתארים את זה כך: Exploitation, כלומר ניצול או נצילות, מאפשרת המלצות תוכן שבסבירות גבוהה יצור מעורבות מצד המשתמש. Exploration, כלומר גילוי, מפיק המלצות עם סבירות לא ידועה של 'הצלחה', למטרת איסוף מידע.


נקודה חשובה בExplore ששווה לשים אליה לב, היא שהאלגוריתם נדרש לעבוד בצורה שתוכל לתייג ולהכניס למערכות גם שיר ראשון של אמן חדש, שלכאורה אין עליו שום מידע ושום אינטראקציה. ספוטיפיי נדרשת להגיע לכל השירים ולכל שאר האייטמים בפלטפורמה מיום אפס, כדי לא ליצור מצב של ריק או שטח אפור שעלול לגדול עם הזמן ולהשאיר שטחים שלמים שהאלגוריתם מתעלם מהם.


בנוסף, האלגוריתם צריך לדעת להתמודד עם טרנדים ושינויי סגנונות במיינסטרים, שבעולם שלנו מתרחשים בקצב הולך וגובר. סרטון אחד בטיקטוק מסוגל להקפיץ פופולריות של שיר במאות אחוזים ולגרום לו לנסוק תוך זמן קצר מאוד, כמו שקרה לא מזמן עם השיר Infinity של Jaymes Young.

אז איך זה עובד? בואו נצלול פנימה.


איסוף מידע וניתוח נתונים

איסוף וניתוח המידע מתבצע בכמה ערוצים מרכזיים:


1. התנהגות משתמש

תחת כותרת זו נכללות כל הפעולות שמשתמש עושה בספוטיפיי - שמירות שירים, יצירת פלייליסטים פרטיים או ציבוריים, אמנים שהוא עוקב אחריהם, משך הזמן שהוא מאזין לאמן או לשיר כזה או אחר, השמעות בלופים או בינג' של שיר או אלבום, או כל פעולה אחרת שמבטאת אינטראקציה של המשתמש עם הפלטפורמה. אני אתייחס לפעולות כאלו בהמשך כפעולות ברמת המיקרו - המשתמש הבודד, שמשפיעות עליו ועליו בלבד (למשל דרך פלייליסטים מותאמים אישית כמו Discover Weekly)


2. קישורים פנימיים בין אובייקטים

קיימת רשת קישורים אחורית בין כל הדברים בספוטיפיי. כל אובייקט שיש לו יחס או קשר לאובייקט אחר יוצר לינק פנימי ברמת האלגוריתם בין האובייקטים. למשל שני אמנים ששיתפו פעולה על שיר, שירים שנמצאים יחד באותו פלייליסט, או אדם שעוקב אחרי שני אמנים שונים, או שמר אלבומים כאלו ואחרים.


לספוטיפיי יש גישה לכל המידע הזה, והיא מנצלת אותו לחיזוק והצגת הקשרים האלה בפלטפורמה (למשל "אמנים דומים" בעמוד אמן) או לשיפור וייעול פעולת האלגוריתם, שיכול לקשר בין אמנים, אלבומים, שירים ועוד. רשת המידע הזו מהווה את הבסיס לפעולת האלגוריתם כשהוא בא להמליץ על שירים חדשים.


האלגוריתם מנצל את הקישורים האלו כדי למצוא, לדוגמה, אמן חדש שעוד לא שמעתי אבל יש לו זיקה חזקה לארבעה אמנים שאני אוהב מאוד. אני אתייחס לרשת הקשרים הזו בתור רמת המאקרו של האלגוריתם, שכן היא מכסה את הפלטפורמה כולה ויש לה השפעה על כל המשתמשים.


3. ניתוח המוזיקה

ספוטיפיי מנתחת לא רק קשרים בין אובייקטים או את הרגלי ההאזנה שלנו. הרי שני אמנים מאוד קרובים יכולים להיות שונים בחתימה המוזיקלית שלהם, ועדיין יהיה להם קהל דומה.

על מנת למקסם את יכולת הזיהוי והתיוג של מוזיקה דומה, ולהגיע לאחוזי הדיוק הגבוהים ביותר בנוגע לאיזו מוזיקה ניצבת על הכף, הפלטפורמה מנתחת את המוזיקה עצמה במספר דרכים.


הדברים הקלים יותר לניתוח הם הדינמיקה, הגוון הכללי של השיר והמבנה שלו, ועוד מספר פרמטרים שכל אדם בעל רקע בסאונד יוכל להסביר בקלות, ויכולים להיות מנותחים אפילו על ידי כלים קיימים ומוכרים (מדידת מד דציבלים, איקוולייזר ועוד). ניתוחים כאלו יכולים לתת לנו מושג כללי טוב על הכיוון של השיר, ז'אנר (בהגדרה הרחבה של המילה) ולפעמים גם לגלות מאפיין ייחודי לתת סגנון מסוים.


מעבר לזה, אלגוריתמי הניתוח מסוגלים לזהות מרכיבים ספציפיים בשיר, כמו גיטרות חשמליות או רעיונות אבסטרקטיים יותר, והם מנתחים גם את המילים של השיר - כלומר אם האזנת ברצף לשירים בנושא אובדן, האלגוריתם יכיר בזה ויציע לך שירים נוספים בנושא. כאן כדאי לציין ששיתוף הפעולה של ספוטיפיי עם ענקית המילים לשירים Musixmatch עזר לה רבות בהקשר הזה, שכן מעבר להפיכת ספוטיפיי למותאמת קריוקי (סנכרון מילים לשיר בזמן אמת), הוא נתן לה גישה למאגר מילים לשירים מהגדולים בעולם.


4. נתונים נוספים

ספוטיפיי עושה שימוש בנתונים רבים נוספים מעבר לניתוח הפלטפורמה עצמה. בין הנתונים האלו נכללים גיל ומיקום המשתמשים, שיכולים לעזור לפילוח דמוגרפי וגיאוגרפי מדויק יותר של מאזינים לז'אנרים ואמנים שונים. הנתונים האלו גם מוצגים לכל אמן בפילוח המאזינים שלו, ונתון המיקום גם משמש ללוקליזציה של חלק מהתכנים בפלטפורמה. בנוסף, המידע הזה מאפשר להתאים תכנים למשתמשים כמו חשיפה לאמנים מקומיים או המלצות שירים מבוססות שכבת גיל.


החברה גם מנצלת מידע שמגיע מרחבי הרשת. לדוגמה, בשנת 2014 ספוטיפיי רכשה את חברת EchoNest, שבין השאר סורקת את הרשת במטרה לאתר ולנתח טקסט שקשור במוזיקה. כתוצאה מכך, לספוטיפיי יש גישה לא רק לבלוגים ולמגזינים העוסקים במוזיקה, אלא גם למידע הנכתב ברשת על ידי אנשים פרטיים. או כמו שכתב בריאן וויטמן (הCFO של אקו נסט) במאמר שלו: "כל מילה שמישהו כותב באינטרנט על מוזיקה עוברת דרך המערכות שלנו".


יכול להיות - אך לא מצאתי הוכחה לכך - שספוטיפיי יכולה גם לקבל ולאסוף עוד מידע אישי דרך אינטגרציה עם מוצרים של חברות כמו מטא וגוגל (למשל בהתחברות עם משתמש פייסבוק או גוגל קיים). למידע נוסף בנושא, ותוכנות צד שלישי נוספות שספוטיפיי עושה בהן שימוש, הרשימה המלאה קיימת באפליקציה>הגדרות>תוכנה של צד שלישי.


חוק שלושים השניות (ומילה על סקיפ רייט)

זמן ההאזנה לשיר הוא הנתון הראשון שמסתכלים עליו כשנשאלת השאלה האם המאזינים אהבו את השיר או לא, וחוק שלושים השניות הוא הכינוי המקובל לסף שממנו ספוטיפיי סופרת השמעה של שיר. מבחינת האלגוריתם זה גם המדד להמלצה מוצלחת, או במילים פשוטות: המשכת להאזין אחרי 30 שניות - אהבת את השיר. דילגת בתוך משך הזמן הזה - לא אהבת את השיר, והוא ייחשב להמלצה לא מוצלחת.


דילוג על שיר בחצי הדקה הראשונה בפלייליסט Discover Weekly למשל, שהוא הגביע הקדוש של המלצות המוזיקה בפלטפורמה, שווה לסימון דיסלייק על השיר והאמן בפני האלגוריתם - כך על פי Matthew Ogle, מנהל מוצר בספוטיפיי שנשאל על הנושא בראיון בשנת 2015.


הדילוגים על שירים נספרים ומתויקים כמידע המשפיע על השירים והאמנים העומדים מאחוריהם. שיר שדילגו עליו יותר פעמים, או תוך זמן קצר (לדוגמה אחרי חמש שניות), יקודם פחות על ידי האלגוריתם בהשוואה לשיר שדילגו עליו פחות או נתנו לו צ'אנס ארוך יותר. המידע הזה נקרא Skip Rate ומחושב כאחוזי דילוג פר שיר.


ההתחשבות בשני הגורמים המכריעים האלו - סקיפ רייט וקו שלושים השניות - גרמה לתעשייה לחשב מסלול מחדש מאז כניסת הסטרימינג לחיינו, וכיום אמנים מובילים כמו גם מפיקים רבים עושים מאמץ 'לתפוס את האוזן' בשניות הראשונות של השיר, כדי לגרום למאזין להישאר לפחות מעל חצי דקה. זה מתבטא במבנים של שירים, במהירות שלהם, ובצורה שבה אלמנטים בשיר נבנים ומשתנים.

 

המשיכו לחלק 2: הרשת של ספוטיפיי - על פלייליסטים, טרנדים ופופולריות


384 צפיות0 תגובות