Esh Kumar New Yorkban és Stockholmban dolgozik a Spotify ajánlási rendszerén. Az interjú a budapesti Crunch konferencián készült, ahol Esh is előadott.

Van olyan playlist a Spotify-tól, amit emberek raknak össze, vagy mindegyik automatizált?

Persze, minden Spotify playlist-et a cég zenei részlegének alkalmazottai állítanak össze.

A Te munkád az ajánlási rendszer optimalizálása, ez miről szól?

Megnézzük, hogy mit hallgattál korábban, és az ott meghallgatott/átugrott dalok alapján ajánlunk más zenéket. Vagy épp az alapján, hogy más felhasználók milyen sorrendben hallgatják a zenéket, a zene és előadó stílusa alapján. Azt is nézzük, hogy saját playlisten belül hallgattad az adott dalt, vagy tádión keresztül, egy csomó dolgot. Az ajánlási rendszerekben az a kihívás, hogy mindenkinek tök egyedi a stílusa - a pop teljesen mást jelent más embereknek. Én például New Yorkban és Stockholmban is dolgozok - ha azt mondod az USA-ban, hogy szereted a popzenét, az emberek Katy Perry-re vagy Taylor Swiftre fognak asszociálni. Svédországban ugyanerre mindenki azt hinné, hogy a nyolcvanas évekért vagy oda.

Hogyan állapítjátok meg, hogy két dal hasonló?

Egy csomó dolog segít. A Spotify-nak 1.5 milliárd felhasználók által készített playlistje van, mi megnézzük, hogy ezekben milyen számok szerepelnek közösen. Például, ha látjuk, hogy Freddy Mercury és a Beatles dalai sokszor jelennek meg egy playlisten, feltételezhető, hogy szeretik az emberek egymás után hallgatni őket. Azt is megnézzük, minek nevezik el a lejátszási listákat - pl. “hatvanas évek” -, ez segít megállapítani, hogyan kategorizálják a zenét. Plusz használjuk a Google word2vec eszközét, ami úgy állapítja meg, hogy 1-1 szó hasonló-e, hogy a szövegkörnyezetét nézi meg. Például meg tudod nézni vele, hogy a “ragyogás” szó milyen gyakran jelenik meg a “nap”, “csillagok” és “uborka” szavak közelében, látod, hogy hopp, a nap és csillagok gyakran ragyognak, míg az uborka kevésbé, és már tudod, ha valaki egy csillagokról szóló dalt hallgat, érdemesebb egy napról szóló számot ajánlani utána, mint egy uborkáról szólót.

Meg tudod mondani, hogy hányszor hallgattam meg privát módban az új Adele számot? Mert ha kiderülne, tönkretenné a jó híremet.

Nem, nagyon komolyan vesszük a beállításokat, ne aggódj, a titkod velünk biztonságban van. Én nem használom a privát módot, szóval minden kollégám rögtön látja, éppen mit hallgatok. “Esh, azt hittük, a technót szereted! Mi ez az új szám Ellie Goulding-tól?” Komolyan, ez a munkám egyetlen hátránya.

Oké, de megfigyelési listáitok vannak, nem? Például ha túl sok Nicki Minaj-t hallgatok, akkor kiadjátok a nevem a kormánynak, hogy hé, valaki a patriarchátus lebontására készül, vagy ha mondjuk három órán át Radiohead-et hallgatok, küldtök nekem egy lelkisegély-hívószámot, nem?

Nem, semmi ilyesmi nincsen. Nyugodtan hallgass amit szeretnél.

Te mit hallgatsz?

A listák közül a Discover Weekly a kedvencem. Mostanában sokat hallgatom Gui Borrotto-tól a No Turning Back-et. Futáshoz viszont a poposabb számokat szeretem.

Én mindig Tina Turner-re futok! Remélem erről sem fog soha, semmilyen infó kikerülni.

Az irodában van egy világtérképünk, amin fények gyulladnak ki, ha bárki a világon egyszerre hallgatja ugyanazt a számot. Szóval ha bármikor Tina Turner-t hallgatsz, csak emlékezz, hogy nagy valószínűséggel valaki, valahol, abban a pillanatban épp ugyanazt a számot hallgatja.

Ez elég megnyugtató gondolat. Gondolkodtatok már azon, hogy a Spotify-t online randi applikációval egészítsétek ki?

Még nem. Pitcheld az ötletet a főnökeimnek!

Mindenképpen. Milyen a Spotify-nál dolgozni?

Szuper. Már 1500-an dolgozunk a cégnél, de még mindig megőrizte a startup-jellegét. Például félévente leülünk, és megmutatjuk, milyen fejlesztéseken dolgozunk a mindennapi munkánk mellett. Egy csomó funkció, amit ma látsz az applikációban, innen indult.

Van egy elképesztően tehetséges barátom, akinek a dala az új magyar HBO sorozat főcímdala lett. Van arra mód, hogy ezt a számot minden lejátszási listába berakd? Mert mindenkinek hallania kellene.

Mindig vannak emberek, akiknek nagyon erős elképzeléseik vannak a lejátszási listákról. Volt, hogy azt kérték, hogy egyetlen Justin Bieber szám se legyen egyik listában sem. Bizonyos előadókat már ki tudsz szűrni, de nem tudjuk berakni a barátod számát minden playlistre.

Szomorú.

(Tóth Zoltán, a Crunch konferencia szervezője átveszi a szót.) Volt már valami igazán nagy fail-etek? Például klasszikus zene rajongóknak ajánlottatok Bieber-t, vagy kínai népzenét valakinek, aki addig csak német nacionalista zenéket hallgatott.

Ilyesmi már régóta nem fordult elő.

Szerinted a big data csak hype? (Tóth Zoltán a Crunch - Practical Big Data szervezőjének kérdése.)

A big data nagyon hasznos, de egy csomó olyan esetben is alkalmazzák, ahol alapvetően felesleges.

Mit viszel magaddal Magyarországról?

Egy üveg pálinkát. Azt hittem, a svédek nagyivók, de a pálinka… meglepett, főleg másnap reggel.

(Click for the English version)

 

Esh Kumar is the data guy at Spotify, splitting his time between New York and Stockholm. I asked him inane questions during Crunch Budapest.

Are there any playlists by Spotify that are human-made, or it’s all automatized?

Oh, all the playlists you see on Spotify are handpicked. The music-side of the company, not the data side, sets up the playlists.

Your job is to optimize the recommendation system, what does that entail?

What we do is look at what you have listened to in the past, and propose new playlists based on those songs, and on what others who have listened to the same playlist listened to afterwards, and on the style and lyrics of the artists you have listened to, and on whether you have listened to a song in a playlist, on radio, a whole bunch of things. Recommendation systems are challenging, because everyone is unique, and pop means different things to different people. I split my time between New York and Stockholm, and if you say you like pop in the US, people will think you mean listening to Taylor Swift or Katy Perry. You confess you are a pop-lover in Sweden, and everyone thinks you are into 80s music.

How can you tell if two songs are similar?

There is a number of things we do with. Spotify has 1.5 bn user-generated playlists, and we look at what our users put together under one playlist, and under what name. Say the system sees Freddy Mercury and the Beatles under one playlist, and it will know that you think of those songs as similar, and if you call the playlist “The 60s”, that also helps us to know how you categorize that music. But we also use a Google tool called word2vec, which we set up to look at the lyrics of songs, and to figure out based on word context what songs are about. Like, it will look at how many times the word “shining” appears close to “stars”, “sun”, and for example “cucumber”, and when we see that it appears very often close to stars and sun, we know those songs that have the word “stars” and “sun” are probably similar, while those that have the word “cucumber”, not so much.

Can you tell how many times I listened to the new Adele song? Because if that number got out, it would completely ruin my street cred.

No, we protect your data, don’t worry. Your secret is safe with us, as long as you are using the private listening function. I don’t, so everyone I work with always mentions if I listened to something uncharacteristical. “Esh, what is this Ellie Goulding song? I thought you liked techno!” Seriously the only downside in working at Spotify.

Okay, but do you have watchlists? Say, if I listened to too much Nicki Minaj, you are compelled to alert the authorities that I am about to dismantle patriarchy, or if I listened to Radiohead for 3 hours straight, you would give me a suicide hotline number.

There are no such things, relax and listen away. No one will know.

What do you listen to?

From playlists, Discover Weekly is my favourite. And lately I have been listening to a track called No Turning Back by Gui Borotto a lot. But for running, I listen to more pop-y songs.

I know, I always run to Tina Turner! Another thing I hope won’t show up anywhere, ever.

At the office, we have this globe, and when people are listening to the same song, the location of those people light up on the globe. So just remember, when you listen to Tina Turner, there’s probably someone, somewhere at the same time, who listens to it.

That’s actually really cool, we are all connected by music and all! Have you thought about making Spotify into a dating service? I think it would be a hit!

No, not yet. You should pitch this idea.

Definitely! What is it like working at Spotify?

It’s amazing, a great place to work at. It really conserved its startup culture. Every six months, we get together and we can present new ideas about the application that we have been working on next to our daily jobs. Many of the functions that you see today on Spotify came alive like that.

I have a friend who is a super talented musician, and his song just became the soundtrack of a Hungarian HBO series! Is there a way you could put his song into every playlist? Because everybody should listen to it.

Yeah, we always have people with strong feelings about playlist, like “Why can’t you take Justin Bieber from everywhere?”. You can filter a playlist but I can’t plug in your friend’s song to every playlist.

Shame.

(Zoltán Tóth takes over)  Have you had a big fail? Like recommending Justin Bieber to classical music fans, or putting Chinese songs in front of people who only listened to nationalistic songs before?

Well, maybe some in the beginning, it doesn’t happen anymore.

Do you think big data is just hype? (Zoltán Tóth is the organizer of Crunch - Practical big data conference.)

There are definitely areas in which you don’t need to apply big data principles. Big data is super useful, but now it’s becoming applied at places you definitely don’t need it.

What are you taking away with you from Hungary?

A bottle of pálinka. I thought the Swedes were big drinkers, but that pálinka was… surprising, the next morning especially.