Jobban ismeri a felhasználót, mint saját maga – kiderült, hogyan működik a TikTok algoritmusa

2 éve ezelőtt 67

December elején kiszivárgott egy olyan dokumentum, amely a TikTok belső rendszerének működését leplezte le, az ebből kitűnő működési elv szerint a TikTok még az eddig ismerteknél is nagyobb hatékonysággal láncolja magához a felhasználókat.

A New York Times hosszú cikkben számolt be egy olyan dokumentum részleteiről, amely a Tiktok nem informatikus alkalmazottjainak írta le a közösségi oldal algoritmusának alapvető működését. Az angol nyelvű dokumentumban matematikai képletek csak elvétve szerepeltek, a célja az volt, hogy a cég alkalmazottai sajátíthassák el alapszinten, hogy hogyan működik a platform.

A TikTok Algo 101 nevű dokumentum létezését, illetve a benne foglaltak hitelességét a TikTok is elismerte sajtószóvivőjén keresztül. Azonban mielőtt ezekbe belemerülnénk, fontos megismerni, mitől különleges közösségi platform a TikTok.

A TikTok ránézésre épp csak annyiban más, mint a többi közösségi oldal, hogy nem szöveges bejegyzések, nem fotók, hanem videók végtelenített folyamát kínálja a felhasználóknak. A rendkívül egyszerűen használható és befogadható felület nem is próbál ismerősöket összekötni, vagy egyszerűsíteni közöttük a kommunikációt. A TikTok nem több, mint egy folytonos interakciót (értsd: a videók továbbgörgetését) igénylő szórakoztató platform, ezzel pedig valahol a közösségi és a hagyományos média közti határon van.

A platformban az igazán nyomasztó az, hogy a tartalmat fogyasztó (ilyenből már egymilliárd ember van a világon) preferenciáit az algoritmus rendkívül pontosan olvassa és pontosan olyan videókat kínál fel neki, amivel meg tudja ragadni és bent tudja tartani a rendszerben felhasználót. Az Algo 101 pedig ezt meg is erősíti: a dokumentum szerint az algoritmus több szorosan összefüggő, a felhasználótól kinyert adatot igyekszik úgy optimalizálni, hogy a felhasználónak soha ne legyen az az érzése, hogy információs buborékban rekedt, emiatt ne is akarjon ebből kitörni.

Az információs buborékokat a közösségi oldalak algoritmusai hozták létre, emiatt tapasztalható, hogy a felhasználók elé több olyan tartalom kerül, amiről az algoritmus azt gondolja, hogy - mivel korábban ahhoz hasonlót kedvelt, kommentelt, nézett hosszú ideig - a felhasználó alapvetően kedveli. A jelenség a felhasználónak egy idő után idegesítő lehet, és emiatt be is zárhatja az appot. A TikTok algoritmusa ezt próbálja elejét venni azzal, hogy kitágítják ezt az úgynevezett buborékot. Az algoritmus rengeteg adatot gyűjt, amelyek nyomán két fő ismérvet tart fontosnak: a „megtartást” és „az eltöltött időt”, ezek annak számszerűsített adatai, hogy egy felhasználó milyen gyakorisággal tér vissza a platformra, illetve mennyi időt tölt el ott. Az algoritmus annyira ügyes, hogy van olyan felhasználó is, aki függőségként írja le az app használatát.

A TikTok algoritmusa a dokumentum szerint folyamatosan monitorozza a megosztott tartalmakat, figyeli a Facebooknál, vagy Instagramnál is megszokott lájk-komment arányt, illetve a nézéssel töltött időt. E három adatot az algoritmus egy komplex képlettel összegzi, majd pontozza, végül pedig a pontozás alapján dobja a felhasználók elé a videókat. Vagyis a TikTok percről-percre változó népszerűségi, vagy "trending" listája azzal is alakul, hogy az algoritmus is belenyúl, osztályozza a videókat.

A dokumentum szerint az algoritmus annyira kiforrott, hogy képes kiszűrni azokat a tartalmakat, amelyek lájk-  vagy kommentvadász céllal próbálják meglovagolni az algoritmus kiválasztási módszerét. Viszont preferálja azokat a filmecskéket, amelyeket egy szerző azzal a céllal tett közzé, hogy a felhasználó az ő profilján lévő többi tartalomra kattintson (pl.: népszerűek a filmekből kivágott jelenetek, amiket aztán a kulcspontban vágnak el a feltöltők, hogy a további részekért már rá kelljen kattintani a profiljukra). Ez az algoritmusnak alapvető érdeke, hiszen a fogyasztó ezzel is több időt tölt el a platformon.

A többi közösségi felületről ismert buborék-effektus azonban itt is megjelenik, csupán az őt lebuktató illúziót iktatták ki sikeresen. A YouTube és az Instagram buborékja olyan, hogy ha az algoritmus érzi, hogy a felhasználó egy bizonyos tartalmat fogyaszt, akkor azzal kezdi el bombázni. A TikTok azonban más, az is figyeli, hogy mit szeret a felhasználó, és abból többet mutat nekik, de korántsem csak azt mutatja neki, mert akkor a felhasználó ráunna a platformra. Amellett, hogy a felhasználó által lájkolt, kommentelt és sokat nézett tartalmakból egyre többet ad, mutat közben folyamatosan új tartalmakat is. Így a buborék tágabbnak tűnik, miközben valójában az algoritmus egyre többet tud a felhasználóról.


Az, hogy a TikTok a fenti mérőszámokkal képes kiismerni a felhasználók szokásait, komoly aggályokat is felvet. Egyes kutatók szerint a fogyasztott, lájkolt, kommentelt tartalmak alapján az algoritmus képes megismerni a felhasználók szexuális orientációját, preferenciáit, pszichológiai zavarait, depresszióját, de még akár azt is megmondja, ha valaki drogfogyasztó. Ez önmagában nem lenne probléma, azonban a fogyasztók adatainak kezeléséről, távlati felhasználásáról a TikTok nem sokat árul el. A vállalat annyit volt hajlandó kommunikálni korábban, hogy az adatokkal nem élnek vissza, azokat nem adják át a kínai kormánynak – sőt állításuk szerint még ilyen jellegű kérés sem érkezett hozzájuk –, azonban a New York Times a laphoz eljutott információkból arra következtet, hogy a vállalat rálát a felhasználók közötti üzenetváltásokra, valamint a nem publikált, ám a rendszerbe feltöltött videókra is. Vagyis a TikTok nem végpontok közti titkosítást használ (mint ahogy például a Signal), hanem hozzáfér gyakorlatilag mindenhez, ami a szerverein keresztül történik.

Adatvédelmi aggályokra hivatkozva hirdetett hadjáratot a TikTok ellen Donald Trump korábbi amerikai elnök is. Trump 2020 augusztusában elnöki végrehajtási rendeletet hozott a TikTok anyacége, a kínai Bytedance ellen, amivel a közösségi platformot be akarta tiltatni Amerikában. Trump akkor azzal kampányolt, hogy a program adatgyűjtése eredményét átadja a Kínai Kommunista Pártnak, akik így az amerikai állampolgárok védett adataihoz juthatnak hozzá, később pedig ezeket felhasználhatják, azonban erre konkrét bizonyítékkal sem az elnök, sem kabinetje nem szolgált. A tilalom végül elakadt a bíróságon, Joe Biden megválasztása után pedig vissza is vonta a rendeletet, igaz, kormánya továbbra is vizsgálja a kínai cég tevékenységét.

Az adatkezelési aggályoknak a cég jelenleg úgy próbálja elejét venni, hogy a felhasználói adatokat összesítő adatbázist az Egyesült Államok területén tárolja, ezekről biztonsági másolatot nem is Kínában, hanem Szingapúrban, ahonnan a TikTok vezérigazgatója, Shou Zi Chew származik.

Azonban van egy másik amerikai aggály is, aminek szintén lehet alapja. Miután a TikTok moderátorai töröltek egy olyan videót, amelyben készítője a Kínában elnyomott ujgurok mellett állt ki, felmerült, hogy a kínai állami vezetéssel is jó kapcsolatokat ápoló cég vajon mennyire cenzúrázza a felületén megjelenő tartalmakat. Az említett videó törlése nagy visszhangot váltott ki, amire a cégnek is reagálnia kellett, így mára eljutottak odáig, hogy a Kínai Kommunista Párttal szemben megfogalmazott kritikákat megtűrik a rendszeren, azonban azok elérését a gyanú szerint letekerik, hogy kevesebb emberhez jussanak el. Ennek a letekerésnek a vizsgálatára, illetve konkrét kimutatására jelenleg azonban nincs objektív módszer, csupán tapasztalati úton állapítható meg, hogy például elenyésző számban látni a többi közösségi oldalon futó WhereIsPengShuai hashtaget, ami a szexuális zaklatási vádakat megfogalmazó, majd eltűnő kínai teniszező melletti kiállás jelképévé vált.

A TikTokkal szemben felhozott aggályok nagy részét az összes többi közösségi oldallal szemben le fel lehetne emlegetni. Ugyancsak kevéssé lehet rálátni a Google, vagy a Facebook adatkezelési normáira, valamint arra, hogy hogyan értékesítik a hozzájuk a felhasználóktól kerülő adatokat. Szintén nehéz kizárni annak a lehetőségét, hogy Peking – ha érdekei úgy kívánják – ne tudná megvásárolni a számára szükséges adatokat akár a TikToktól, akár más techóriástól.