TikTok 的真正優(yōu)勢,從來都不是算法(上)

2020-10-30    資深UI設(shè)計(jì)者

在如今大數(shù)據(jù)的時代,一些軟件會根據(jù)我們的地理位置、性別、喜好等等進(jìn)行算法推薦;能夠?qū)σ欢ㄒ?guī)范的輸入,在有限時間內(nèi)獲得所要求的輸出;比如TikTok,以用戶為中心進(jìn)行推薦,度很高;本文作者分析了TikTok 的真正優(yōu)勢,我們一起來看一下。

字節(jié)跳動往往被說成是一家算法公司,很多人認(rèn)為, TikTok是靠算法的黑科技才取得成功的。

事實(shí)真的是這樣嗎?

eugenewei認(rèn)為不是:TikTok的算法跟其他公司使用的并沒有太大的不同;TikTok最大的優(yōu)勢是它采取了對算法友好的設(shè)計(jì)模式,在自己內(nèi)部建立了一個飛輪,幫助其機(jī)器學(xué)習(xí)算法看到了優(yōu)化自己所需要看到的東西。

原文發(fā)表在其個人博客上,標(biāo)題是:Seeing Like an Algorithm;篇幅關(guān)系,我們分兩部分刊出,此為上半部分。

劃重點(diǎn):

  • TikTok的算法本身沒什么不一樣;
  • TikTok的不一樣在于它的app設(shè)計(jì)讓算法“看到”有效地執(zhí)行匹配工作所需的所有細(xì)節(jié);
  • 現(xiàn)代社交網(wǎng)絡(luò)巨頭的傲慢導(dǎo)致自己陷入到錯綜復(fù)雜的問題不能自拔;
  • 為了讓自己的算法發(fā)揮最大的效用,TikTok成為了自己的訓(xùn)練數(shù)據(jù)源;
  • 以用戶為中心的設(shè)計(jì)模式一直占據(jù)主導(dǎo),但算法友好型設(shè)計(jì)正在逆襲;
  • 為了最大限度地服務(wù)好用戶,請先服務(wù)好你的算法;
  • TikTok的設(shè)計(jì)使得它的視頻、用戶和用戶首選項(xiàng)對For You Page算法清晰可見。

在我上一篇關(guān)于TikTok的文章中,我討論了為什么它的For You Page算法是讓TikTok發(fā)揮作用的結(jié)締組織;它就是主板的總線,用來連接和關(guān)閉所有的反饋回路。

但是,在急于了解為什么各家公司都想收購TikTok的情況下,如果字節(jié)跳動把這款熱門的短視頻app拆分出來的話,圍繞著它的算法的炒作已經(jīng)有點(diǎn)被異化成那種往往被歸納為最近西方對中國科技分析的套路了。

在這篇文章中,我想討論一下TikTok的設(shè)計(jì)究竟是如何幫助它的算法表現(xiàn)得跟它一樣好的。

上次我討論了為什么FYP(For You Page)算法是TikTok飛輪的核心,但是如果這一算法不夠有效的話,那整個反饋回路就會崩潰;哪怕你對TikTok或短視頻領(lǐng)域不感興趣,了解一下這個算法是如何實(shí)現(xiàn)性也很重要,因?yàn)楦餍懈鳂I(yè)的公司都日益面臨著核心優(yōu)勢是機(jī)器學(xué)習(xí)算法的競爭對手的競爭。

我想討論的是TikTok的設(shè)計(jì)是如何幫助它的算法“看”東西的。

一、《國家的視角》 Vs 算法的視角

James C. Scott的《國家的視角》(Seeing Like a State)是那種很獨(dú)特的書,看過之后你會意識到硅谷就有那種使用(濫用)清晰性這個術(shù)語的類型。

我是在看到Venkatesh Rao的書摘之后第一次聽說這本書的,如果你不打算看原著的話,那篇書摘仍然是很好的tldr入門讀物(Scott Alexander的書評也不錯,只不過他的書評也已經(jīng)長到可以做自己的tldr );不過,我建議你還是要好好看看原著。

Scott那本書的副標(biāo)題是“那些試圖改善人類狀況的項(xiàng)目是如何失敗的”。

這本書可以提高你對日常生活當(dāng)中的各種意外后果的意識,當(dāng)我們也有著偉人一般的傲慢時,不妨保持更謙卑的態(tài)度;這個世界比我們想象的要更豐富、更復(fù)雜。

比方說,Scott的討論有很多都跟我們的現(xiàn)代社交網(wǎng)絡(luò)巨頭的某種傲慢感有關(guān);這些占主導(dǎo)地位的應(yīng)用的目的就是要提高自身用戶群的清晰性,其中包括促進(jìn)互動、防止用戶流失并最終提供定向廣告;反過來,這又導(dǎo)致他們的母公司陷入到錯綜復(fù)雜的問題之中,至今都未能擺脫困境。

不過這是需要另行討論的話題了;Scott關(guān)注的是民族國家如何用簡化的抽象在概要的層面 “看清”自己的公民,而我想討論的是TikTok的app設(shè)計(jì)是如何讓它的算法“看到”有效地執(zhí)行匹配工作所需的所有細(xì)節(jié)的——這篇文章討論的則是是應(yīng)用和服務(wù)在設(shè)計(jì)時最大限度利用機(jī)器學(xué)習(xí)新模式。(我知道,這種討論有點(diǎn)諷刺意味,因?yàn)檫@種“看法”有可能被塑造為另一種決定用戶看法的看法,一種美國的科技公司只能作壁上觀的看法。)

二、TikTok把自己變成算法的訓(xùn)練源

近年來,至少在像我這樣的門外漢看來,我們意識到,只需要通過把訓(xùn)練的數(shù)據(jù)量增加幾個數(shù)量級,機(jī)器學(xué)習(xí)就可以取得很大程度的進(jìn)步;也就是說,就算算法本身跟幾年前沒有太大的不同,僅通過在更大的數(shù)據(jù)集上對其進(jìn)行訓(xùn)練,人工智能研究人員就能取得像GPT-3這樣的突破(GPT-3暫時給科技Twitter們帶來了高潮) 。

當(dāng)大家說TikTok的算法是取得成功的關(guān)鍵時,很多人會把某些神奇的代碼段看作是公該司的秘密武器。

俄羅斯當(dāng)代后現(xiàn)代主義作家Viktor Pelevin說,所有的現(xiàn)代電影都是同一個主角:一個裝滿錢的公文包;從《死吻》的放射性物質(zhì)公文包,到《低俗小說》里面的那個類似的里面金光閃閃的、不知道裝著什么的公文包;從《魔頭對捕頭》(The Formula)的創(chuàng)世紀(jì)方程,到大衛(wèi)·馬梅特(David Mamet)的《西班牙囚犯》(The Spanish Prisoner)里面的秘密的金融處理,我們長期以來一直對有魔力的麥格芬(McGuffin,推動情節(jié)發(fā)展的對象或事件)感到癡迷。

最近幾周,對TikTok算法的討論已經(jīng)把它提升成了類似的東西,這個算法就好像是《奪寶奇兵》系列電影(如《法柜奇兵》、《圣戰(zhàn)奇兵》…)里面那些神秘的考古文物一樣。

但是這個領(lǐng)域大多數(shù)的專家的態(tài)度不會是這樣,他們不相信TikTok在機(jī)器學(xué)習(xí)推薦算法方面取得了迄今為止我們所不知道的進(jìn)步;實(shí)際上,大多數(shù)人會說,TikTok的做法大概跟別人的解決問題方法無異。

但是要記住的是,機(jī)器學(xué)習(xí)算法的有效性不僅僅取決于算法,還要取決于利用某些數(shù)據(jù)集訓(xùn)練過后的算法;GPT-3也許并沒有什么新鮮,但是通過接受大規(guī)模的數(shù)據(jù)訓(xùn)練,以及設(shè)置大量的參數(shù),其輸出往往令人驚訝。

同樣地,基于自身數(shù)據(jù)集訓(xùn)練過的TikTok FYP算法,在將視頻與認(rèn)為該視頻有趣的人進(jìn)行匹配方面非常準(zhǔn)確有效(而且,同樣重要的是,在不向那些不認(rèn)為視頻有趣的人推送方面也很有效) 。

有些領(lǐng)域,比方說文本,可以輕松獲得大量訓(xùn)練得很好的數(shù)據(jù);比方說,要想訓(xùn)練出像GPT-3這樣的AI模型,你可以到互聯(lián)網(wǎng)、書籍等上面找到大量可用的文本集;如果你想訓(xùn)練視覺AI,可以在網(wǎng)上和各種數(shù)據(jù)庫里面找到大量照片;訓(xùn)練仍然很費(fèi)錢,但是至少你手頭有足夠的訓(xùn)練數(shù)據(jù)。

但對于TikTok (或者抖音)來說,它那擅長推薦短視頻給受眾的算法可就沒有公開可用的這么大規(guī)模的訓(xùn)練數(shù)據(jù)集了。

去哪里可以找到模因、小孩跳舞、對口型、可愛的寵物、推銷品牌的網(wǎng)紅、士兵越障訓(xùn)練、小孩模仿品牌等內(nèi)容的短視頻呢?就算你有這樣的視頻,又該去哪里找到關(guān)于大眾對此類視頻感受的可比數(shù)據(jù)呢?除了Musical.ly的數(shù)據(jù)集以外(主要是美國喜歡玩對口型的青少年),這樣的數(shù)據(jù)并不存在。

這是一個獨(dú)特的雞生蛋還是蛋生雞的問題,如果沒有這款app的的攝像頭工具和濾鏡,以及拿到版權(quán)的音樂剪輯的話,TikTok的算法需要訓(xùn)練的那種視頻就很難創(chuàng)建。

那么,這就是TikTok設(shè)計(jì)的魔力所在:app會激發(fā)和促進(jìn)視頻的創(chuàng)作與瀏覽,算法然后用這些視頻進(jìn)行訓(xùn)練,再反過來激發(fā)和促進(jìn)視頻的創(chuàng)作與瀏覽,形成反饋回環(huán)。

為了讓自己的算法發(fā)揮最大的效用,TikTok成為了自己的訓(xùn)練數(shù)據(jù)源。

三、以用戶中心 Vs 對算法友好

要了解TikTok是如何做出這么強(qiáng)大的學(xué)習(xí)飛輪,我們需要對它的設(shè)計(jì)進(jìn)行深入研究。

關(guān)于科技的UI設(shè)計(jì),主導(dǎo)的思想流派(至少是我成長的過去二十年里)關(guān)注的重點(diǎn)是消除用戶所做事情的摩擦,并讓他們在此過程中感到愉悅;其設(shè)計(jì)目標(biāo)是優(yōu)雅,什么是優(yōu)雅:優(yōu)雅就是直觀、巧妙,甚至?xí)r尚。

也許沒有一家公司比蘋果把這種設(shè)計(jì)風(fēng)格體現(xiàn)得更加淋漓盡致,巔峰狀態(tài)下的蘋果總能把自己的軟硬件做出優(yōu)雅的感覺——“就是這么好用(it just works)”,但同時又很迷人,讓用戶覺得很雅致。

(蘋果控制風(fēng)格的名聲就沒那么光彩了——手機(jī)、筆記本電腦不可替換的電池,目前有關(guān)應(yīng)用商店規(guī)則的爭論)在發(fā)布新品的主旨演講時,展示一塊硬邦邦的鋁塊是如何變成嶄新的MacBook Pro機(jī)身的視頻的理由是什么?

因?yàn)槁牭焦I(yè)激光把那塊鋁雕刻成一體化機(jī)身時發(fā)生的聲音很性感?然后,當(dāng)你在咖啡店用那臺筆記本電腦敲擊一封電子郵件時,在你的潛意識里,有關(guān)那段視頻的一點(diǎn)殘留的記憶里面會不會讓你的多巴胺受到一點(diǎn)點(diǎn)的觸動?

這種以用戶為中心的設(shè)計(jì)模式在這么長時間以來一直占據(jù)著主導(dǎo)地位是有原因的,尤其是在消費(fèi)類技術(shù)里面。

首先,這的確有用——蘋果的市值最終超過了2萬億美元(還記得假冒的Sean Parker說過十億美元很酷嗎?那還是十年前,現(xiàn)在十億美元不再是金牛了,財(cái)富的量級在飛速發(fā)展。)

此外,我們生活在大規(guī)模網(wǎng)絡(luò)效應(yīng)時代,應(yīng)用了Ben Thompson的聚合理論并獲得大量用戶群的科技巨頭,可以在他們所參與的市場當(dāng)中發(fā)揮出不可思議的杠桿作用——要先做到這一點(diǎn),最佳的辦法之一就是設(shè)計(jì)出能比競爭對手更好地滿足用戶需求的產(chǎn)品和服務(wù)。

長期以來,這種設(shè)計(jì)流派一直占據(jù)著主導(dǎo)地位,以至于我?guī)缀跬浟诉^去時代慣常采用過的一些蠻不講理的軟件設(shè)計(jì)了。(不要把它跟野獸派設(shè)計(jì)混為一談,后者其實(shí)就像它在建筑方面的表親一樣,在設(shè)計(jì)上是相當(dāng)美的。)

但是,如果要想最大限度地服務(wù)好用戶的關(guān)鍵要取決于對機(jī)器學(xué)習(xí)算法的訓(xùn)練呢?如果這個ML算法需要龐大的訓(xùn)練數(shù)據(jù)集該怎么辦?在機(jī)器學(xué)習(xí)方興未艾的時代,這日益成為關(guān)鍵的設(shè)計(jì)目標(biāo)。

在考慮如何設(shè)計(jì)app時,你日益必須考慮怎么才能最好地幫助算法去“看”——為了最大限度地服務(wù)好用戶,請先服務(wù)好你的算法

TikTok讓我著迷,因?yàn)椴还苁且馔膺€是有意而為之,這都是一個為了盡可能多地給自己的算法提供有用信號的現(xiàn)代app的典范——這就是我所謂的算法友好型設(shè)計(jì)的范本。(我曾經(jīng)想過把它叫做以算法為中心的設(shè)計(jì),但覺得這種說法有點(diǎn)過頭了;一個幫助算法看見東西的設(shè)計(jì)到頭來仍然是為了給用戶提供盡可能好的體驗(yàn)。)

我們?nèi)匀豢梢哉J(rèn)為這只是以用戶為中心的設(shè)計(jì)的一種變體,但是對于那些大量采用機(jī)器學(xué)習(xí)算法組件進(jìn)行產(chǎn)品開發(fā)的團(tuán)隊(duì)來說,明確地承認(rèn)這一點(diǎn)也許有用;畢竟,當(dāng)產(chǎn)品經(jīng)理,設(shè)計(jì)師和工程師開會討論app設(shè)計(jì)時,算法是不會出席的;但是,對算法的訓(xùn)練需求必須得到體現(xiàn)。

James Scott在談到《國家的視角》,談到了城市設(shè)計(jì)等領(lǐng)域的巨大變化,比如讓土地面積和業(yè)主數(shù)量對征稅者“清晰可見”;TikTok的設(shè)計(jì)使得它的視頻、用戶和用戶首選項(xiàng)對For You Page算法清晰可見;這種app設(shè)計(jì)履行了它的主要職責(zé)之一:“像算法一樣看東西”。

我們不妨仔細(xì)看看,TikTok打開后就是“For You Page”頁面,然后直接進(jìn)入視頻。這就是它的樣子。

這個是到目前為止有史以來最熱門的TikTok視頻,截止到我發(fā)布這篇文章時,它的34.1M個點(diǎn)贊可能已經(jīng)不止了;你可以看看有關(guān)這條TikTok是如何誕生的故事,看過之后你仍然會覺得這是一個充滿悖論的文化難題,但是你看過后會喜歡的。

我把這個給我侄女看了,然后我們一起循環(huán)播放了好幾十次,然后我們一起開始大喊“從M到B,從M到B”,然后一起笑了起來,這是我在這場疫情當(dāng)中真正的感受不是絕望的少數(shù)幾次之一。

整個屏幕被一個視頻填滿。只有一個視頻,視頻用豎屏全屏顯示;注意,這是不能滾動的,而是分頁。視頻幾乎是立即自動播放(接下來的幾個視頻被加載到后臺,所以輪到的時候可以很快播放出來)。

這種設(shè)計(jì)讓用戶要面對一個緊迫的問題:你對這個短視頻的感覺如何?就這個短視頻。

從視頻開始播放到現(xiàn)在,你所做的一切都是你對該視頻的感受的信號;你是不是在它還沒播放完就滑向了下一個視頻?是的話就隱含(盡管邊界是顯性的)表示你對它不感興趣。

你是不是看了不止一次,讓它循環(huán)播放了好幾次?似乎不知怎的它就吸引了你。你有沒有通過內(nèi)置的分享面板分享了這段視頻?這是正面情緒的另一個有力指標(biāo)。

如果你點(diǎn)擊右下角旋轉(zhuǎn)的LP圖標(biāo),看了更多有著同樣背景音樂的視頻的話,就是該視頻對你胃口的進(jìn)一步信號;音樂線索往往是模因的代名詞,現(xiàn)在TikTok又有了一條為你推薦視頻的軸線了。

還有,你是不是跑去看了看視頻創(chuàng)作者的個人資料頁面?你是不是看過她其他的視頻,然后還關(guān)注了對方?是的話說明你除了欣賞視頻以外,也許你還特別欣賞對方這個人。

但是,我們不妨再退后一步,看看這你還沒有看到這個視頻之前,TikTok的算法自己是怎么“看見”這個視頻的;在這個視頻通過FYP算法發(fā)送到你的手機(jī)之前,TikTok的運(yùn)營團(tuán)隊(duì)有人已經(jīng)看了這個視頻,并添加了大量相關(guān)標(biāo)簽或標(biāo)記。

這個視頻是跟跳舞有關(guān)的嗎?是對口型?還是視頻游戲?有小貓嗎?還是花栗鼠?是搞笑的嗎?主體是男的還是女的?大概幾歲?是群視頻嗎?背景在哪里?用的是什么濾鏡或視覺效果?如果里面包括有食物,是什么食物?等等,所有這些標(biāo)簽都成為了算法現(xiàn)在可以看到的功能。

視頻還要在視覺AI這里處理一下,并為自己能看到的東西做出貢獻(xiàn);TikTok有些攝像頭濾鏡能夠跟蹤人臉、手或者手勢,所以視覺AI往往在視頻被創(chuàng)建出來之前就被調(diào)用過了。

這個算法還可以看到TikTok所了解到的有關(guān)你的信息,你過去喜歡什么類型的視頻?有關(guān)你的人口統(tǒng)計(jì)學(xué)信息或心理學(xué)信息有哪些?你是在哪里看這個視頻的?你用的是什么類型的設(shè)備?等等,除此之外,還有哪些其他用戶跟你相似?


文章來源:人人都是產(chǎn)品經(jīng)理    作者:紙盒小卡車


藍(lán)藍(lán)設(shè)計(jì)m.sillybuy.com )是一家專注而深入的界面設(shè)計(jì)公司,為期望卓越的國內(nèi)外企業(yè)提供卓越的UI界面設(shè)計(jì)、BS界面設(shè)計(jì) 、 cs界面設(shè)計(jì) 、 ipad界面設(shè)計(jì) 、 包裝設(shè)計(jì) 、 圖標(biāo)定制 、 用戶體驗(yàn) 、交互設(shè)計(jì)、 網(wǎng)站建設(shè) 、平面設(shè)計(jì)服務(wù)

分享本文至:

日歷

鏈接

個人資料

存檔