猜人心的淘寶 “刷”著“逛”的電商
發(fā)布時(shí)間: 2018-10-23 15:50:54
作者: 36氪-孫然來(lái)源: 36氪
三桐可能是最懂中國(guó)女人的男人,因?yàn)樗偰苤滥阆胭I(mǎi)點(diǎn)什么,然后在恰當(dāng)?shù)臅r(shí)候送到你眼皮底下。甚至很多時(shí)候,他比你自己更清楚那些隱秘的欲望。
盡管他分不清豆沙色、楓葉紅這些口紅色號(hào),也不知道這一季流行豹紋襯衣還是法式連衣裙,但他寫(xiě)的算法懂。
人們總是清楚的知道自己想要什么嗎?從事消費(fèi)者行為研究的說(shuō)服心理學(xué)家凱文·霍根認(rèn)為,大量的購(gòu)物決策在發(fā)生時(shí),人們是無(wú)意識(shí)的?!叭藗儗?duì)于自己未來(lái)將如何行動(dòng),或者有無(wú)可能購(gòu)買(mǎi)什么產(chǎn)品,幾乎沒(méi)有預(yù)測(cè)能力,而且他們肯定也無(wú)法準(zhǔn)確告訴你過(guò)去這么做的理由。”
事實(shí)上,商家對(duì)此早有感知。消費(fèi)者需要不斷被觀察,試探和刺激,才能賣(mài)給他們更多商品。
過(guò)去這是那些巧舌如簧的導(dǎo)購(gòu)員們的絕活,現(xiàn)在,電商已經(jīng)開(kāi)始嘗試讓機(jī)器算法和大數(shù)據(jù)充當(dāng)這個(gè)角色。
三桐正在干的就是這件事。他是阿里巴巴搜索事業(yè)部的資深算法專(zhuān)家,最近幾年在研發(fā)一系列利用搜索和推薦技術(shù)讓電商產(chǎn)品Feed化的算法,也就是人們常說(shuō)的“千人千面”。
今年,“三桐們”格外搶手。Boss直聘2018年二季度人力報(bào)告顯示,搜索和推薦算法工程師成了當(dāng)下最熱門(mén)的崗位。不只新晉獨(dú)角獸拼多多,甚至一些A輪的早期電商公司,都在高價(jià)尋覓AI科學(xué)家。8月底改版后的手淘,個(gè)性化推薦欄目不僅在首頁(yè)占了兩個(gè)板塊,還占據(jù)了第二屏往后的全部位置。這些都意味著,“逛”和“刷”成了用戶(hù)使用電商App的新模式。
一個(gè)算法比你更懂你的購(gòu)物時(shí)代,已經(jīng)悄然而至了。
平均每個(gè)月有6.34億人在淘寶上購(gòu)物。倚著早高峰8-9點(diǎn)的地鐵欄桿,或者晚上9-11點(diǎn)坐靠在床頭,無(wú)數(shù)男男女女端著手機(jī),一頁(yè)一頁(yè)地刷著淘寶個(gè)性化推薦板塊“猜你喜歡”和“有好貨”,希望淘到點(diǎn)好東西。
這是一群很難搞定的消費(fèi)者——心思多變又經(jīng)常漫無(wú)目的。一個(gè)剛開(kāi)啟健身生活的上班族可能盤(pán)算了一早上午餐要點(diǎn)份蔬菜沙拉,但只因?yàn)楸桓舯谕碌臐h堡的氣味吸引,意志就在一瞬間潰敗。
這意味著,預(yù)測(cè)用戶(hù)需求的機(jī)器需要反應(yīng)迅速又極有眼色——甚至你瀏覽商品時(shí)劃動(dòng)手機(jī)屏幕的速度,都能成為考量你正被吸引還是因無(wú)聊而煩躁的指標(biāo)。
所有人在搜索欄輸入關(guān)鍵詞,瀏覽著一模一樣的商品的年代已經(jīng)翻篇兒了。
是什么誘發(fā)了“千人千面”在電商行業(yè)的爆發(fā)?追溯源頭,一方面因?yàn)殡娚唐脚_(tái)的商品豐富度到了一個(gè)龐大的量級(jí)。以淘寶為例,如今平臺(tái)上有幾十億商品,幾千個(gè)子類(lèi)目,涉及十幾個(gè)行業(yè)。與此同時(shí),當(dāng)人們的購(gòu)物渠道從十幾英寸的電腦轉(zhuǎn)移到幾英寸的手機(jī)屏幕,展示空間卻急劇縮小,這時(shí)候Feed化的滾動(dòng)展示,讓所有商品都有露臉的機(jī)會(huì),就顯得很有必要。
另一方面,消費(fèi)者的要求越來(lái)越高,相對(duì)于早年間的爆款,他們開(kāi)始追求符合自己調(diào)性和偏好的商品。瀏覽大量不符合用戶(hù)偏好的產(chǎn)品,會(huì)浪費(fèi)用戶(hù)的時(shí)間,消磨他們對(duì)電商平臺(tái)的認(rèn)可度,最終商家會(huì)失去他們。
早在幾年前,淘寶就在為這個(gè)轉(zhuǎn)變做準(zhǔn)備。2011年,淘寶內(nèi)部出現(xiàn)了第一個(gè)推薦算法的實(shí)驗(yàn)項(xiàng)目。
那一年阿里資深產(chǎn)品專(zhuān)家方圓剛加入淘寶,作為項(xiàng)目經(jīng)理牽頭做了個(gè)名叫“ 母嬰檔案”的個(gè)性化項(xiàng)目,主要為母嬰客戶(hù)推薦適合的產(chǎn)品。這個(gè)項(xiàng)目之所以誕生,源于淘寶希望提高搜索效率,讓用戶(hù)能更快找到符合自己需求的商品,增加交易量。在此之前,傳統(tǒng)電商搜索對(duì)于所有用戶(hù)都是以同一套算法計(jì)算的,也就是所謂的“千人一面”。
有時(shí)候推動(dòng)技術(shù)進(jìn)步的往往是現(xiàn)實(shí)業(yè)務(wù)中的瓶頸。2013年左右,隨著平臺(tái)上的商品越來(lái)越多,對(duì)所有用戶(hù)采用同一套搜索算法,已經(jīng)不能滿(mǎn)足用戶(hù)需求了。蘑菇街和美麗說(shuō)這類(lèi)主打“小而美”的新型競(jìng)爭(zhēng)對(duì)手出現(xiàn)了,但用戶(hù)對(duì)淘寶的認(rèn)知仍停留在低價(jià)爆款,這意味著人們可能只來(lái)淘寶采購(gòu)低價(jià)商品,淘寶將在后續(xù)的競(jìng)爭(zhēng)中受到很大限制。
與此同時(shí),淘寶的UV增速開(kāi)始放緩,需要用算法創(chuàng)造新的用戶(hù)場(chǎng)景,刺激新的增長(zhǎng)。為此,淘寶把個(gè)性化推薦和搜索正式提上日程,迎合用戶(hù)開(kāi)始走向多元化的需求。
淘寶用聚劃算做了一次至關(guān)重要的個(gè)性化推薦測(cè)試——以往聚劃算的商品展示的排序是遵循每個(gè)小時(shí)計(jì)算出的銷(xiāo)量,上了個(gè)性化排序后,商品成交量很快提升了一倍。
這給了淘寶后來(lái)全面做“個(gè)性化”的信心,到2014年All in無(wú)線(xiàn)后,個(gè)性化業(yè)務(wù)的地位顯得更加重要。繼電商搜索團(tuán)隊(duì)后,阿里又成立了專(zhuān)門(mén)的推薦技術(shù)團(tuán)隊(duì)。
方圓每個(gè)月都要在淘寶上花個(gè)1、2萬(wàn),他每天起床后都習(xí)慣性地打開(kāi)淘寶,用產(chǎn)品負(fù)責(zé)人的視角檢驗(yàn)推薦算法的效果。
他對(duì)最近一次淘寶推薦的結(jié)果很滿(mǎn)意——前幾個(gè)推薦展示位分別是洗漱包、日式茶杯、幼兒早餐奶和新生兒用品,他覺(jué)得這準(zhǔn)確契合了一個(gè)正處于連續(xù)出差中、愛(ài)喝茶的新晉二胎奶爸的用戶(hù)畫(huà)像。
“整個(gè)結(jié)果擺在我面前,就是我理解的自己的生活狀態(tài)?!彼麑?duì)36氪說(shuō)。
所謂電商推薦,就是把用戶(hù)和商品數(shù)據(jù)化成機(jī)器能理解的語(yǔ)言,然后挖掘出用戶(hù)與商品、甚至商品與商品之間的關(guān)聯(lián)規(guī)律,實(shí)現(xiàn)精準(zhǔn)的推送和高成交率。
“推薦也好、搜索也好,都是一種關(guān)系的構(gòu)建。對(duì)我們來(lái)講去構(gòu)建這樣的關(guān)系是很重要的工作。”三桐進(jìn)一步解釋。
定義一個(gè)方圓這樣的用戶(hù),在整個(gè)阿里巴巴的生態(tài)內(nèi)(包括淘寶、支付寶、UC、高德…)有幾百個(gè)維度的數(shù)據(jù),而每個(gè)維度下面又能細(xì)分出無(wú)數(shù)屬性標(biāo)簽。比如價(jià)格偏好是一個(gè)維度,它下面又可以按照高、中、低價(jià)范圍劃分出幾個(gè)屬性。算下來(lái),定義一個(gè)人總共能有幾十億個(gè)標(biāo)簽。
除卻性別、年齡這些基本信息,你的行為會(huì)以一種隱秘的方式向機(jī)器透露你是個(gè)什么樣的人,你的偏好又是什么?比如購(gòu)物歷史、搜索歷史和瀏覽軌跡,都能為機(jī)器定義你提供依據(jù)。
在機(jī)器的上帝視角下,一切細(xì)碎的行為都被賦予意義:它能通過(guò)你購(gòu)買(mǎi)前的瀏覽比對(duì)次數(shù)知道你是否是個(gè)糾結(jié)的選擇困難癥患者,也能敏感的察覺(jué)到用戶(hù)是否對(duì)當(dāng)前的推薦感到厭倦。
“我們可以觀察你的每次瀏覽行為中,比如10個(gè)坑位里你看的商品是否是都是相似的,當(dāng)推薦的品類(lèi)過(guò)于集中,機(jī)器通過(guò)一些信號(hào)感應(yīng)到用戶(hù)(審美)疲勞了,下一步的推送就會(huì)提高探索度,推薦點(diǎn)其他的。”三桐告訴36氪,商品推薦最糟糕的情況就是用戶(hù)看了、商品曝光了,但一直在滾動(dòng)屏幕,用戶(hù)不點(diǎn)進(jìn)去。
不過(guò)相對(duì)來(lái)說(shuō),商品的定義或許比人更難,甚至有時(shí)候是一場(chǎng)算法工程師跟商家之間的斗智斗勇。
淘寶的商品標(biāo)簽體系有超過(guò)1萬(wàn)個(gè)類(lèi)目,以及包括品牌,尺寸、尺碼、款式、顏色在內(nèi)的上百個(gè)屬性。就像三桐先前說(shuō)的,僅顏色一個(gè)屬性,又能細(xì)分成幾千個(gè)子標(biāo)簽。打這些標(biāo)簽,有的依靠人工,比如品牌,有些則用深度學(xué)習(xí)技術(shù)生成。
給商品打標(biāo)簽,就是將商品的信息標(biāo)準(zhǔn)化。這是項(xiàng)復(fù)雜且工程龐大的工作。
坐在我對(duì)面的三桐微擰著眉頭,“你知道光是機(jī)器顏色打標(biāo)簽有多難嗎?就說(shuō)顏色,淘寶上一共有幾千個(gè)顏色。什么灰白、銀白、奶白…米色到底是白色還是什么東西?反正我不知道,除了那七種顏色,很多我們都沒(méi)見(jiàn)過(guò)。桃紅色、玫紅色,甚至不帶紅色的也能是個(gè)紅色,叫赤色。”
在淘寶這類(lèi)平臺(tái)電商,每天無(wú)數(shù)商家會(huì)自行編輯不同的商品叫法、上傳不同的圖片,即便完全一樣的商品在兩個(gè)商戶(hù)的店鋪里,也會(huì)有不一樣的叫法、屬性描述,更不用提還有山寨品。
“一個(gè)商品的標(biāo)準(zhǔn)屬性應(yīng)該怎么寫(xiě)?如果商家隨便掛一個(gè),我們又怎么識(shí)別哪個(gè)對(duì)、哪個(gè)錯(cuò),”三桐見(jiàn)識(shí)過(guò)不少商家在宣傳詞匯上的無(wú)窮創(chuàng)造力,有些甚至讓他感到頭疼,“媲美耐克、金耐克、比耐克還舒服……這些都是商家創(chuàng)造出來(lái)的詞,但涉及到品牌侵權(quán)是非常嚴(yán)肅的事情。”
在一個(gè)每天不斷上架新品,總計(jì)幾十億商品的電商池里,這種篩查不可能全部依賴(lài)人工,算法需要有能力識(shí)別物品跟這些標(biāo)簽之間的匹配是否真實(shí)又恰當(dāng),讓商品順利流入推薦序列,又避免消費(fèi)者被誤導(dǎo)。
此外,每個(gè)行業(yè)在標(biāo)簽上又都有各自的特殊規(guī)則。比如羊絨衫,按照國(guó)家標(biāo)準(zhǔn),羊絨含量90%以上才可以稱(chēng)為羊絨衫。保健品、醫(yī)療器械等等的名稱(chēng)規(guī)范,又各有各的門(mén)道。
不僅用戶(hù)和商品畫(huà)像,購(gòu)物行為也是需要經(jīng)過(guò)標(biāo)準(zhǔn)化才能被機(jī)器理解。
算法試圖在看上去沒(méi)有邏輯的用戶(hù)行為中揪出邏輯。這是個(gè)令人頭大的任務(wù),三桐無(wú)數(shù)次看到用戶(hù)在淘寶上雜亂無(wú)章的行為軌跡:搜索裙子——中途跑去家電板塊看手機(jī)——然后再回來(lái)看裙子——最后買(mǎi)了罐奶粉走了。
這說(shuō)明兩個(gè)相繼的行為之間未必存在必然的聯(lián)系,它們是割裂而碎片化的。相當(dāng)比例的用戶(hù)打開(kāi)手淘時(shí)并沒(méi)有非常明確的目標(biāo),或者說(shuō)持續(xù)有一系列明確的目標(biāo)。這就像逛大街一樣,人們什么都想去試試、看看,購(gòu)買(mǎi)行為可能是被突然出現(xiàn)的眼緣激發(fā)的。
而電商們的轉(zhuǎn)化機(jī)會(huì),就存在于準(zhǔn)確預(yù)測(cè)眼緣并推薦。
要在一團(tuán)亂麻的行為中抽離規(guī)律,淘寶的算法工程師有兩種手法去應(yīng)對(duì):一種是實(shí)時(shí)推薦。機(jī)器要對(duì)人的心思實(shí)時(shí)感知,和我們一樣多變,這背后需要一系列復(fù)雜的模型和算法迅速理解每次點(diǎn)擊背后的意圖。
舉個(gè)例子,可能當(dāng)你在“有好貨”的Feed流里點(diǎn)開(kāi)過(guò)一款皮包,當(dāng)你退回Feed界面會(huì)發(fā)現(xiàn)原先在信息流中排在這款產(chǎn)品下面的幾個(gè)推薦位已經(jīng)換成了跟它風(fēng)格接近的皮包。
另一種,把這團(tuán)亂麻式的行為分類(lèi)??梢韵劝褷砍兜椒?、手機(jī)這些不同品類(lèi)的行為區(qū)分開(kāi),然后每個(gè)品類(lèi)下面再設(shè)置不同的觀察維度。比如關(guān)注手機(jī)類(lèi)目下的品牌,一位連續(xù)兩天瀏覽了華為手機(jī)的用戶(hù)很可能在近期就有針對(duì)性的購(gòu)買(mǎi)行為。又比如連衣裙品類(lèi)重要的觀察維度可能是款式和價(jià)位,再比如小說(shuō)書(shū)籍類(lèi)目的標(biāo)的可能是恐怖、歷史、軍事、言情這些內(nèi)容風(fēng)格。不同購(gòu)物主題下對(duì)應(yīng)的預(yù)測(cè)模型是差異化的。
再往深一步看,也有一些規(guī)律交叉在不同的品類(lèi)之間。譬如20多年前,沃爾瑪就曾通過(guò)大數(shù)據(jù)發(fā)現(xiàn)那些放了聽(tīng)裝啤酒的購(gòu)物車(chē)?yán)锟赡芤矔?huì)放進(jìn)嬰兒紙尿褲。這類(lèi)顧客通常是受了太太囑咐下班來(lái)買(mǎi)東西的丈夫。沃爾瑪因此把啤酒和紙尿褲的貨架并列放在一起,結(jié)果是兩類(lèi)產(chǎn)品的銷(xiāo)量都大幅增長(zhǎng)。
淘寶的推薦邏輯在逐漸外擴(kuò),從推薦物品、到推薦品類(lèi)、再到今年主要做的推薦場(chǎng)景。舉例來(lái)說(shuō)明這種變化:機(jī)器的智力發(fā)育,從知道你想要把北歐風(fēng)的餐椅,從而給你推薦一堆椅子,升級(jí)到知道你喜歡北歐風(fēng)餐椅,干脆嘗試賣(mài)給你一屋子的北歐風(fēng)家具。又比如當(dāng)你購(gòu)買(mǎi)了一樣郊游用的燒烤工具,機(jī)器可以基于場(chǎng)景推給你燒烤食材、戶(hù)外帳篷。這種轉(zhuǎn)變,意味著從賣(mài)一樣貨、到賣(mài)一個(gè)場(chǎng)景,甚至再高級(jí)點(diǎn),一種生活氛圍或方式。
走向場(chǎng)景化推薦后,淘寶今年的推薦欄目使用率提升了30%?!?0%其實(shí)只是我們的熱身,接下來(lái)會(huì)提升得更快,”方圓對(duì)迄今的進(jìn)展頗為滿(mǎn)意。
到9月份,最新改版后的手機(jī)淘寶中,第二屏往下的位置已經(jīng)全部屬于“猜你喜歡”,甚至直播、全球等板塊也用同樣的推薦邏輯并入了這個(gè)板塊。在以往舊版本的手淘中,占據(jù)主導(dǎo)地位的是最上方的搜索欄,以及以傳統(tǒng)方式運(yùn)營(yíng)的各個(gè)欄目板塊。
這個(gè)信號(hào)說(shuō)明Feed化的兜售模式在淘寶的地位被進(jìn)一步認(rèn)可了。Feed真正讓用戶(hù)在電商場(chǎng)景完成了從單純的搜到“逛”的轉(zhuǎn)變,其中的好處不言而喻,增加激發(fā)你購(gòu)物交易的可能性,并且把你的時(shí)間留在電商的超級(jí)App里。
不過(guò)電商推薦不準(zhǔn),也是經(jīng)常被用戶(hù)吐槽的一點(diǎn)。
三桐聽(tīng)了笑了笑,“推薦要做準(zhǔn)確其實(shí)很容易。但過(guò)于準(zhǔn)確也意味著局限性,我知道你有需求,但不能一天到晚只給你推薦必需品,所以要進(jìn)行需求的探索,探索肯定沒(méi)有那么準(zhǔn),可是一旦命中,對(duì)于平臺(tái)就是很大的增量。而如果不做探索,用戶(hù)看到的品類(lèi)會(huì)越來(lái)越窄,最后他覺(jué)得淘寶就是這些東西,這對(duì)我們很致命?!?/p>
他說(shuō)的探索,就是讓機(jī)器會(huì)變著花樣試探、猜測(cè)你的各種喜好。猜的準(zhǔn)確率,猜到什么程度,甚至猜不中幾次能在你的容忍范圍內(nèi),這都是些技術(shù)活。
人們的確需要被挖掘到的驚喜感。大量的購(gòu)物行為是在沒(méi)有實(shí)現(xiàn)規(guī)劃和意識(shí)到的情況下發(fā)生的,甚至所謂的沖動(dòng)消費(fèi)也是其中一種情況。
本質(zhì)上,在準(zhǔn)確和探索之間,電商推薦是一門(mén)關(guān)于“平衡”的藝術(shù)。
算法工程師會(huì)用一系列指標(biāo)去衡量推薦的效果,比如最核心的CTR(點(diǎn)擊通過(guò)率)、用戶(hù)的瀏覽深度、看了多少頁(yè)、點(diǎn)擊了多少商品、疲勞度……他們追求讓CTR在一定范圍內(nèi)的平穩(wěn)增長(zhǎng)。即不能為了提升CTR而過(guò)度犧牲探索力度,又要在CTR下跌較多的時(shí)候及時(shí)意識(shí)到已經(jīng)探索過(guò)度,回調(diào)力度。
相對(duì)而言,女性消費(fèi)者的心思讓機(jī)器難以捉摸,比如她們未必會(huì)長(zhǎng)期局限于一種服裝風(fēng)格,而是看心情每種買(mǎi)幾件。但同時(shí),她們也比男性對(duì)探索的容忍度更高,更樂(lè)于“逛”。
每個(gè)人對(duì)新事物的接納程度,對(duì)探索的容忍度,都有所不同,這意味著每個(gè)淘寶賬號(hào)背后的算法模型,都在逐漸被對(duì)應(yīng)的用戶(hù)“養(yǎng)成”個(gè)性化的,通過(guò)你點(diǎn)了什么、沒(méi)點(diǎn)什么這些信號(hào),越來(lái)越懂你。
什么時(shí)候套用什么規(guī)律?什么規(guī)律適用于什么群體或者品類(lèi),可能是件極復(fù)雜的事。
“也有的人抱怨為什么電商有時(shí)候會(huì)原封不動(dòng)地推薦他買(mǎi)過(guò)的東西。但其實(shí)在書(shū)籍和某些品類(lèi),數(shù)據(jù)證明了人們就是有大量的復(fù)購(gòu)率。而經(jīng)典的紙尿褲和啤酒的搭配,也未必總是對(duì)的,”一位搜索從業(yè)者對(duì)36氪說(shuō)。
電商搜索推薦技術(shù)在不斷演進(jìn),淘寶希望做得再細(xì)一點(diǎn)——從分析一個(gè)群體,到分析個(gè)人。原因是消費(fèi)者對(duì)推薦的要求越來(lái)越高?!斑^(guò)去的消費(fèi)者要求如果他的孩子1歲,系統(tǒng)不要給他推3歲的玩具,但今天,他需要你告訴他1歲的孩子要買(mǎi)什么,去挖掘他的潛在需求。更高級(jí)的,有的消費(fèi)者希望機(jī)器預(yù)測(cè)出哪一天嬰兒奶粉喝完,尿不濕用完,然后提醒他去買(mǎi)?!狈綀A告訴36氪,如今用的深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)的算法模型已經(jīng)越來(lái)越復(fù)雜。
而在實(shí)際運(yùn)營(yíng)中,電商推薦還存在很多需要優(yōu)化的地方。未來(lái)好的算法,不僅需要知道人們想買(mǎi)什么,需要買(mǎi)什么,它還要了解人們使用商品的那些場(chǎng)景究竟是什么樣子,甚至需要理解消費(fèi)者所處的人生階段和生活狀態(tài),就像一面上帝視角的鏡子。