今年,商家通過阿里媽媽推廣投放明顯感覺到各類營銷產品、營銷工具變得自動化,不但操作更簡單,而且效果也有明顯提升。這背后的原理是什么,可能沒有太多人了解。但無疑,今年阿里媽媽智能化的戰略方向已開始顯效。
人工智能究竟能給阿里媽媽的營銷帶來怎樣的升級?人工智能又是如何讓推廣投放更有效的?阿里媽媽高級算法專家懷人將從算法和模型的角度介紹,人工智能的想象力在哪里?人工智能又是如何實現的?
以下為懷人分享,經《天下網商》整理而成。
大規模稀疏結構化深度學習
阿里媽媽會捕捉用戶在全網的實時行為,比如在淘寶看過什么,收藏過什么,哪些東西看了很多次但猶豫不決沒有買等等?;谶@些信息,阿里媽媽會進行建模,從而刻劃用戶的興趣,基于興趣再對每一次實時推廣投放進行判斷,確定點擊率預估。
點擊率預估通俗來講就是推廣被用戶點擊的可能性,即CTR(Click-Through Rate Prediction),這對營銷來講很重要,它不僅影響了每個商家每次投放推廣的計費,也影響平臺對流量的分配。
CTR預估越精確,推廣活動更有針對性,用戶點擊推廣的可能性就越大。問題來了,如何提高點擊率預估呢?這里面相當有講究。
在阿里媽媽的推廣投放后臺,每天接受的推廣預估請求超過千億次,目標用戶同樣是數以億計,這些數字背后反映出來的是超大規模+高度非線性的東西。人工肯定辦不到匹配,只有技術去解決。
阿里媽媽是怎么做的呢?從整個技術分析來看,阿里媽媽發現數據其實有兩個很重要的特點,第一個特點叫稀疏性,第二個特點是結構化。這樣兩個特性,是推廣主所看不到的,但阿里媽媽在技術上需要解決的重要問題。
于稀疏性而言,每天阿里媽媽要給數據的用戶實時預估每天看了推廣的點擊率,那怎么描述推廣點擊率呢?用特征來描述。如用戶是什么用戶,推廣是什么推廣。實際的模型里,會有超過10億的特征,某些場景下甚至達到百億級量級的特征。同時,阿里媽媽用來預測的樣本會達到千億量級。所以,稀疏性是這個一個問題的最大特性。
結構化就非常好理解,因為每天每個用戶登陸淘寶的時候,會看到不止一條推廣,會看到很多條推廣。但是對于所謂模型看到用戶來說,用戶是同一個用戶。假設說有兩個用戶,用戶1和用戶2,用戶1可以看到三條推廣,用戶2看到兩條推廣。阿里媽媽把他們組織起來成為樣本,按照這個方式組織的時候,所有的樣本每天訓練一個模型,所需要的樣本需要高達100或者1000的TB,這是非??植赖牧考?。
通過結構化壓縮了之后可以做什么事情呢?知道用戶1是同個用戶每天看到三條推廣,只要記錄一次,說用戶1以及后面看到的推廣是A1、A2、A3就可以了,這樣使得整個樣本的存儲量壓到1—2個數量級以下,現在的模型都可以在幾個TB到10個TB這個量級,輕松完成訓練。
智能營銷最大的困難在模型
數據很容易理解,阿里媽媽有全域的數據,淘寶天貓購物數據、社交數據,位置數據等等。數據只是一個人的材料,把材料加工、分析出來,才能形成用戶特征,這個加工過程要靠數據算法完成。
模型挑戰
在業界,如谷歌、臉譜、騰訊、百度等都會有一些解法,阿里媽媽稱之為傳統解法,線性模型+人工智能工程。什么叫線性模型+人工特征工程呢?因為數據特別大,在技術有限的情況下只能用線性模型做預測,但用戶點不點推廣是高度非線性的,跟用戶看到的場景,看到推廣長什么樣,跟當時的心情和天氣都很有關系,線性模型又無法做到。于是就把人得的經驗放進去,形成了人+機器做的解決方案。問題是,這不僅費力,而且不可能把所有解決方案做出來,結構也非常龐大,迭代起來比較慢。
阿里媽媽的解法更加優雅和智能,在特征方面沒有引入人的規則去設計,而是把用戶的原始特征,如歷史上表現出來的行為和興趣,以及推廣主的推廣體系類目是什么,兩者提取出來。然后把所有任務交給模型,讓模型從大量的數據里面去自動挖掘出來,什么樣的組合模式是最有效的,什么樣的組合模式是最有可能點擊。這是最重要一個部分,也是整個人工智能背后最核心、最難的一點。
同http://www.114px.com/course/524180.html
時整個數據也充分利用了結構化特點,一方面大幅度降低存儲,同時使得整個計算可以每天完成一次模型更新,甚至幾小時完成一次模型更新。
人工智能的能力
在2012年,阿里媽媽就自主研發,并且提出了一個全新的模型,叫分片線性模型。這個模型想要解決的事情很簡單,既然有這么大量的數據,且數據背后的規律足夠非線性,那么有沒有方法解決得更好一點呢?
當然是可以的,舉一個直觀的例子,比如說想去判定一下,一個登陸淘寶頁面的用戶,比如我是男還是女,有人問,我明明是個男性用戶,為什么要判定男性呢,很可能我最近一段時間是幫太太在買東西,或者我太太用了我的帳號登陸淘寶買東西,因此需要根據行為判斷是男性還是女性用戶,或者購物意圖是男性還是女性。
從2014年以后,我們陸陸續續會有一些升級版本,第一個版本,當我們意識到這個數據越來越大的時候,剛才一直說多結構化特性,做了第一步優化,要看這個用戶的購買概率、轉化概率、購買概率。第一部分我去描述用戶,第二部分描述推廣。先把用戶從10維空間投影到20維空間去,在這個空間里面我計算他們之間的所謂相關性和點擊率的概率,這是相當容易的事情。所以結構化這里面,除了大幅度降低整個計算,另一方面也是引入了人類一部分專家知識概念在里面,幫助大家學習。這是第一個,引入了所謂結構正則這樣一個概念。
第二點引入了模型級聯。一個模型可能不一定做得好,我們讓多個模型進行工作協同。所謂模型級聯,通過多個模型的結果匯總起來變得更好。如果關心技術發展的同學,尤其是關心整個營銷和推廣發展的同學,可以知道,在今年年初的時候,谷歌大概提出了一套叫外聯的Deep Learing這樣一套方法,跟我們幾乎差不多,只不過我們是兩年以前就提出來了。
剛才是講了整個比較數學形式化的算法是什么樣子,在生態環境里面,實現一套非常大規模的實踐來支撐這樣的模型,達到每天甚至每幾個小時完成一次訓練的能力。以定向推廣主要的模型來看,我們用了幾億的特征,幾十億的參數,幾百億的樣本,在線一百多臺機服務器大概在幾個小時就完成模型更新,從而使得預測和迭代會更加準確。