• 正能量網

    向量是什么,向量召回又是什么?

    【寫在前面】這可能是剛關注我們和初步了解我們的同學最想搞明白的問題。在前面也寫了幾篇關于向量和向量召回的文章,大多是從算法和具體運用的角度給大家講解的,很多同學還是不知道向量是干嘛的。今天從問答的方式,再次闡述這個問題。

    正文

    向量是什么?

    答:回答這個問題前要先了解兩個概念:

    什么是標簽:是你一段時間購買完某一類東西后系統給你貼上的標簽;或者對某類產品表明有需求后系統給貼上的。

    標簽只是系統給消費者打上了行為軌跡的一種符號,進行分門別類,那么第一個問題就要搞清楚標簽是干什么的?

    標簽就是一段時間內購買完某一類產品或者表明對某類產品有需求后系統給貼上的一種符號便于分門別類。

    服務于誰?

    標簽是給數據運營人員或者是給數據分析人群看的,也或者說讓大眾更好的理解流量價值通過人群標簽畫像描述精準度。

    簡單點說標簽就是分門別類,服務于數據運營分析人員和大眾消費者理解流量精準度問題,但是你有沒有考慮過系統是不看標簽的!

    標簽有什么作用?

    標簽的作用就是還原消費者真實的購物意圖的過程。

    是讓數據運營人員分析的,而不是判斷系統識別的。

    第二個概念:什么是向量?

    在數學中的概念是指既有大小又有方向上的量,從這個概念中我們可以得到兩個信息:一是方向,二是量。

    方向:就是系統識別意圖判斷滿足什么人群需求成交方向的問題。

    量:就是在這個成交方向上不斷堆積銷量。

    大家都知道現在的算法是基于深度學習的算法:“無論是文本、語言、圖像、時間序列還是消費者特征”,都可以用一組形式如{0.6,0.3,0.7.0.9.........0.19}的實數來表征,這一組實數被稱為特征向量。

    具體來說:大家都知道計算機語言就是萬個0中的一個1;商品被曝光形成的行為數據如點擊,收藏,加購,購買,點擊率,收藏率 加購率,轉化率等數據行為在系統視角背后都是實數值,系統都會收集用Embedding技術生成向量特征。

    實數值是什么?就是點擊量,點擊率,成交量,收藏加購量,歷史點擊率、歷史成交率等等去取值。

    根據查詢詞和用戶行為數據信息背后的實數值生成一個空間向量,這個向量,這個向量就會做為用戶特征和用戶這邊的用戶畫像特征進行級聯最終壓縮出用戶特征,而用戶特征和物品特征得到以后就可以通過內積得到預測值,得到向量特征。

    也就是說,系統會通過商品側和用戶行為軌跡背后的實數值形成的特征向量,來分析用戶識別真正的購物意圖。

    又說到算法上去了,看不懂沒關系你可以這樣理解:

    大家都知道關鍵詞背后是購物意圖和興趣點。

    但是系統識別意圖和人體大腦理解的方式不一樣的,那么怎么讓系統能理解人體大腦看到關鍵詞背后的語義,那么向量解決的是語義精準度的問題。

    因為大腦所說的語義和計算機理解的語義,它不是一回事兒。

    那么我們大腦直接說一個詞語,比如說連衣裙。

    那么直接就知道什么意思了;

    但是系統是通過深度學習的算法:“無論是文本、語言、圖像、時間序列還是消費者特征”,都可以用一組形式如{0.6,0.3,0.7.0.9.........0.19}的實數來表征。這一組實數被稱為特征向量。

    形成的行為軌跡最后都是一些實數值,也就是不管你怎么模仿都是行為軌跡數據,在系統面前任何行為軌跡都是一種實數值,系統就會通過這種數值形成一個向量。

    向量也就相當于計算機語言是識別精準語義背后的精準度的問題。

    向量通過展現量點擊反饋正負樣本來判斷語義精準度告訴成交方向。

    也就是系統真正抓取的本質“是在召回具有相同購物意圖的人群”這個識別意圖過程中系統看的不是什么標簽,標簽也是在識別意圖過程中打標的,系統識別意圖的核心是“成交”主要是背后到底是什么樣的成交方向,決定了這個商品的成交方向,是什么樣的人群受眾,什么樣的人真正會購買,這一切都是通過算法生成特征向量,通過向量召回來確認“成交方向”,向量召回就是在召回具有相同購物意圖成交方向的人群。

    向量召回是什么?

    向量召回本質就是在召回具有相同購物意圖的人群,向量既有方向又有大小的量;方向就是成交方向--可以是屬性,可以是風格、可以是修飾詞、只要滿足既定需求市場能成交就是精準意圖、

    大小就是在這個成交方向上放大數據做到子分列中的前十。

    向量召回就是一種搜索向量索引和關鍵詞索引一樣屬于有種算法。

    講到這是否能大概理解向量了,如果你能理解標簽就可以把向量當做標簽理解,但是我們一直強調向量是標簽的延續,標簽可以模仿軌跡打標欺騙系統,但是向量是基于深度學習的算法,通過多模態、多目標的生成特征向量,你能干預一個方面但是你改變不了多模態和多目標下的向量特征,系統真正識別意圖也是通過“向量”特征來完成的。

    總結一句話“標簽是給運營人員看的,向量才是系統真正考核的”;

    向量召回機制下如何做排名?

    如果你滿腦子里還是坑產邏輯思維、還是螺旋遞增;還是信奉碰關鍵詞就有權重有排名,你是很難理解向量召回機制的。

    這些東西用對了時機和碰對了還是很有用這一點我不否認,但是做排名的底層邏輯是完全不一樣的。

    召回機制下是匹配和不匹配,展現和不展現的問題,只要匹配就一定會展現,但是展現能不能形成訪客那是另一個問題,如果你想拿到展現就必須先確定“人群”,

    不敢是坑產思維還是召回機制下都是先確定人群,所以現在講“入池”經常講的人群不對也是這個問題,因為入池的概念就是“成交樣本”,如果按照標簽理論來講人群標簽都是亂的還談什么精準性,但是各位標簽是可以模仿的,但是消費者身上的真實消費購物意圖必須用數據算法而深度挖掘和確認的這一點是向量完成的。

    也就是說你人群標簽沒問題,人群精準度不高的問題是實時存在的。

    做對標簽又有什么用,沒有抓取到真正有購物意圖且是這部分人群標簽畫像的人群都是“無用”的。

    為什么講向量,為什么想:“成交樣本模型”能不能GET點什么?

    標簽這個東西可以“掩耳盜鈴”只要刷的都在做這件事情,在標簽理論下標簽可以被模仿的思路下堅信自己就是對的,自己其實就是在“畫地坐牢”認識沒上去而已。

    有個同學問了一個問題:“向量召回是不是根據查詢關鍵詞+客戶身份識別,分析出哪些商品可能成交概率最大,把這些商品召回了,然后再進行排序”。

    答:可以那么理解但是不夠嚴謹,因為只要是通過查詢詞和通過身份識別這賴永兩類信息識別意圖出來,用戶肯定就有這方面的購物意向,那么定會被召回,理論上看就會成交,因為這個召回是匹配和不匹配的邏輯,能匹配就說明方向上是精準的,

    系統會通過實時機器學習算法通過大數據預判,和向量特征預判;用戶需求不是造假的。

    為什么說現在不要你刷單,就是因為你刷單的行為、特別是碰關鍵詞、會讓系統誤判購物意圖的精準性。

    召回,召回,什么叫召回,必須要有“樣本”吧,只有符合你設定的或者系統精準識別意圖的。

    根據相同相似購物意圖才會召回,才會被曝光,因為進入精排的商品體量就很小了,基本是幾十幾百,這樣的體量下可以忽略排序的概念,只需做到精準匹配沒找到最精準的成交樣本就行了,精排召回排序下幾乎沒有排序那么一說了。

    只有是匹配和不匹配,匹配上了就會曝光,那至于說匹配了,然后曝光不點擊那是你產品力的方面的問題了和成交樣本本身就有問題了。

    召回機制下,一定先做到精準匹配然后再談排序的問題,負責沒有任何意義。

    如果各位現在能理解人群標簽或者理解標簽這個概念。

    給大家總結一下:標簽是給運營數據人員或者是數據調控人員來分析流量價值可視化得,所謂的人群標簽畫像就是把流量可視化,通過標簽描述的畫像特征進行價值優化。

    但是系統它不是根據人群標簽來召回的,系統是根據歷史的實時的用戶行為軌跡數據和在線的和離線的數據,行為數據背后的實數值形成的一個向量,系統是通過詞召回和向量召回的,向量是計算機語言這個精準度要比標簽高高多了。

    標簽可以被模仿打標、可以造假、歸納到一個類別里面,但是向量它是一個實數值而且它的形成需要一定的量的累積,所以說向量這個東西造不了假的而且又是多模態和多目標的,向量比標簽更精準精,一個是給分析數據人員看的,一個是系統根據向量特征召回的。

    如果看懂了,那你就知道現在做真實成交樣本的意義,為什么所有工作都以引導真實成交方向上引導。

    如果喜歡我的文章轉發就是最大的支持。



    本文由七掌柜首席運營師--鬼哥提供(微信:qdbz888)僅代表個人觀點!了解更多查看更多案例請看朋友圈。

    線上會員課程

    鬼式向量召回爆搜閉環玩法V5.0


    流量獲取底層邏輯徹底改變。

    如何玩轉推薦式流量,

    未來方向在哪,如何玩轉新淘寶。

    破圈突圍

    現在正在升級中

    如有需要,報名加群。

    四月十五日(廣州)線下課

    同步預定中.......


    掌控核心技術,帶你永不迷失方向。


    線上會員9800/一期

    轉載自頭條號:七掌柜GJQ。(侵刪)

    本站為注冊用戶提供信息存儲空間服務,非“本站編輯上傳提供”的文章/文字均是注冊用戶自主發布上傳,不代表本站觀點,版權歸原作者所有,如有侵權、虛假信息、錯誤信息或任何問題,請及時聯系我們,我們將在第一時間刪除或更正。站長郵箱(190277521@qq.com)本站是非贏利網站,本網站鄭重提醒注冊用戶:請在轉載、上載或者下載有關作品時務必尊重該作品的版權、著作權;如果您發現有您未署名的作品,請立即和我們聯系,我們會在第一時間加上您的署名或作相關處理。 轉載請注明出處:http://www.ks-zhong.com/article/a774397281362537512.html

    分享:
    掃描分享到社交APP
    發表列表
    請登錄后評論...
    游客 游客
    此處應有掌聲~
    評論列表
    x

    注冊

    已經有帳號?
     1706985308  1706985308  1706985308  1706985308  1706985308  1706985308  1706985308  1706985308  1706985308 
    五月婷婷综合