【寫在前面】向量的概念講了快一年了,向量在今後大家玩搜尋的過程中地位越來越重要,就如當年的七天螺旋做為核心基礎;我說了向量不是我造的詞,向量召回算法也是實實在在的存在的,不要被無知限制你的思考。多問下度娘或者讀一些我推薦給大家的書,慢慢就知道怎麼回事了,你跟不上時代變化,并不代表時代不變。
淺談搜尋的發展,第一代搜尋就是類目的發展,隻要你産品放對類目放對葉子類目就有流量。
第二代開始以關鍵詞為主發展,主要是機器統計時代,每個關鍵詞背後挂靠坑産,誰的坑産大,排名就高。
第三代搜尋以統計的機器學習方法為主,基于使用者查詢,召回,L2R這三個過程,一定程度上提升了使用者擷取的效率,但是這種服務模式仍然是把一系列資訊抛給使用者,使用者最終還是需要資料進行篩選甄别才能拿到自己最需要的資訊,是以第三代搜尋服務在效率角度上都有缺陷。
伴随着Web技術的發展,人類先後經曆了以網頁的連結為主要特征的Web1.0時代到以資料的連結為主要特征的Web2.0時代,目前Web技術正向Web之父Berners Lee在2001年提出的基于知識互聯的語義網絡也就是向Web3.0時代邁進。
正文
什麼是語義網絡:
語義網絡的目标是建構一個人與機器都可以了解的網際網路,使得網絡更加智能化,解析使用者查詢的基礎上,提高更加精準和快速的服務。
做到這一點,就需要把所有線上的文檔構成的資料都進行處理并存放在一起,形成一個大,可用的資料庫。
做到這些就需要強大的資料能力和Web内容智能分析能力,首先就要對這些Web資料進行語義标注,但是由于Web資料體量巨大和異質異構,領域範圍大特點,是以如何自動給web的網頁内容添加合适的标簽就成了技術痛點之一,加上對已經标注過的Web資料,機器如何進行思考和推理也是迫切解決的問題。
由于上述技術問題的存在,所有在語義網絡提出來的10年前并沒有大的應用,但是随着算法的強大加上資料處理的能力大大提高,加上10年的研究過程中的積累沉澱了成熟的本體模型模組化和形式化知識表達方法和網際網路本體語言為後續知識圖譜的出現奠定了基礎。
知識圖譜的概述:
知識圖譜是結構化的語義知識庫,用于以符号形式表述實體世界中的概念及其的關系。
其基本組成機關是“實體-關系-實體”三元組,以及實體及其相關屬值對,實體間通過關系互相連結,構成網狀的知識結構。
從定義中可以看到,知識圖譜是一個語義知識庫,具備足夠的領域知識,其最主要的成分就是三元組。
三元組是表示實體之間的語義關系,關系都是帶方向和明确語義的。
上述概念引用于《阿裡巴巴B2B電商算法實戰》一書,作者是阿裡巴巴官方CBU技術部。
為什麼一直強調搜尋邏輯已經徹底變了,變在于不在是單一的關鍵詞權重排名,不再是單一的坑産權重。
搜尋的核心從文本相關性比對,行為資料比對,到語義向量召回和場景召回。
背後就是消費者對貨品的需求逐漸轉化為對場景的需求。
通過場景重新定義貨品的需求産生,這就需要對使用者和行為資料及商品知識的深度挖掘,
這可能很難了解,我給大家舉個例子:
以前搜尋系統搭建的資料庫都是基于關鍵詞和商品的,現在語義網絡的産生就是通過知識圖譜搭建語義知識庫和商品的資料庫。
也就是說現在的搜尋背後具有兩個資料庫的,一個是關鍵詞統計的機器學習算法,另一個是語義知識資料庫,根據語義召回推薦。
語義知識庫,肯定又有很多同學懵逼了。
憤怒的同學可能又說我胡谝亂造“詞”。
不妨去買本我上述提到的《阿裡巴巴B2B電商算法實戰》一書看看。
看不懂是另一回事,但是足以證明官方就是那麼做的,你了解或者看不懂那是你自己:“知識面”的問題,是以多看看書,多學習一下,不要天天先射箭再标靶給自己瞎編一套理論出來。
也就是說當我們搜尋關鍵詞的時候核心就是識别意圖的精準性,以前就是基于使用者身份和行為資料偏好來,但是召回的商品還是需要使用者自己通過資料進行篩選甄别并沒有完全做到“精準識别購物意圖”,但是搭建語義知識庫資料庫後就不一樣了,根據語義召回就是向量召回。
向量就是标簽的延續,标簽的存在就是還原消費者的真實購物意圖。
向量解決的是語義相似度的問題。
是以語義相似度,其實就是向量的問題。
向量召回是一種算法,算法的背後就是語義相似度,解決的問題就是識别使用者精準需求。
咱們最熟悉的補關鍵詞坑産隻能解決詞召回的問題
也就是符合了分詞權重和相關性問題,但是解決不了語義的問題,是以召回的人群不精準,這個時候如果碰關鍵詞太多,系統就把刷手當作使用者進行身份識别,根據行為軌迹資料進行判斷偏好進行召回推薦。
你補來的流量都是和刷手相似的人群知道為什麼越刷越不精準了嘛?特别是現在是實時購物鍊條推薦,會根據實時的行為資料偏好進行推薦。
原始人群不精準,推薦的人群會更不精準就就進入了死循環。
很多同學說我看到有很多人刷關鍵詞坑産也刷起來了啊,這個我不否認,能做到的基本都是對爆款資料模型了解非常透徹的,加上一般前期會開車,用開車主動給單品打标入池,用刷非搜的方式坑産倒逼搜尋被動給單品打标入池,如果用這種兩種入池方式入池比較精準,加上後面的真實訪客點選大于虛假訪客的點選量,行為資料的偏好就會改變。
其實就是一個占比問題,如果真實的訪客很難大于虛假的,然後推薦式搜尋流量又沒有打開刷遞增支付買家人數就是形式上的資料好看,基本第四周開始掉慢慢會掉完。
這背後還是真實點選量的正回報的占比問題。
要解決這個核心就要布局好“語義向量詞”就要刷對關鍵詞的結構,要打開推薦搜尋訪客。
說到底刷什麼關鍵詞真的不重要,刷對語義和結構才是根本。
就拿直通車來說,直通車是最講究文本相關性的,
可是現在你把半标題和全标題寫進去或者同義詞,錯别字的關鍵詞放進去也會有展現。
這就充分說明現在的直通車給展現,不隻單單講究相關性比對,更注重語義推薦。
隻要有文字,系統就會從語義知識庫資料庫給推薦相似的語義進行召回。
這是以往不可能發生的事情,以前是隻要這個關鍵詞沒有人搜尋就不會有展現。
有的同學說這個賬戶權重有關,這點确實也有,但是最根本的是現在建構了語義網絡知識畫譜的語義知識庫,才會根據語義進行召回推薦,
說其根本是這幾十年算法的更新和沉澱的曆史行為資料的體量足夠大,才會讓系統更新發展到語義召回。
現在真的是已經到了從貨品需求到場景的需求。
從統計的機器學習算法到真正的智能化場景語義推薦甚至跨類目商品搭配和推薦。
是以大家不要隻停留在以往的搜尋認知體系裡。
為什麼一直強調搜尋底層邏輯徹底改變,但是大家就是感覺不出來,隻是感覺難做。
難做的背後就是對底層邏輯的不了解。
我自己也想為什麼大家感覺不到變化。
其實從營運操作端,你底層邏輯再怎麼改變,我的營運手段還是那幾招。
刷,開車,優化關鍵詞,如何寫标題基本就這幾點,是以你将底層邏輯怎麼變還是需要通過這幾個手段去做,确實不假。
操作手段沒變,将什麼底層邏輯改變就顯得蒼白,還不如你告訴我怎麼刷,怎麼開車,怎麼優化标題和優化關鍵詞來的實在。
我總結了一下搜尋底層邏輯改變我從營運端做的一些改變。
第一:産品布局和打商品的節奏不一樣了,以前以單連結推爆款為主,現在是多連結分層拿流量運作。
第二:标題的寫法上确實有了很大的改變,以前是把屬性盡可能堆積,讓分詞豐富盡可能拿多關鍵詞流量,現在基本都是以詞系布局,玩一個向量或者鎖定展現範圍聚焦一個向量來成交,讓系統推薦。是以短标題,還有其他結構形式的标題開始出現。
第三:關鍵詞優化,以前優化圍繞着關鍵詞搜尋人氣來,結合線上商品數玩弱競關鍵詞,現在優化的是關鍵詞的組合結構和關鍵詞背後的語義精準度。
第四:最大的感觸就是節點問題,以前玩爆款講究什麼 權重更新點,3,5,7,現在的節點更多,更細大部分同學就死在節點的處理上沒有引導對。
第五:直通車,以前直通車為搜尋服務做方向性一直詞系,關鍵詞越多越好,拉升搜尋;現在是關鍵詞越少越好更看重給單品主動“打标”,和引導“向量”的問題。
以上是沒有付費搜尋很難漲,現在這個局面被打破 這樣可能隻是暫時性的你會發現很多連結不開車也會來很大的搜尋流量了。
但是我的觀點是,是好品付費越來越少是必然方向,好産品就應該減少推廣費。第六:高流量價值閉環體系會更深入人心,解決好向量問題就解決了流量的方向性,精準性,語義精準度的問題,高流量價值,價值會更高。
我寫這篇文章可能又有相當同學看不懂,2018年我們開始講标簽何嘗不是一樣境地呢?
但事實又如何?
你可以懷疑,但是不要放棄驗證和學習的勇氣。
憤怒往往來自于無知,或者無形中碰觸了别人的利益。
仁者見仁智者見智,認同我觀點的不妨參與下我們9月15号的線下課,徹底搞明白向量召回和語義向量詞布局是怎麼回事。
還懷疑有語義召回推薦這回事,看看你家有沒有“小度”和“小愛”,它們是怎麼識别和推薦的。
如果喜歡我的文章轉發就是最大的支援。
本文由七掌櫃首席營運師--鬼哥提供(微信:qdbz888)僅代表個人觀點!了解更多檢視更多案例請看朋友圈。
報名啦,
開課時間2021年9月15号
地點:廣州
廣州聖豐索菲特大酒店(中國廣州市天河區廣州大道中 988 号)
提前安排行程。
費用:29800/一人(食宿自理)
多人享優惠(食宿自理)
以往線下會員複訓隻需交1萬,送核心資料,組織公司内訓享特價待遇
付款方式:付9800定金先線上學習最新線上課程向量召回爆搜玩法1.0,提前賺回學費加強基礎理論學習。參加向量召回爆搜玩法的同學如不來參加線下定金不退作為線上會員學習向量召回爆搜玩法的學費。
注:如,所有線上會員想參加線下課程隻需補差價2萬。線下會員複訓隻需交1萬。
掃鬼哥二維碼報名

聽免費會員課程
标簽疊加玩法6.0首次揭秘 可以點選購買觀看