匯集移動廣告行業(yè)熱點資訊和變現(xiàn)指南,激發(fā)移動應(yīng)用廣告變現(xiàn)增長無限可能!
【小編提醒】芒果聚合廣告平臺,為開發(fā)者提供高效、便捷的廣告變現(xiàn)方案,一鍵接入穿山甲、快手、優(yōu)量匯、百青藤等多家廣告聯(lián)盟,支持開屏、banner、插屏、信息流、激勵視頻等多種廣告形式,配備專業(yè)廣告優(yōu)化師精細化運營管理,幫助APP\小程序開發(fā)者優(yōu)化每月>20%的增長收益,立即體驗!
【熱門產(chǎn)品】APP廣告變現(xiàn)收益測算 | 廣告變現(xiàn)方案
【熱門閱讀】APP開發(fā):APP商業(yè)化變現(xiàn)的6大常見模式

互聯(lián)網(wǎng)時代,網(wǎng)絡(luò)方便了人們生活的同時,海量的網(wǎng)絡(luò)數(shù)據(jù)信息也成為潛力巨大的價值資源。尤其對營銷者來說,當前企業(yè)擁有的數(shù)據(jù)已經(jīng)不足以支撐其日益精準、高效的營銷需要。因此,從互聯(lián)網(wǎng)這個龐大的非結(jié)構(gòu)化數(shù)據(jù)庫中有針對性的采集、提煉和分析出有價值的信息,已成為其洞察消費者、制定正確營銷策略的迫切訴求。
基于此,廣告聯(lián)盟推出“頁面關(guān)鍵詞”提取技術(shù),利用爬蟲抓取用戶瀏覽頁面行為,再通過算法快速的把不規(guī)則頁面進行結(jié)構(gòu)化處理,從而進一步挖掘出有價值的數(shù)據(jù)來指導(dǎo)廣告主進行精準投放。
“頁面關(guān)鍵詞”提取的核心價值
1、提高人群畫像的精準度和豐富性
數(shù)字營銷時代,廣告從媒介購買轉(zhuǎn)為對受眾購買的階段,精準營銷漸成主流。而精準營銷的核心是用戶畫像。所謂用戶畫像,即通過用戶線上瀏覽行為、搜索行為、購物行為等,來勾勒出一個用戶的商業(yè)全貌,以幫助廣告主從廣泛的受眾中精準定位目標人群。而廣告聯(lián)盟“頁面關(guān)鍵詞”提取技術(shù),正是基于全方位整合用戶網(wǎng)上瀏覽頁面行為以后,提取關(guān)鍵詞來高度概括頁面主題,進而細粒度地推斷、刻畫出受眾對某件事、某領(lǐng)域的興趣程度,甚至反映受眾的真實三觀。從而提高人群畫像的精準度和豐富性,更好的滿足廣告主對人群數(shù)據(jù)采集和洞察的需求。
2、根據(jù)頁面內(nèi)容做廣告定向投放
試想一下,最近你的新房亟待裝修,當你正在瀏覽一篇《菜鳥必看裝修攻略》的時候,正好在頁面下方看到某家裝品牌推送的綠色環(huán)保涂料產(chǎn)品廣告,這是不是會戳中你的 g 點,甚至引起你的購物沖動?廣告聯(lián)盟“頁面關(guān)鍵詞”提取技術(shù),正是為后期廣告聯(lián)盟dsp 進行“頁面關(guān)鍵詞”定向投放做準備。即通過分析每個頁面的文字、語言、主題、結(jié)構(gòu)等元素,提取關(guān)鍵詞,再將企業(yè)的推廣信息投放在具有對應(yīng)關(guān)鍵詞的受眾當前瀏覽頁面上。諸如上例,某家裝企業(yè)為其產(chǎn)品設(shè)定了“裝修”關(guān)鍵詞,系統(tǒng)會在所有具有該關(guān)鍵詞的網(wǎng)頁上展示該客戶的廣告。
“頁面關(guān)鍵詞”提取的實施步驟
備注:在實際操作過程中,“頁面關(guān)鍵詞”提取技術(shù)的流程和應(yīng)用到的算法復(fù)雜且高深,小編在下文只選取其中幾種算法做個入門級介紹,以期讓讀者對該技術(shù)有個初步認知和了解。
第一步:正文提取
如果把完成“關(guān)鍵詞”提取比作烹制一道美味菜肴,那可以說:正文提取則是做菜前的必需步驟選菜。因為再出色的廚師也無法將帶有黃葉、爛葉和泥巴的菜做成美味。因此,能不能高效、準確的將一個頁面的正文抽取出來,是影響后續(xù)提取關(guān)鍵詞的首要前提。
如何提取正文?一種“基于行塊分布函數(shù)的通用網(wǎng)頁正文抽取”算法,可以實現(xiàn)較好的效果。眾所周知,大多數(shù)網(wǎng)頁中除了包含正文外,還包含許多噪聲信息,如網(wǎng)站的導(dǎo)航信息、相關(guān)鏈接和廣告以及一些腳本語言等。而行塊分布算法可以對抓取回來的頁面進行清洗、去噪和結(jié)構(gòu)化分析,進而高效、準確地定位頁面正文。
第二步:分詞處理
提取出正文以后,在進行文本主題提煉之前,有一個步驟必不可少,即要先對文檔進行分詞處理。所謂的分詞,就是將連續(xù)的字序列按照一定的規(guī)范重新組合成詞序列的過程。分詞是后續(xù)進行文本挖掘的基礎(chǔ),即對于一篇文章,成功的進行分詞,才可以達到電腦自動識別文章內(nèi)容含義的效果。
現(xiàn)有分詞算法種類繁多,而我們重點應(yīng)用的是實驗證明出效果更好、錯誤率更低的“逆向最大匹配算法”。即從句子末尾開始處理,每次匹配不成功時去掉前面的一個漢字。
算法應(yīng)用思路:
(1)循環(huán)的讀入每一個句子s;
(2)設(shè)句子的字數(shù)為n;
(3)設(shè)置一個最大詞長度,即要截取的詞的最大長度max;
(4)從句子中取n-max到n的字符串subword,去詞庫查找是否有該詞。如果有就走5,沒有就走6;
(5)記住subword,從n-max付值給n,繼續(xù)執(zhí)行4,直到n=0;
(6)將max-1,再執(zhí)行4。
舉個栗子:
輸入例句:s1=“裝修省錢小竅門” ;
定義:最大詞長maxlen=3;s2= “”;分隔符 = “/”;
假設(shè)存在詞表:…,裝修,省錢,小竅門,…;
逆向最大匹配分詞算法過程如下:
(1)s2=“”;s1不為空,從s1右邊取出候選子串w=“小竅門”;
(2)查詞表,“小竅門”在詞表中,將w加入到s2中,s2=“小竅門/”,并將w從s1中去掉,此時s1=“裝修省錢”;
(3)s1不為空,于是從s1左邊取出候選子串w=“修省錢”;
(4)查詞表,w不在詞表中,將w最左邊一個字去掉,得到w=“省錢”;
(5)查詞表,“省錢”在詞表中,將w加入到s2中,s2=“ 省錢/ 小竅門/”,并將w從s1中去掉,此時s1=“裝修”;
(6)查詞表,“裝修”在詞表中,將w加入到s2中,s2=“ 裝修/ 省錢/ 小竅門/”
并將w從s1中去掉,此時s1=“”;
(7)s1為空,輸出s2作為分詞結(jié)果,分詞過程結(jié)束。
第三步:關(guān)鍵詞提取
如何知道用戶興趣點、關(guān)注點在哪里?我們需要分析出文章的主題,即知道用戶到底“看了什么”!那么,完全不加以人工干預(yù),如何才能準確做到提取出頁面關(guān)鍵詞,概括主題特征?應(yīng)用 tf-idf,一種用于資訊檢索與數(shù)據(jù)挖掘的常用加權(quán)技術(shù)算法。
這種算法通過計算 tf,即詞頻,和 idf,即逆文檔頻率以后,用 tf*idf 得到了一個詞的 tf-idf 值。此值越大,代表某個詞對文章的重要性越強。最后,選取排在最前面的幾個詞,來作為文章的關(guān)鍵詞。
算法應(yīng)用思路:?
計算詞頻
例:假如一篇文件的總詞語數(shù)是100個,而詞語“裝修”出現(xiàn)了3次,那么“裝修”一詞在該文件中的詞頻就是3/100=0.03。
計算逆文檔頻率
例:如果“裝修”一詞在1,000份文檔出現(xiàn)過,而我們歷史積累的文檔總數(shù)是10,000,000份的話,其逆向文件頻率就是 log(10,000,000 / 1,000)=4。
計算tf-idf
例:tf-idf 值為 0.03 * 4=0.12。
“頁面關(guān)鍵詞”提取的實際效果
目前,廣告聯(lián)盟通過爬蟲技術(shù),以每日抓取主流網(wǎng)站 500 萬+ 優(yōu)質(zhì)頁面的量級開展頁面關(guān)鍵詞提??;并進一步將關(guān)鍵詞進行行業(yè)分類標簽管理,詞庫已包羅 10萬+ 熱頻詞。在當下精準化、個性化推薦大行其道的時候,廣告聯(lián)盟“頁面關(guān)鍵詞”提取技術(shù)以全面、準確、真實的用戶瀏覽行為數(shù)據(jù)信息為基礎(chǔ),實現(xiàn)了全景式、豐富化用戶畫像描述的同時,也幫助廣告主和代理商深入洞悉受眾瀏覽行為及場景,讓廣告展示的時機剛剛好,從而減少對用戶的干擾。從目前的運營反饋結(jié)果來看,將該技術(shù)應(yīng)用到實際廣告投放中,到達率可提高 20% 左右,全面提升了展示廣告的效果!
熱門搜索:芒果聯(lián)盟 | APP廣告變現(xiàn)方案
芒果移動Mgmobi,一站式APP流量廣告變現(xiàn)平臺,接入快,收益高,專人優(yōu)化,助力開發(fā)者APP高效廣告變現(xiàn)!收益提高20%-80%
相關(guān)詞條:廣告 | 安卓App廣告聯(lián)盟 | APP發(fā)版 | 小程序UI框架 | APP運營 | 短劇資源一手渠道對接 | App中加入廣告 | APP廣告變現(xiàn) | APP變現(xiàn)知識
免責聲明:本站文章來源于互聯(lián)網(wǎng),文章為作者獨立觀點,不代表本站立場。如有侵權(quán),請聯(lián)系我們。