本發(fā)明涉及語(yǔ)義網(wǎng)絡(luò)技術(shù)領(lǐng)域,具體涉及一種改進(jìn)的聚類算法實(shí)現(xiàn)搜索引擎關(guān)鍵詞優(yōu)化。
背景技術(shù):
搜索引擎對(duì)提高網(wǎng)站訪問量起著至關(guān)重要的作用,由于用戶在互聯(lián)網(wǎng)檢索信息,通常的手段是使用搜索引擎進(jìn)行搜索。因此,在網(wǎng)絡(luò)推廣領(lǐng)域,SEO(Search Engine Optimization,搜索引擎優(yōu)化)就具有了舉足輕重的作用,從而備受廣大網(wǎng)站的重視。搜索引擎優(yōu)化技術(shù)包括黑帽技術(shù)和白帽技術(shù),其中黑帽技術(shù)表示違反搜索引擎優(yōu)化規(guī)則的惡意優(yōu)化技術(shù),在關(guān)鍵詞優(yōu)化技術(shù)中表現(xiàn)為在頁(yè)面中堆砌關(guān)鍵詞或放置無(wú)關(guān)關(guān)鍵詞以提高在搜索引擎中的排名,目前各搜索引擎已經(jīng)引入相關(guān)技術(shù)和規(guī)則對(duì)使用黑帽技術(shù)的網(wǎng)站進(jìn)行懲罰;白帽技術(shù)則表示被搜索引擎認(rèn)可的優(yōu)化技術(shù)。真正的SEO是通過采用易于搜索引擎索引的合理手段,使網(wǎng)站對(duì)用戶和搜索引擎更友好(Search Engine Friendly),從而更容易被搜索引擎收錄及優(yōu)先排序。一個(gè)商業(yè)網(wǎng)站以其核心關(guān)鍵字在主流搜索引擎中獲得自然排名優(yōu)先,在今天的商業(yè)社會(huì),有著非比尋常的價(jià)值。因此關(guān)鍵字也常被稱為是整個(gè)搜索應(yīng)用的基石。目前國(guó)內(nèi)外對(duì)關(guān)鍵詞優(yōu)化的理論研究和技術(shù)應(yīng)用比較多,但暫未提出一個(gè)有效的方法來(lái)簡(jiǎn)化關(guān)鍵詞分析流程,也沒有一個(gè)完善的機(jī)制來(lái)管理關(guān)鍵詞優(yōu)化策略和進(jìn)度?;谏鲜鲂枨?,本發(fā)明提供了改進(jìn)的聚類算法實(shí)現(xiàn)搜索引擎關(guān)鍵詞優(yōu)化。
技術(shù)實(shí)現(xiàn)要素:
針對(duì)于關(guān)鍵詞優(yōu)化實(shí)現(xiàn)搜索引擎優(yōu)化的技術(shù)問題,本發(fā)明提供了改進(jìn)的聚類算法實(shí)現(xiàn)搜索引擎關(guān)鍵詞優(yōu)化。
為了解決上述問題,本發(fā)明是通過以下技術(shù)方案實(shí)現(xiàn)的:
步驟1:根據(jù)企業(yè)業(yè)務(wù)確定核心關(guān)鍵詞,利用搜索引擎搜集相關(guān)關(guān)鍵字,這些關(guān)鍵字在搜索引擎中有相應(yīng)數(shù)據(jù)項(xiàng),如本國(guó)每月搜索量、競(jìng)爭(zhēng)程度和估算每次點(diǎn)擊費(fèi)用(CPC)等
步驟2:結(jié)合企業(yè)產(chǎn)品和市場(chǎng)分析,篩選降維上述搜索到的相關(guān)關(guān)鍵字集合;
步驟3:針對(duì)篩選降維后的關(guān)鍵詞集合,通過搜索引擎搜索關(guān)鍵詞對(duì)應(yīng)的頁(yè)面,這里記錄首頁(yè)網(wǎng)頁(yè)數(shù)和總搜索頁(yè)面數(shù),即每個(gè)關(guān)鍵詞由五維向量再降維為四維的。
步驟4:利用改進(jìn)的聚類算法,對(duì)上述關(guān)鍵詞進(jìn)行聚類處理,其具體子步驟如下:
步驟4.1:利用基于ε領(lǐng)域的k-means算法初始化簇;
步驟4.2:初始化每一個(gè)ε領(lǐng)域的目標(biāo)函數(shù)從數(shù)據(jù)對(duì)象集合D中按下述判定條件選擇k個(gè)初始簇中心;
步驟4.3:對(duì)每類關(guān)鍵詞i(i∈(1,2,…,m))進(jìn)行重新分配,按概率函數(shù)p(i)選擇聚類中心j′;
步驟4.4:根據(jù)判定函數(shù)Δ(g)的結(jié)果,重新計(jì)算各簇中心;
步驟4.5:如果簇中心發(fā)生變化,則轉(zhuǎn)到步驟4.2,否則迭代結(jié)束,輸出聚類結(jié)果。
步驟5:根據(jù)企業(yè)具體情況,綜合關(guān)鍵詞效能優(yōu)化和價(jià)值率優(yōu)化,選擇合適的關(guān)鍵詞優(yōu)化策略達(dá)到網(wǎng)站優(yōu)化目標(biāo)。
本發(fā)明有益效果是:
1,此算法可以精簡(jiǎn)關(guān)鍵詞分析流程,進(jìn)而減少整個(gè)網(wǎng)站優(yōu)化工作量。
2,此算法的運(yùn)行時(shí)間復(fù)雜度低,處理速度更快。
3、此算法具有更大的利用價(jià)值。
4、能幫助網(wǎng)站在短時(shí)間內(nèi)快速提升其關(guān)鍵詞的排名。
5、為企業(yè)網(wǎng)站帶來(lái)一定的流量和詢盤,從而達(dá)到理想的網(wǎng)站優(yōu)化目標(biāo)。
6、此算法分類結(jié)果的準(zhǔn)確度更符合經(jīng)驗(yàn)值。
7、此算法更簡(jiǎn)便有效。
8、數(shù)據(jù)處理的效果更好。
附圖說明
圖1改進(jìn)的聚類算法實(shí)現(xiàn)搜索引擎關(guān)鍵詞優(yōu)化結(jié)構(gòu)流程圖
圖2改進(jìn)的聚類算法在聚類分析中的應(yīng)用流程圖
具體實(shí)施方式
為了解決關(guān)鍵詞優(yōu)化實(shí)現(xiàn)搜索引擎優(yōu)化的技術(shù)問題,結(jié)合圖1-圖2對(duì)本發(fā)明進(jìn)行了詳細(xì)說明,其具體實(shí)施步驟如下:
步驟1:根據(jù)企業(yè)業(yè)務(wù)確定核心關(guān)鍵詞,利用搜索引擎搜集相關(guān)關(guān)鍵字,這些關(guān)鍵字在搜索引擎中有相應(yīng)數(shù)據(jù)項(xiàng),如本國(guó)每月搜索量、競(jìng)爭(zhēng)程度和估算每次點(diǎn)擊費(fèi)用(CPC)等。
步驟2:結(jié)合企業(yè)產(chǎn)品和市場(chǎng)分析,篩選降維上述搜索到的相關(guān)關(guān)鍵字集合;
步驟3:針對(duì)篩選降維后的關(guān)鍵詞集合,通過搜索引擎搜索關(guān)鍵詞對(duì)應(yīng)的頁(yè)面,這里記錄首頁(yè)網(wǎng)頁(yè)數(shù)和總搜索頁(yè)面數(shù),即每個(gè)關(guān)鍵詞由五維向量再降維為四維的,其具體計(jì)算過程如下:
這里相關(guān)關(guān)鍵詞個(gè)數(shù)為m,既有下列m×5矩陣:
Ni、Ldi、CPCi、NiS、NiY依次為第i個(gè)關(guān)鍵詞對(duì)應(yīng)的本國(guó)每月搜索量、競(jìng)爭(zhēng)程度、估算每次點(diǎn)擊費(fèi)用(CPC)、首頁(yè)網(wǎng)頁(yè)數(shù)、總搜索頁(yè)面數(shù)。
再降維為四維,即
Xi∈(1,2,…,m)為搜索效能,Zi∈(1,2,…,m)為價(jià)值率,即為下式:
步驟4:利用改進(jìn)的聚類算法,對(duì)上述關(guān)鍵詞進(jìn)行聚類處理,其具體子步驟如下:
步驟4.1:利用基于ε領(lǐng)域的k-means算法初始化簇。
步驟4.2:初始化每一個(gè)ε領(lǐng)域的目標(biāo)函數(shù)從數(shù)據(jù)對(duì)象集合D中按下述判定條件選擇k個(gè)初始簇中心,其具體計(jì)算過程如下:
上式nε為每一個(gè)ε領(lǐng)域內(nèi)數(shù)據(jù)對(duì)象的個(gè)數(shù),為每一個(gè)ε領(lǐng)域內(nèi)總的緊湊度,α、β分別為數(shù)量nε、緊湊度的影響系數(shù),且α+β=1,其值可以根據(jù)實(shí)驗(yàn)迭代出合適的值。
上式
為空間中的第i個(gè)關(guān)鍵詞向量與其簇中心向量的內(nèi)積。
判定條件如下:
γ為設(shè)定好的閾值,只有滿足上式條件則歸為一簇,則篩選k類出來(lái)。
步驟4.3:對(duì)每類關(guān)鍵詞i(i∈(1,2,…,m))進(jìn)行重新分配,按概率函數(shù)p(i)選擇聚類中心j′,其具體計(jì)算過程如下:
按p(i)值最大選擇對(duì)應(yīng)的聚類中心j′。
步驟4.4:根據(jù)判定函數(shù)Δ(g)的結(jié)果,重新計(jì)算各簇中心,其具體計(jì)算過程如下:
gi∈k為第N次迭代得到的全局目標(biāo)函數(shù),為第N次迭代第j類簇的目標(biāo)函數(shù)。
Δ(g)=gi∈kN-gi∈kN-1>0
滿足上式,則重新計(jì)算各簇中心。
步驟4.5:如果簇中心發(fā)生變化,則轉(zhuǎn)到步驟4.2,否則迭代結(jié)束,輸出聚類結(jié)果。
步驟5:根據(jù)企業(yè)具體情況,綜合關(guān)鍵詞效能優(yōu)化和價(jià)值率優(yōu)化,選擇合適的關(guān)鍵詞優(yōu)化策略達(dá)到網(wǎng)站優(yōu)化目標(biāo)。
改進(jìn)的聚類算法實(shí)現(xiàn)搜索引擎關(guān)鍵詞優(yōu)化,其偽代碼過程
輸入:網(wǎng)站提取的核心關(guān)鍵詞,基于ε領(lǐng)域初始化簇,初始化每一個(gè)ε領(lǐng)域的目標(biāo)函數(shù)
輸出:全局目標(biāo)函數(shù)gi∈k的總和最大的k個(gè)簇。