本發(fā)明涉及語義網(wǎng)絡技術領域,具體涉及新的模型聚類算法實現(xiàn)搜索引擎優(yōu)化技術。
背景技術:
眾多網(wǎng)絡信息豐富了人們的信息來源,也給人們快速獲取信息造成了困擾。搜索引擎精準化、人性化的信息檢索服務被廣大使用者認可。目前不少研究發(fā)現(xiàn),搜索引擎用戶一般只會關注搜索結果頁面中排名靠前的網(wǎng)站,這些網(wǎng)站的點擊率也相對高些。搜索引擎優(yōu)化,簡稱通俗的講是通過對網(wǎng)站整體架構,網(wǎng)頁內(nèi)容、關鍵詞以及網(wǎng)頁內(nèi)的鏈接進行相關的優(yōu)化工作,提高其在特定搜索引擎上搜索結果中的排名,從而提高網(wǎng)站訪問量,最終提升網(wǎng)站的銷售能力或宣傳能力的技術。目前關于搜索引擎優(yōu)化方法的理論研究已較為豐富,如黑帽技術和白帽技術,搜索引擎優(yōu)化策略,分別是域名策略、網(wǎng)頁設計規(guī)劃策略、關鍵詞策略以及鏈接策略。企業(yè)可以根據(jù)自己的搜索引擎優(yōu)化目的,有針對性的采取相應的優(yōu)化方法。通過不斷嘗試,定期更新查看,發(fā)現(xiàn)屬于企業(yè)自身的優(yōu)化方法,使企業(yè)提高自然排名,更好地應對互聯(lián)網(wǎng)大潮的沖擊,從而提高競爭優(yōu)勢。seo歸根結底是關鍵詞的優(yōu)化策略,現(xiàn)今國內(nèi)外對關鍵詞優(yōu)化的理論研究和技術應用比較多,但暫未提出一個有效的方法來簡化關鍵詞分析流程,也沒有一個完善的機制來管理關鍵詞優(yōu)化策略和進度?;谏鲜鲂枨?,本發(fā)明提供了一種新的模型聚類算法實現(xiàn)搜索引擎優(yōu)化技術。
技術實現(xiàn)要素:
針對于關鍵詞優(yōu)化實現(xiàn)搜索引擎優(yōu)化的技術問題,本發(fā)明提供了一種新的模型聚類算法實現(xiàn)搜索引擎優(yōu)化技術。
為了解決上述問題,本發(fā)明是通過以下技術方案實現(xiàn)的:
步驟1:根據(jù)企業(yè)業(yè)務確定核心關鍵詞,利用搜索引擎搜集相關關鍵字,這些關鍵字在搜索引擎中有相應數(shù)據(jù)項,如本國每月搜索量、競爭程度和估算每次點擊費用(cpc)等
步驟2:結合企業(yè)產(chǎn)品和市場分析,篩選降維上述搜索到的相關關鍵字集合;
步驟3:針對篩選降維后的關鍵詞集合,通過搜索引擎搜索關鍵詞對應的頁面,這里記錄首頁網(wǎng)頁數(shù)和總搜索頁面數(shù),即每個關鍵詞由五維向量再降維為四維的。
步驟4:利用新的模型聚類算法,對上述關鍵詞進行聚類處理,其具體子步驟如下:
步驟4.1:利用基于ε領域的k-means算法初始化簇,分為k簇;
步驟4.2:用值[0,1]間的隨機數(shù)初始化隸屬矩陣j,使其滿足隸屬的整個約束條件;
步驟4.3:構建k類緊湊度函數(shù)j,綜合隸屬約束條件,構建m個方程組,對其進行求解,即可求出使緊湊度函數(shù)j最大的必要條件cj、wij;
步驟4.4:根據(jù)判定函數(shù)wij、cj、δ(j)的大小來確定迭代的結束;
步驟4.5:根據(jù)概率函數(shù)pi∈j重新歸類;
步驟4.6:根據(jù)步驟4.2得到的分類結果,得到這幾個參數(shù)模型;
步驟4.7:重復執(zhí)行步驟4.2、步驟4.3兩步,直到算法收斂為止;
步驟5:根據(jù)企業(yè)具體情況,綜合關鍵詞效能優(yōu)化和價值率優(yōu)化,選擇合適的關鍵詞優(yōu)化策略達到網(wǎng)站優(yōu)化目標。
本發(fā)明有益效果是:
1,此算法可以精簡關鍵詞分析流程,進而減少整個網(wǎng)站優(yōu)化工作量。
2,此算法的運行時間復雜度低,處理速度更快。
3、此算法具有更大的利用價值。
4、能幫助網(wǎng)站在短時間內(nèi)快速提升其關鍵詞的排名。
5、為企業(yè)網(wǎng)站帶來一定的流量和詢盤,從而達到理想的網(wǎng)站優(yōu)化目標。
6、此算法分類結果的準確度更符合經(jīng)驗值;
7、此算法綜合了模型概率分布函數(shù)對關鍵詞進一步聚類,得到的結果更加精確。
8、避免了聚類結果過早收斂問題,同時進一步驗證了聚類結果的準確性。
附圖說明
圖1新的模型聚類算法實現(xiàn)搜索引擎優(yōu)化技術結構流程圖
圖2新的模型聚類算法在聚類分析中的應用流程圖
具體實施方式
為了解決關鍵詞優(yōu)化實現(xiàn)搜索引擎優(yōu)化的技術問題,結合圖1-圖2對本發(fā)明進行了詳細說明,其具體實施步驟如下:
步驟1:根據(jù)企業(yè)業(yè)務確定核心關鍵詞,利用搜索引擎搜集相關關鍵字,這些關鍵字在搜索引擎中有相應數(shù)據(jù)項,如本國每月搜索量、競爭程度和估算每次點擊費用(cpc)等
步驟2:結合企業(yè)產(chǎn)品和市場分析,篩選降維上述搜索到的相關關鍵字集合;
步驟3:針對篩選降維后的關鍵詞集合,通過搜索引擎搜索關鍵詞對應的頁面,這里記錄首頁網(wǎng)頁數(shù)和總搜索頁面數(shù),即每個關鍵詞由五維向量再降維為四維的,其具體計算過程如下:
這里相關關鍵詞個數(shù)為m,既有下列m×5矩陣:
ni、ldi、cpci、nis、niy依次為第i個關鍵詞對應的本國每月搜索量、競爭程度、估算每次點擊費用(cpc)、首頁網(wǎng)頁數(shù)、總搜索頁面數(shù)。
再降維為四維,即
xi∈(1,2,…,m)為搜索效能,zi∈(1,2,…,m)為價值率,即為下式:
步驟4:利用新的模型聚類算法,對上述關鍵詞進行聚類處理,其具體子步驟如下:
步驟4.1:利用基于ε領域的k-means算法初始化簇,篩選出k簇;
步驟4.2:用值[0,1]間的隨機數(shù)初始化隸屬矩陣j,使其滿足隸屬的整個約束條件;
構建隨機隸屬矩陣j為m×k:
wij為關鍵詞i屬于j類的程度系數(shù),即j∈(1,2,…,k)、i∈(1,2,…,m)。
隸屬的整個約束條件為:
步驟4.3:構建k類緊湊度函數(shù)j,綜合隸屬約束條件,構建m個方程組,對其進行求解,即可求出使緊湊度函數(shù)j最大的必要條件cj、wij;
根據(jù)ε領域數(shù)據(jù)對象緊湊度函數(shù),構建帶有m個約束式的拉格朗日算子方程組,即有下式:
上式nεj為j類數(shù)據(jù)對象個數(shù),xih為第i關鍵詞所對應的向量,yjh為j類簇中心向量,
步驟4.4:根據(jù)判定函數(shù)wij、cj、δ(j)的大小來確定迭代的結束,其具體計算過程如下:
δ(j)=jnew-jold<θ
δwij<μ
δcj<γ
上式jnew為當前迭代的緊湊度函數(shù)值,jold為上一次緊湊度函數(shù)的值,δwij為前后迭代的隸屬變化值,δcj為前后迭代的類中心變化值,θ、μ、γ為足夠小的閾值。只有滿足上述三個條件,則迭代結束,輸出最佳聚類結果。
步驟4.5:根據(jù)概率函數(shù)pi∈j重新歸類,其具體計算過程如下:
概率函數(shù):
上式p(i/j)服從(μj,σj2)的正態(tài)分布,且μj、σj是隨簇中心變化,nj為類j數(shù)據(jù)對象的個數(shù),xi為關鍵詞i;
步驟4.6:根據(jù)步驟4.5得到的分類結果,得到這幾個參數(shù)模型,其具體計算結果如下:
步驟4.7:重復執(zhí)行步驟4.5、步驟4.6兩步,直到算法收斂為止,其具體計算過程如下:
根據(jù)初始的(μj,σj2)計算出p(i∈j),再更新正態(tài)分布參數(shù)μj、σj,根據(jù)下列判別式進一步刷選最佳分類;
δ(μj)<α
δσj<β
δp(j)<δ
δ(μj)、δσj、δp(j)分別為概率分布的期望變化量、標準差變化量、類j變化量,α、β、δ為足夠小的數(shù),當?shù)Y果滿足以上三個約束條件,則進一步找到最佳聚類結果。
步驟5:根據(jù)企業(yè)具體情況,綜合關鍵詞效能優(yōu)化和價值率優(yōu)化,選擇合適的關鍵詞優(yōu)化策略達到網(wǎng)站優(yōu)化目標。