一種商品排重方法和系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及電子商務(wù)領(lǐng)域,尤其涉及一種商品排重方法和系統(tǒng)。
【背景技術(shù)】
[0002] 隨著互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展以及人們消費觀念的逐漸轉(zhuǎn)變,電子商務(wù)開始迅猛發(fā) 展,電子商務(wù)平臺隨著海量商家的入駐,對千萬級商品的管理成為開放電子商務(wù)平臺的難 題,商品重復(fù)過多,消費者在前臺搜索后出現(xiàn)的商品太多,為消費者挑選商品造成了困難, 同時也為電子商務(wù)平臺的管理帶來了不便。
【發(fā)明內(nèi)容】
[0003] 本發(fā)明所要解決的技術(shù)問題是,提供一種商品排重方法和系統(tǒng),以解決由于商品 重復(fù)過多,商家、商品難以管理,商家搜索商品造成的一品多商的問題。
[0004] 本發(fā)明解決上述技術(shù)問題所采用的技術(shù)方案是提供一種商品排重方法,該方法包 括步驟:
[0005] Sl、根據(jù)商品類型和商品屬性定制排重模板;
[0006] S2、獲取商家申請商品的所述商品類型和商品屬性;
[0007] S3、根據(jù)所述商品類型調(diào)用相應(yīng)模板,根據(jù)所述商品屬性計算相似度分值;
[0008] S4、將所述相似度分值與所述排重模版的排重閾值相比較;
[0009] S5、若所述分值大于所述閾值,則所述商品重復(fù);
[0010] S6、若所述分值小于所述閾值,則新建所述商品。
[0011] 優(yōu)選地,步驟Sl中,所述排重模板包括所述商品屬性的排重閾值、排重參數(shù)和所 述參數(shù)的權(quán)重,其中,所述排重參數(shù)包括品牌、重量和體積等參數(shù)。
[0012] 優(yōu)選地,步驟S3中,將所述商品屬性輸入到solr (企業(yè)級搜索應(yīng)用服務(wù)器)中,查 詢并打分,得到所述相似度分值。
[0013] 優(yōu)選地,在所述solr中得到所述相似度分值包括步驟:
[0014] S301、讀取用戶輸入的查詢詞;
[0015] S302、所述solr對所述查詢詞進(jìn)行分詞處理,將所述分詞輸入到所述solr中進(jìn)行 查詢;
[0016] S303、根據(jù)相似度計算公式
[0017]
[0018] 計算所述相似度分值,其中,
[0019] q為所述查詢詞,t為所述分詞,d為所述查詢詞需匹配的模板;
[0020] tf (t in d)統(tǒng)計所述分詞t在所述模板中的詞頻;
[0021] boost (t,field in d)在索引過程中設(shè)置字段參數(shù);
[0022] lengthNorm(t, feild in d)計算在索引過程存儲的分詞的數(shù)目;
[0023] S304、將得到的所述相似度分值由高到低排列并返回至商家。
[0024] 優(yōu)選地,步驟S303中,所述相似度分值score (t)在(0, 1]之間,分值越高,所述查 詢詞與所述模板d匹配度越高。
[0025] 另一方面,本發(fā)明提供一種商品排重系統(tǒng),所述系統(tǒng)包括:
[0026] 模板制定單元,用于根據(jù)商品類型和商品屬性制定排重模版;
[0027] 第一輸入單元,用于輸入商家申請的所述商品類型和商品屬性;
[0028] solr計算單元,用于根據(jù)所述商品類型調(diào)用相應(yīng)模板,并根據(jù)所述商品屬性計算 相似度分值;
[0029] 判斷單元,用于判斷所述相似度分值是否超過所述排重模板中的閾值,若超過,則 所述商品重復(fù),若未超過,則新建所述商品。
[0030] 優(yōu)選地,所述排重模版包括所述商品屬性的排重閾值、排重參數(shù)和所述參數(shù)的權(quán) 重,其中,所述排重參數(shù)包括品牌、重量和體積等參數(shù)。
[0031] 優(yōu)選地,所述solr計算單元將所述商品屬性輸入到solr(企業(yè)級搜索應(yīng)用服務(wù) 器)中,查詢并打分,得到所述相似度分值。
[0032] 優(yōu)選地,所述solr計算單元包括:
[0033] 第二輸入單元,用于將商家輸入的查詢詞輸入到所述solr中;
[0034] 分詞單元,用于對所述查詢詞進(jìn)行分詞處理;
[0035] 打分單元,用于根據(jù)相似度計算公式計算所述相似度分值;
[0036] 輸出單元,用于按照得分高低排列所述相似度分值,并將查詢結(jié)果輸出至商家。
[0037] 優(yōu)選地,所述打分單元中得到的所述相似度分值在(0, 1]之間,分值越高,所述查 詢詞與所述排重模板匹配度越高。
[0038] 本發(fā)明中,根據(jù)所述商品類型調(diào)用相應(yīng)的排重模板,利用所述商品屬性計算相似 度分值,并將所述相似度分值與設(shè)定好的閾值相比較,確定該商品是否重復(fù),濾除掉大部分 重復(fù)商品,防止重復(fù)商品過多、商家和商品難以管理,同時,解決了同一商品多個商家重復(fù) 申請的問題。
【附圖說明】
[0039] 圖1是本發(fā)明的一個優(yōu)選實施例中商品排重方法的流程圖;
[0040]圖2是本發(fā)明的一個優(yōu)選實施例中商品排重系統(tǒng)的結(jié)構(gòu)圖。
【具體實施方式】
[0041] 以下實施例僅用于更加清楚地說明本發(fā)明的技術(shù)方案,而不能以此來限制本發(fā)明 的保護范圍。說明書后續(xù)描述為實施本發(fā)明的較佳實施方式,然所述描述乃以說明本發(fā)明 的一般原則為目的,并非用以限定本發(fā)明的范圍。本發(fā)明的保護范圍當(dāng)視所附權(quán)利要求所 界定者為準(zhǔn)。
[0042] 下面結(jié)合附圖和具體實施例對本發(fā)明做進(jìn)一步詳細(xì)說明。
[0043] 如圖1所示,為本發(fā)明的一個優(yōu)選實施例,公開了一種商品排重方法,該方法包含 步驟:
[0044] Sl、根據(jù)商品類型和商品屬性定制排重模板;
[0045] S2、獲取商家申請商品的商品類型和商品屬性;
[0046] S3、根據(jù)商品類型調(diào)用相應(yīng)模板,根據(jù)商品屬性計算相似度分值;
[0047] S4、將相似度分值與排重模版的排重閾值相比較;
[0048] S5、若分值大于所述閾值,則商品重復(fù);
[0049] S6、若分值小于閾值,則新建商品。
[0050] 本實施例中,根據(jù)商品類型調(diào)用相應(yīng)的排重模板,利用商品屬性計算相似度分值, 并通過與設(shè)定好的閾值相比較,確定該商品是否重復(fù),這樣可以根據(jù)對閾值的設(shè)定濾除掉 大部分重復(fù)商品,防止重復(fù)商品過多,商家和商品難以管理,解決了同一商品多個商家重復(fù) 申請的問題。
[0051] 進(jìn)一步地,步驟Sl中,排重模板包括商品屬性的排重閾值、排重參數(shù)和參數(shù)的權(quán) 重,其中,排重參數(shù)包括品牌、重量和體積等參數(shù)。
[0052] 本實施例中,排重模板包括閾值和品牌、重量以及體積等參數(shù)以及這些參數(shù)所占 的權(quán)重,能夠使電子商務(wù)平臺客觀的根據(jù)商家輸入的商品類型和屬性判斷該商品與排重模 板之間的相似度。
[0053] 進(jìn)一步地,步驟S3中,將商品屬性輸入到solr (企業(yè)級搜索應(yīng)用服務(wù)器)中,查詢 并打分,得到相似度分值。
[0054] 進(jìn)一步地,在solr中得到相似度分值包括步驟:
[0055] S301、讀取用戶輸入的查詢詞;
[0056] S302、solr對查詢詞進(jìn)行分詞處理,將分詞輸入到solr中進(jìn)行查詢;
[0057] S303、根據(jù)相似度計算公式
[0058]
[0059] 計算相似度分值,其中,
[0060] q為查詢詞,t為分詞,d為查詢詞需匹配的模板;
[0061] tf (t in d)統(tǒng)計分詞t在模板中的詞頻;
[0062] boost (t,field in d)在索引過程中設(shè)置字段參數(shù);
[0063] lengthNorm(t, feild in d)計算在索引過程存儲的分詞的數(shù)目;
[0064] S304、將得到的相似度分值由高到低排列并返回至商家。
[0065] 更進(jìn)一步地,步驟S303中,