為廣告確定視頻標(biāo)簽的方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,特別是涉及一種為廣告確定視頻標(biāo)簽的方法及裝置。
【背景技術(shù)】
[0002]為了更好地投放廣告,視頻門戶網(wǎng)站通常需要將廣告投放到合適的視頻中,以使得廣告與視頻的相關(guān)性較大,從而提高廣告的點擊提升度。
[0003]現(xiàn)有技術(shù)中,廣告投放到視頻中時,廣告與視頻的匹配方法是針對于視頻的描述文本與廣告的描述文本的簡易的語義匹配,其中,所謂簡易的語義匹配即描述文本之間的詞語是否存在重疊。但是,由于廣告的描述文本是關(guān)于產(chǎn)品的描述,而大部分視頻的描述文本是關(guān)于節(jié)目的描述,不涉及具體產(chǎn)品,因此,利用現(xiàn)有的簡易的匹配方法會使得非常多的廣告與視頻無法得到有效匹配。
[0004]而申請人發(fā)現(xiàn),如果為廣告打上視頻標(biāo)簽,并且將具有相同視頻標(biāo)簽的廣告與視頻能夠匹配到一起,能夠使得廣告與視頻的相關(guān)性較大,最終提高廣告的點擊提升度。那么,如何有效確定廣告所需對應(yīng)的視頻標(biāo)簽則是一個亟待解決的問題。
【發(fā)明內(nèi)容】
[0005]本發(fā)明實施例的目的在于提供一種為廣告確定視頻標(biāo)簽的方法及裝置,以實現(xiàn)廣告所需對應(yīng)的視頻標(biāo)簽的確定。具體技術(shù)方案如下:
[0006]第一方面,本發(fā)明實施例提供了一種為廣告確定視頻標(biāo)簽的方法,包括:
[0007]獲得目標(biāo)廣告的目標(biāo)描述文本;
[0008]對所述目標(biāo)描述文本進(jìn)行分詞處理,以得到所述目標(biāo)廣告所對應(yīng)的目標(biāo)分詞;
[0009]基于所述目標(biāo)廣告所對應(yīng)的目標(biāo)分詞,確定所述目標(biāo)廣告所對應(yīng)的目標(biāo)一元詞特征向量;其中,所述目標(biāo)一元詞特征向量用于表征所述目標(biāo)描述文本的分詞特征;
[0010]基于預(yù)設(shè)的句子連續(xù)特征向量形成模型和所述目標(biāo)描述文本,確定所述目標(biāo)廣告所對應(yīng)的目標(biāo)句子連續(xù)特征向量;其中,所述目標(biāo)句子連續(xù)特征向量用于表征所述目標(biāo)描述文本的語句特征;
[0011]將所述目標(biāo)一元詞特征向量和所述目標(biāo)句子連續(xù)特征向量合并處理以形成所述目標(biāo)廣告所對應(yīng)的目標(biāo)輸入向量;
[0012]基于所述目標(biāo)輸入向量和預(yù)設(shè)的高斯核的支持向量機(jī)模型,確定所述預(yù)設(shè)的高斯核的支持向量機(jī)模型所涵蓋的各類視頻標(biāo)簽的置信度;其中,所述高斯核的支持向量機(jī)模型為基于視頻的輸入向量與所述視頻所對應(yīng)視頻標(biāo)簽所構(gòu)建的、關(guān)于輸入向量與視頻標(biāo)簽的置信度映射關(guān)系的模型,所述視頻的輸入向量由所述視頻的描述文本所對應(yīng)的一元詞特征向量和句子連續(xù)特征向量所構(gòu)成;
[0013]將置信度滿足預(yù)定條件的視頻標(biāo)簽確定為所述目標(biāo)廣告所對應(yīng)的目標(biāo)視頻標(biāo)簽。
[0014]可選的,本發(fā)明實施例所提供的方法還包括:
[0015]將所述目標(biāo)廣告的標(biāo)簽屬性設(shè)置為所確定出的目標(biāo)視頻標(biāo)簽。
[0016]可選的,所述獲得目標(biāo)廣告的目標(biāo)描述文本,包括:
[0017]獲得所述目標(biāo)廣告的簡介內(nèi)容和/或著陸頁面文本。
[0018]可選的,所述預(yù)設(shè)的高斯核的支持向量機(jī)模型的構(gòu)建過程,包括:
[0019]獲得多個第一類視頻樣本各自對應(yīng)的第一類描述文本樣本;其中,每個第一類視頻樣本均具有視頻標(biāo)簽;
[0020]分別對各個第一類描述文本樣本進(jìn)行分詞處理,以得到所述多個第一類視頻樣本各自所對應(yīng)的第一類分詞;
[0021]基于所述多個第一類視頻樣本各自所對應(yīng)的第一類分詞,確定所述多個第一類視頻樣本各自所對應(yīng)的第一類一元詞特征向量;其中,所述第一類一元詞特征向量用于表征相應(yīng)第一類描述文本樣本的分詞特征;
[0022]基于預(yù)設(shè)的句子連續(xù)特征向量形成模型和各個第一類描述文本樣本,確定所述多個第一類視頻樣本各自所對應(yīng)的第一類句子連續(xù)特征向量;其中,所述第一類句子連續(xù)特征向量用于表征相應(yīng)第一類描述文本樣本的語句特征;
[0023]分別將各個第一類一元詞特征向量和所對應(yīng)的第一類句子連續(xù)特征向量合并處理以形成所述多個第一類視頻樣本各自所對應(yīng)的第一類輸入向量;
[0024]通過所述第一類輸入向量和相應(yīng)的視頻標(biāo)簽,利用高斯核的支持向量機(jī)模型的訓(xùn)練方法,生成關(guān)于第一類輸入向量與視頻標(biāo)簽的置信度映射關(guān)系的高斯核的支持向量機(jī)模型。
[0025]可選的,所述預(yù)設(shè)的句子連續(xù)特征向量形成模型的構(gòu)建過程,包括:
[0026]獲得多個第二類視頻樣本的第二類描述文本樣本、多個廣告樣本的第三類描述文本樣本和多個外部語料;
[0027]基于所獲得第二類視頻樣本的第二類描述文本樣本、廣告樣本的第三類描述文本樣本和外部語料,利用句子連續(xù)特征向量的訓(xùn)練方法,生成句子連續(xù)特征向量形成模型,其中,所述句子連續(xù)特征向量形成模型為句子作為輸入而預(yù)定維數(shù)的向量作為輸出的模型。
[0028]第二方面,本發(fā)明實施例還提供了一種為廣告確定視頻標(biāo)簽的裝置,包括:
[0029]目標(biāo)描述文本獲得模塊,用于獲得目標(biāo)廣告的目標(biāo)描述文本;
[0030]目標(biāo)分詞獲得模塊,用于對所述目標(biāo)描述文本進(jìn)行分詞處理,以得到所述目標(biāo)廣告所對應(yīng)的目標(biāo)分詞;
[0031]目標(biāo)一元詞特征向量確定模塊,用于基于所述目標(biāo)廣告所對應(yīng)的目標(biāo)分詞,確定所述目標(biāo)廣告所對應(yīng)的目標(biāo)一元詞特征向量;其中,所述目標(biāo)一元詞特征向量用于表征所述目標(biāo)描述文本的分詞特征;
[0032]目標(biāo)句子連續(xù)特征向量確定模塊,用于基于預(yù)設(shè)的句子連續(xù)特征向量形成模型和所述目標(biāo)描述文本,確定所述目標(biāo)廣告所對應(yīng)的目標(biāo)句子連續(xù)特征向量;其中,所述目標(biāo)句子連續(xù)特征向量用于表征所述目標(biāo)描述文本的語句特征;
[0033]目標(biāo)輸入向量確定模塊,用于將所述目標(biāo)一元詞特征向量和所述目標(biāo)句子連續(xù)特征向量合并處理以形成所述目標(biāo)廣告所對應(yīng)的目標(biāo)輸入向量;
[0034]視頻標(biāo)簽置信度確定模塊,用于基于所述目標(biāo)輸入向量和預(yù)設(shè)的高斯核的支持向量機(jī)模型,確定所述預(yù)設(shè)的高斯核的支持向量機(jī)模型所涵蓋的各類視頻標(biāo)簽的置信度;其中,所述高斯核的支持向量機(jī)模型為基于視頻的輸入向量與所述視頻所對應(yīng)視頻標(biāo)簽所構(gòu)建的、關(guān)于輸入向量與視頻標(biāo)簽的置信度映射關(guān)系的模型,所述視頻的輸入向量由所述視頻的描述文本所對應(yīng)的一元詞特征向量和句子連續(xù)特征向量所構(gòu)成;
[0035]目標(biāo)視頻標(biāo)簽確定模塊,用于將置信度滿足預(yù)定條件的視頻標(biāo)簽確定為所述目標(biāo)廣告所對應(yīng)的目標(biāo)視頻標(biāo)簽。
[0036]可選的,本發(fā)明實施例所提供的裝置還包括:
[0037]標(biāo)簽設(shè)置模塊,用于將所述目標(biāo)廣告的標(biāo)簽屬性設(shè)置為所確定出的目標(biāo)視頻標(biāo)簽。
[0038]可選的,所述目標(biāo)描述文本獲得模塊,具體用于:
[0039]獲得所述目標(biāo)廣告的簡介內(nèi)容和/或著陸頁面文本。
[0040]可選的,所述預(yù)設(shè)的高斯核的支持向量機(jī)模型通過向量機(jī)構(gòu)建模塊構(gòu)建,所述向量機(jī)構(gòu)建模塊,包括:
[0041]描述文本樣本獲得單元,用于獲得多個第一類視頻樣本各自對應(yīng)的第一類描述文本樣本;其中,每個第一類視頻樣本均具有視頻標(biāo)簽;
[0042]第一類分詞確定單元,用于分別對各個第一類描述文本樣本進(jìn)行分詞處理,以得到所述多個第一類視頻樣本各自所對應(yīng)的第一類分詞;
[0043]第一類一元詞特征向量確定單元,用于基于所述多個第一類視頻樣本各自所對應(yīng)的第一類分詞,確定所述多個第一類視頻樣本各自所對應(yīng)的第一類一元詞特征向量;其中,所述第一類一元詞特征向量用于表征相應(yīng)第一類描述文本樣本的分詞特征;
[0044]第一類句子連續(xù)特征向量確定單元,用于基于預(yù)設(shè)的句子連續(xù)特征向量形成模型和各個第一類描述文本樣本,確定所述多個第一類視頻樣本各自所對應(yīng)的第一類句子連續(xù)特征向量;其中,所述第一類句子連續(xù)特征向量用于表征相應(yīng)第一類描述文本樣本的語句特征;
[0045]第一類輸入向量確定單元,用于分別將各個第一類一元詞特征向量和所對應(yīng)的第一類句子連續(xù)特征向量合并處理以形成所述多個第一類視頻樣本各自所對應(yīng)的第一類輸入向量;
[0046]向量機(jī)模型生成單元,用于通過所述第一類輸入向量和相應(yīng)的視頻標(biāo)簽,利用高斯核的支持向量機(jī)模型的訓(xùn)練方法,生成關(guān)于第一類輸入向量與視頻標(biāo)簽的置信度映射關(guān)系的高斯核的支持向量機(jī)模型。
[0047]可選的,所述預(yù)設(shè)的句子連續(xù)特征向量形成模型通過句子連續(xù)特征向量構(gòu)建模塊構(gòu)建,所述句子連續(xù)特征向量構(gòu)建模塊,包括:
[0048]樣本內(nèi)容獲得單元,用于獲得多個第二類視頻樣本的第二類描述文本樣本、多個廣告樣本的第三類描述文本樣本和多個外部語料;
[0049]句子連續(xù)特征向量模型生成單元,用于基于所獲得第二類視頻樣本的第二類描述文本樣本、廣告樣本的第三類描述文本樣本和外部語料,利用句子連續(xù)特征向量的訓(xùn)練方法,生成句子連續(xù)特征向量形成模型,其中,所述句子連續(xù)特征向量形成模型為句子作為輸入而預(yù)定維數(shù)的向量作為輸出的模型。
[0050]本方案中,預(yù)先基于視頻的描述文本與視頻所對應(yīng)視頻標(biāo)簽來構(gòu)建關(guān)于輸入向量與視頻標(biāo)簽的置信度映射關(guān)系的高斯核的支持向量機(jī)模型,其中,視頻的輸入向量由視頻的描述文本所對應(yīng)的一元詞特征向量和句子連續(xù)特征向量所構(gòu)成;在為目標(biāo)廣告確定視頻標(biāo)簽時,通過廣告的描述文本所確定出的一元詞特征向量和句子連續(xù)特征向量來構(gòu)成輸入向量,利用該模型,最終確定出該廣告的各類視頻標(biāo)簽的置信度,選擇置信度符合條件的視頻標(biāo)簽確定為該廣告的視頻標(biāo)簽,以此實現(xiàn)了有效確定