本發(fā)明涉及搜索推薦方法領(lǐng)域,更具體的,涉及一種基于語義匹配的職位搜索推薦方法和系統(tǒng)。
背景技術(shù):
現(xiàn)在市場上存在大量的職位搜索系統(tǒng)或檢索技術(shù),是當求職者需要尋找可以投遞的工作機會時所使用的搜索系統(tǒng),但無一例外都是由求職者主動發(fā)起,輸入某個目標職位,通過關(guān)鍵詞搜索技術(shù)得到符合關(guān)鍵詞的職位列表,并不能做到真正的針對該求職者進行個性化職位推薦。
傳統(tǒng)職位搜索系統(tǒng)主要基于關(guān)鍵詞,存在以下問題:
這些系統(tǒng)要求求職者必須有一個或多個目標。于是求職者首先需要判斷應該輸入什么職位,對于不夠明確目標的求職者設立了較高的門檻。如果用戶適合多種職位名稱,系統(tǒng)需要用戶分多次輸入不同的職位名,并針對每一個職位名結(jié)果進行行業(yè)、學歷要求、工作年限等一系列條件的篩選,耗時燒腦。如果職位名含義比較模糊,搜索到的結(jié)果里可能混有許多,例如搜索“咨詢”或“培訓”時,只有少數(shù)屬于針對企業(yè)級別的“戰(zhàn)略咨詢”“IT咨詢”和“企業(yè)培訓”“專業(yè)培訓”等,充斥著大量職位名是“咨詢”但其實是屬于“教育咨詢”“留學咨詢”一類的職位,或職位名是“培訓”但其實屬于“教育培訓”“專業(yè)技能培訓”之類的職位,給求職者造成很大的困擾。如果職位名比較少見,搜索引擎無法匹配到關(guān)鍵詞,則返回極少結(jié)果甚至沒有結(jié)果;但其實造成這種狀況的原因是求職者并不知道自己在做的事情還能有什么其他稱謂,于是只在自己知道的小范圍進行關(guān)鍵詞搜索。這些檢索系統(tǒng)沒有個性化的推薦,不論是怎樣的求職者,只要鍵入同一職位名,都會獲得一樣的結(jié)果。求職者要花耗大量的時間去查看職位的詳細描述并反復判斷是否是自己感興趣的工作內(nèi)容,是否是與自己過往經(jīng)歷及能力匹配的職責要求,在如此往復的過程中耗費大量的時間和精力,最終可能并不能判斷決策把握最適合的機會。
技術(shù)實現(xiàn)要素:
本發(fā)明旨在至少解決現(xiàn)有技術(shù)中存在的技術(shù)問題之一。
為此,本發(fā)明的目的在于,使用語義匹配技術(shù)來進行職位搜索,讓求職者在提供自己的基本信息后就能迅速獲得與經(jīng)歷相符合的個性化職位推薦。不需要冥思苦想自己的職位名有哪些可能性,并重復進行輸入和篩選信息;不用擔心由于職位名的含糊造成大量不相關(guān)的信息的獲取和判斷;不用面對輸入小眾職位名找不到結(jié)果的情況;也不用耗費大量時間一條條地查看職位描述去確定是否與自己相關(guān),正是為了解決傳統(tǒng)職位搜索系統(tǒng)存在的幾大問題。
為實現(xiàn)上述目的,本發(fā)明提供一種基于語義匹配的職位搜索推薦方法,包括:
步驟1,接收用戶端輸入的求職信息;
步驟2,根據(jù)獲取的所述求職信息,進行解析;
步驟3,對解析后的求職信息進行向量化計算,生成向量化數(shù)據(jù);
步驟4,比較所述生成的向量化數(shù)據(jù)與數(shù)據(jù)庫中預存儲的向量化數(shù)據(jù)的相似度;
步驟5,將比較結(jié)果輸出至用戶端。
更優(yōu)的,在步驟1之前還包括:
采集各個渠道發(fā)布的職位信息,做到分秒級的采集與更新,將采集到的職位信息進行統(tǒng)一結(jié)構(gòu)化,提取有效字段,將各個字段進行向量化處理,生成向量化數(shù)據(jù),存儲在數(shù)據(jù)庫中。
更優(yōu)的,所述接收用戶端輸入的求職信息具體為:
通過直接輸入或上傳文檔獲取求職者的簡歷,文檔格式為doc, docx, pdf, txt, html中的一種或多種。
更優(yōu)的,所述對解析后的求職信息進行向量化計算,生成向量化數(shù)據(jù)具體為:
對解析后的求職信息進行高維數(shù)學向量化計算,生成高維數(shù)學向量化的數(shù)據(jù)。
更優(yōu)的,所述職位信息包括教育水平、專業(yè)需求、職位所需技能、工作經(jīng)歷的一種或多種。
本發(fā)明還提供了一種基于語義匹配的職位搜索推薦的系統(tǒng),其特征在于,包括:
接收模塊,接收用戶端輸入的求職信息;
解析模塊,根據(jù)獲取的所述求職信息,進行解析;
量化模塊,對解析后的求職信息進行向量化計算,生成向量化數(shù)據(jù);
比較模塊,比較所述生成的向量化數(shù)據(jù)與數(shù)據(jù)庫中預存儲的向量化數(shù)據(jù)的相似度;
輸出模塊,將比較結(jié)果輸出至用戶端。
更優(yōu)的,還包括:
數(shù)據(jù)庫,用于將采集各個渠道發(fā)布的職位信息,做到分秒級的采集與更新,將采集到的職位信息進行統(tǒng)一結(jié)構(gòu)化,提取有效字段,將各個字段進行向量化處理,生成向量化數(shù)據(jù),存儲在數(shù)據(jù)庫中。
更優(yōu)的,所述接收模塊具體功能為:
通過直接輸入或上傳文檔獲取求職者的簡歷,文檔格式為doc, docx, pdf, txt, html中的一種或多種。
更優(yōu)的,所述向量模塊具體功能為:
對解析后的求職信息進行高維數(shù)學向量化計算,生成高維數(shù)學向量化的數(shù)據(jù)。
更優(yōu)的,所述職位信息包括教育水平、專業(yè)需求、職位所需技能、工作經(jīng)歷的一種或多種。
基于語義匹配的職位搜索推薦系統(tǒng),區(qū)別于傳統(tǒng)的職位搜索系統(tǒng),它最大的特點就是能根據(jù)求職者具體的過往經(jīng)歷來找到與他最匹配的職位,從而提供差異化的推薦結(jié)果,也大大提升求職者的搜索效率,相當于有一個專屬的獵頭來解讀簡歷并來為他推薦機會。
語義分析系統(tǒng)對求職者簡歷信息和招聘職位要求中的各種表達進行了高維向量化表示,不再通過語言表達的字面匹配來檢索,而是轉(zhuǎn)化為數(shù)學向量來檢索,克服語言表述的多樣性導致的檢索門檻高,耗時長的問題。經(jīng)過向量化后的表達之間的相似度可以通過高維空間中的距離來表示,這樣用戶只需要輸入多樣表達中的一種,系統(tǒng)即可識別相近的表達并建立聯(lián)系,解決了模糊和多樣的語義的識別問題,縮短了職位搜索和判斷的時間,提高了使用者的搜索效率。
本發(fā)明主要的效果是提升了求職者找工作的效率,獲得準確推薦,降低時間成本和判斷成本。具體體現(xiàn)在以下三個方面:
1. 目標確立門檻低:不需要輸入明確的目標職位,只需要通過簡歷告訴搜索引擎你是誰即可,該系統(tǒng)會自動判斷。
2. 準確度提升:一方面,求職者能夠發(fā)現(xiàn)更多自己不曾想過但也很適合的職位名稱,另一方面,求職者能獲得與自己過往經(jīng)歷最為匹配的工作機會推薦。通過調(diào)查發(fā)現(xiàn),87%的求職者對于這些推薦的職位比關(guān)鍵詞搜索得到的更感興趣。
3. 交互簡單友好:將求職者的輸入-篩選-查看幾十次-判斷幾十次的反復搜索行為,簡化為輸入-獲得推薦-簡單判斷的搜索行為,易于理解,提升效率。
附圖說明
圖1示出了本發(fā)明一種基于語義匹配的職位搜索推薦方法的流程圖;
圖2示出了本發(fā)明一種基于語義匹配的職位搜索推薦系統(tǒng)的結(jié)構(gòu)框圖;
圖3示出了本發(fā)明一實施例的職位搜索推薦方法流程圖。
具體實施方式
為了能夠更清楚地理解本發(fā)明的上述目的、特征和優(yōu)點,下面結(jié)合附圖和具體實施方式對本發(fā)明進行進一步的詳細描述。需要說明的是,在不沖突的情況下,本申請的實施例及實施例中的特征可以相互組合。
在下面的描述中闡述了很多具體細節(jié)以便于充分理解本發(fā)明,但是,本發(fā)明還可以采用其他不同于在此描述的方式來實施,因此,本發(fā)明的保護范圍并不受下面公開的具體實施例的限制。
本發(fā)明的核心點是通過語義理解和匹配文本信息。技術(shù)核心點事突破了文字本身的計算機編碼存儲模式,理解了文字的深層次含義,然后用高維數(shù)學向量表達這些含義,并用高維空間距離表達文字的相似度,從而可以檢索出與求職者輸入的簡歷(或工作經(jīng)歷)最相匹配的工作機會。
基于語義匹配的職位搜索推薦系統(tǒng),區(qū)別于傳統(tǒng)的職位搜索系統(tǒng),它最大的特點就是能根據(jù)求職者具體的過往經(jīng)歷來找到與他最匹配的職位,從而提供差異化的推薦結(jié)果,也大大提升求職者的搜索效率,相當于有一個專屬的獵頭來解讀簡歷并來為他推薦機會。
所謂語義,就是像人類理解語言一樣,除了一個詞字面上的意思,還能明白這個詞意味著什么,跟它相近的相關(guān)的詞語有哪些。本發(fā)明通過語義理解求職者的簡歷信息——他是怎樣的一個人,在什么樣的院校讀書,讀什么專業(yè),第一份工作在哪里,做什么職位,工作內(nèi)容是什么,過了多久跳槽去了哪里開始新的職位,同時通過語義理解招聘職位的需求——這個崗位需要一個怎樣的人,教育水平如何,做過什么事情,有什么技能,從而根據(jù)求職者的簡歷信息找到最匹配的職位。
語義分析系統(tǒng)對求職者簡歷信息和招聘職位要求中的各種表達進行了高維向量化表示,不再通過語言表達的字面匹配來檢索,而是轉(zhuǎn)化為數(shù)學向量來檢索,克服語言表述的多樣性導致的檢索門檻高,耗時長的問題。經(jīng)過向量化后的表達之間的相似度可以通過高維空間中的距離來表示,這樣用戶只需要輸入多樣表達中的一種,系統(tǒng)即可識別相近的表達并建立聯(lián)系,解決了模糊和多樣的語義的識別問題,縮短了職位搜索和判斷的時間,提高了使用者的搜索效率。
圖1示出了本發(fā)明一種基于語義匹配的職位搜索推薦方法的流程圖
如圖1所示,根據(jù)本發(fā)明提供一種基于語義匹配的職位搜索推薦方法,包括:
步驟1,接收用戶端輸入的求職信息;
步驟2,根據(jù)獲取的所述求職信息,進行解析;
步驟3,對解析后的求職信息進行向量化計算,生成向量化數(shù)據(jù);
步驟4,比較所述生成的向量化數(shù)據(jù)與數(shù)據(jù)庫中預存儲的向量化數(shù)據(jù)的相似度;
步驟5,將比較結(jié)果輸出至用戶端。
更具體的,在步驟1之前還包括:
采集各個渠道發(fā)布的職位信息,做到分秒級的采集與更新,將采集到的職位信息進行統(tǒng)一結(jié)構(gòu)化,提取有效字段,將各個字段進行向量化處理,生成向量化數(shù)據(jù),存儲在數(shù)據(jù)庫中。向量化處理是本領(lǐng)域中的常用技術(shù),本發(fā)明不再一一贅述。
更具體的,所述接收用戶端輸入的求職信息具體為:
通過直接輸入或上傳文檔獲取求職者的簡歷,文檔格式為doc, docx, pdf, txt, html中的一種或多種。
更具體的,所述對解析后的求職信息進行向量化計算,生成向量化數(shù)據(jù)具體為:
對解析后的求職信息進行高維數(shù)學向量化計算,生成高維數(shù)學向量化的數(shù)據(jù)。
更具體的,所述職位信息包括教育水平、專業(yè)需求、職位所需技能、工作經(jīng)歷的一種或多種。
圖2示出了本發(fā)明一種基于語義匹配的職位搜索推薦系統(tǒng)的結(jié)構(gòu)框圖。
如圖2所示,本發(fā)明還提供了一種基于語義匹配的職位搜索推薦的系統(tǒng),其特征在于,包括:
接收模塊,接收用戶端輸入的求職信息;
解析模塊,根據(jù)獲取的所述求職信息,進行解析;
量化模塊,對解析后的求職信息進行向量化計算,生成向量化數(shù)據(jù);
比較模塊,比較所述生成的向量化數(shù)據(jù)與數(shù)據(jù)庫中預存儲的向量化數(shù)據(jù)的相似度;
輸出模塊,將比較結(jié)果輸出至用戶端。
更具體的,還包括:
數(shù)據(jù)庫,用于將采集各個渠道發(fā)布的職位信息,做到分秒級的采集與更新,將采集到的職位信息進行統(tǒng)一結(jié)構(gòu)化,提取有效字段,將各個字段進行向量化處理,生成向量化數(shù)據(jù),存儲在數(shù)據(jù)庫中。
更具體的,所述接收模塊具體功能為:
通過直接輸入或上傳文檔獲取求職者的簡歷,文檔格式為doc, docx, pdf, txt, html中的一種或多種。
更具體的,所述向量模塊具體功能為:
對解析后的求職信息進行高維數(shù)學向量化計算,生成高維數(shù)學向量化的數(shù)據(jù)。
更具體的,所述職位信息包括教育水平、專業(yè)需求、職位所需技能、工作經(jīng)歷的一種或多種。
其中,系統(tǒng)的每個模塊根據(jù)各自的功能與對應的模塊進行數(shù)據(jù)交互和連接,這是本領(lǐng)域技術(shù)人員能毫無疑義的得出的,本發(fā)明不再一一贅述。
圖3示出了本發(fā)明一實施例的職位搜索推薦方法流程圖。
如圖3所示,在系統(tǒng)中先對待搜索職位進行預處理,具體包括,職位采集,然后將采集后職位進行解析,最后進行向量化的處理,生成向量化的數(shù)據(jù),把向量化的數(shù)據(jù)放入數(shù)據(jù)庫中。在用戶端,用戶輸入求職的信息,將求職信息采集后進行解析,然后再進行向量化的操作,生成向量化的數(shù)據(jù);然后,把向量化后的求職數(shù)據(jù)與系統(tǒng)中數(shù)據(jù)庫存儲的數(shù)據(jù)進行語義匹配搜索,將匹配度高的結(jié)果輸出。也可根據(jù)實際需求,把匹配度高的結(jié)果按照匹配度由高到低輸出。
在本說明書的描述中,術(shù)語“安裝”、“相連”、“連接”等術(shù)語均應做廣義理解,例如,“連接”可以是固定連接,也可以是可拆卸連接,或一體地連接;“相連”可以是直接相連,也可以通過中間媒介間接相連。對于本領(lǐng)域的普通技術(shù)人員而言,可以根據(jù)具體情況理解上述術(shù)語在本發(fā)明中的具體含義。
在本說明書的描述中,術(shù)語“一個實施例”、“一些實施例”、“具體實施例”等的描述意指結(jié)合該實施例或示例描述的具體特征、結(jié)構(gòu)、材料或特點包含于本發(fā)明的至少一個實施例或示例中。在本說明書中,對上述術(shù)語的示意性表述不一定指的是相同的實施例或?qū)嵗6?,描述的具體特征、結(jié)構(gòu)、材料或特點可以在任何的一個或多個實施例或示例中以合適的方式結(jié)合。
以上所述僅為本發(fā)明的優(yōu)選實施例而已,并不用于限制本發(fā)明,對于本領(lǐng)域的技術(shù)人員來說,本發(fā)明可以有各種更改和變化。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進等,均應包含在本發(fā)明的保護范圍之內(nèi)。