本發(fā)明涉及大數(shù)據(jù)處理,具體涉及一種車(chē)輛維保資料檢索平臺(tái)及其構(gòu)建方法。
背景技術(shù):
1、國(guó)內(nèi)市場(chǎng)車(chē)型比較多,整車(chē)的零部件也多,維修技師在維修時(shí),常常要查詢不同零部件的維修資料,例如電路圖或維修手冊(cè)等。目前的維保資料查詢平臺(tái),通常只能根據(jù)車(chē)型名稱(chēng)或者維保資料名稱(chēng)來(lái)查詢。對(duì)于通過(guò)車(chē)型名稱(chēng)查詢的維保資料查詢平臺(tái),其命中結(jié)果是該車(chē)型對(duì)應(yīng)的所有維保資料,維修技師還需要對(duì)這些命中的結(jié)果進(jìn)行篩選,才能找到需要的資料。對(duì)于通過(guò)維保資料名稱(chēng)來(lái)查詢的,這種查詢方式對(duì)維修技術(shù)的要求很高,需要維修技師熟悉系統(tǒng)中所有維保資料的名稱(chēng),使用起來(lái)并不方便。
技術(shù)實(shí)現(xiàn)思路
1、本說(shuō)明書(shū)一個(gè)或多個(gè)實(shí)施例描述了一種車(chē)輛維保資料檢索平臺(tái)及其構(gòu)建方法,能夠支持基于維保資料內(nèi)容的精準(zhǔn)查詢,提高檢索效率。
2、第一方面,提供了一種車(chē)輛維保資料檢索平臺(tái)構(gòu)建方法,該方法包括:
3、根據(jù)預(yù)先獲取的車(chē)型數(shù)據(jù),獲取每一種車(chē)型的維保資料;
4、對(duì)所述維保資料逐頁(yè)進(jìn)行文字內(nèi)容提取,將提取出的所述文字內(nèi)容按照頁(yè)碼存儲(chǔ),每一頁(yè)文字內(nèi)容存儲(chǔ)為一條內(nèi)容文本數(shù)據(jù);
5、針對(duì)每一種車(chē)型,將該車(chē)型的車(chē)型數(shù)據(jù)和維保資料之間的對(duì)應(yīng)關(guān)系記錄在若干第一索引表中;
6、將所述車(chē)型數(shù)據(jù)和車(chē)輛vin碼的對(duì)應(yīng)關(guān)系記錄在若干第二索引表中;
7、根據(jù)所述若干第一索引表和所述第二索引表,構(gòu)建所述車(chē)輛維保資料檢索平臺(tái)。
8、作為第一方面所述方法的一種可選實(shí)施方式,該方法還可以包括:
9、創(chuàng)建專(zhuān)有數(shù)據(jù)詞庫(kù);
10、在所述專(zhuān)有數(shù)據(jù)詞庫(kù)中錄入車(chē)輛維保場(chǎng)景的專(zhuān)有詞語(yǔ);
11、創(chuàng)建分詞器,所述分詞器用于在獲取用戶輸入的檢索信息時(shí),將所述檢索信息與所述專(zhuān)有數(shù)據(jù)詞庫(kù)中的專(zhuān)有詞語(yǔ)進(jìn)行匹配,對(duì)所述檢索信息中命中的所述專(zhuān)有詞語(yǔ)不進(jìn)行分詞處理,對(duì)所述檢索信息中未命中的內(nèi)容進(jìn)行分詞處理。
12、進(jìn)一步的,該方法還可以包括:
13、創(chuàng)建同義詞替換詞庫(kù);
14、在所述同義詞替換詞庫(kù)中存儲(chǔ)所述專(zhuān)有詞語(yǔ)與該專(zhuān)有詞語(yǔ)的同義詞之間的對(duì)應(yīng)關(guān)系;
15、創(chuàng)建檢索機(jī)制,以使所述車(chē)輛維保資料檢索平臺(tái)在獲取所述分詞器的分詞結(jié)果后,針對(duì)所述分詞結(jié)果中的所述專(zhuān)有詞語(yǔ),在所述同義詞替換詞庫(kù)中搜索同義詞,并在檢索所述專(zhuān)有詞語(yǔ)時(shí),將搜索出的所述專(zhuān)有詞語(yǔ)的同義詞一并進(jìn)行檢索。
16、作為第一方面所述方法的一種可選實(shí)施方式,所述車(chē)型數(shù)據(jù)和所述車(chē)輛vin碼的對(duì)應(yīng)關(guān)系采用vin解析規(guī)則解析得到,所述vin解析規(guī)則的構(gòu)建方法包括:
17、獲取基礎(chǔ)數(shù)據(jù),所述基礎(chǔ)數(shù)據(jù)包括已收錄的vin碼及所述vin碼對(duì)應(yīng)的車(chē)型數(shù)據(jù);
18、將前11位相同的所述vin碼歸為第一數(shù)據(jù)組;從所述第一數(shù)據(jù)組中,篩選對(duì)應(yīng)相車(chē)型數(shù)據(jù)的目標(biāo)vin碼,若所述目標(biāo)vin碼的數(shù)量大于預(yù)設(shè)的閾值,則將所述目標(biāo)vin碼按照后6位數(shù)字進(jìn)行排序,基于排序結(jié)果確定規(guī)則區(qū)間,最終生成一條用于描述所述規(guī)則區(qū)間內(nèi)的vin碼與車(chē)型數(shù)據(jù)之間的對(duì)應(yīng)關(guān)系的vin解析規(guī)則。
19、第二方面,提供了一種車(chē)輛維保資料檢索平臺(tái),該平臺(tái)包括:
20、數(shù)據(jù)獲取模塊,用于根據(jù)預(yù)先獲取的車(chē)型數(shù)據(jù),獲取每一種車(chē)型的維保資料
21、內(nèi)容提取模塊,用于對(duì)所述維保資料逐頁(yè)進(jìn)行文字內(nèi)容提?。?/p>
22、存儲(chǔ)模塊,用于將提取出的所述文字內(nèi)容按照頁(yè)碼存儲(chǔ),每一頁(yè)文字內(nèi)容存儲(chǔ)為一條內(nèi)容文本數(shù)據(jù);
23、索引構(gòu)建模塊,用于構(gòu)建若干第一索引表和若干第二索引表,并將所述車(chē)型數(shù)據(jù)和所述維保資料之間的對(duì)應(yīng)關(guān)系記錄在所述第一索引表中;將所述車(chē)型數(shù)據(jù)和車(chē)輛vin碼的對(duì)應(yīng)關(guān)系記錄在所述第二索引表中;
24、檢索模塊,用于響應(yīng)于用戶輸入的檢索信息,根據(jù)所述第一索引表和所述第二索引表進(jìn)行維保資料檢索。
25、作為第二方面所述平臺(tái)的一種可選實(shí)施方式,所述檢索信息包括車(chē)輛vin碼和維保描述信息;所述檢索模塊響應(yīng)于所述檢索信息執(zhí)行的檢索步驟包括:
26、基于車(chē)輛vin碼在所述第二索引表中進(jìn)行檢索,若在所述第二索引表中檢索未命中,則向用戶反饋未檢索到維保資料;
27、若在第二索引表中檢索命中,則基于所述車(chē)輛vin碼對(duì)應(yīng)的目標(biāo)車(chē)型,在所述第一索引表中檢索所述目標(biāo)車(chē)型是否存在對(duì)應(yīng)的維保資料;若不存在,則向用戶反饋未檢索到維保資料;若存在,則將所述維保描述信息與對(duì)應(yīng)的維保資料的內(nèi)容文本數(shù)據(jù)進(jìn)行內(nèi)容匹配,基于匹配結(jié)果選擇所述維保資料中的維保文件來(lái)推薦給用戶。
28、作為第二方面所述平臺(tái)的一種可選實(shí)施方式,所述檢索模塊包括專(zhuān)有詞庫(kù)和分詞器;
29、所述專(zhuān)有數(shù)據(jù)詞庫(kù)中存儲(chǔ)車(chē)輛維保場(chǎng)景的專(zhuān)有詞語(yǔ);
30、所述分詞器用于在獲取用戶輸入的檢索信息時(shí),將所述檢索信息與所述專(zhuān)有數(shù)據(jù)詞庫(kù)中的專(zhuān)有詞語(yǔ)進(jìn)行匹配,對(duì)所述檢索信息中命中的所述專(zhuān)有詞語(yǔ)不進(jìn)行分詞處理,對(duì)所述檢索信息中未命中的內(nèi)容進(jìn)行分詞處理。
31、進(jìn)一步的,所述檢索模塊還包括同義詞替換詞庫(kù),所述同義詞替換詞庫(kù)中存儲(chǔ)有所述專(zhuān)有詞語(yǔ)的同義詞;
32、所述檢索模塊具體用于在獲取所述分詞器的分詞結(jié)果后,針對(duì)所述分詞結(jié)果中的所述專(zhuān)有詞語(yǔ),在所述同義詞替換詞庫(kù)中搜索同義詞,并在檢索所述專(zhuān)有詞語(yǔ)時(shí),將搜索出的所述專(zhuān)有詞語(yǔ)的同義詞一并進(jìn)行檢索。
33、作為第二方面所述平臺(tái)的一種可選實(shí)施方式,該平臺(tái)還可以包括vin解析模塊,所述vin解析模塊用于根據(jù)vin解析模塊解析得到所述車(chē)型數(shù)據(jù)和所述車(chē)輛vin碼的對(duì)應(yīng)關(guān)系;所述vin解析規(guī)則的構(gòu)建方法包括:
34、獲取基礎(chǔ)數(shù)據(jù),所述基礎(chǔ)數(shù)據(jù)包括已收錄的vin碼及所述vin碼對(duì)應(yīng)的車(chē)型數(shù)據(jù);
35、將前11位相同的所述vin碼歸為第一數(shù)據(jù)組;從所述第一數(shù)據(jù)組中,篩選對(duì)應(yīng)相車(chē)型數(shù)據(jù)的目標(biāo)vin碼,若所述目標(biāo)vin碼的數(shù)量大于預(yù)設(shè)的閾值,則將所述目標(biāo)vin碼按照后6位數(shù)字進(jìn)行排序,基于排序結(jié)果確定規(guī)則區(qū)間,最終生成一條用于描述所述規(guī)則區(qū)間內(nèi)的vin碼與車(chē)型數(shù)據(jù)之間的對(duì)應(yīng)關(guān)系的vin解析規(guī)則。
36、有益效果:本說(shuō)明書(shū)的一個(gè)或多個(gè)實(shí)施例提供了一種車(chē)輛維保資料檢索平臺(tái)及其構(gòu)建方法,該車(chē)輛維保資料檢索平臺(tái)處理構(gòu)建車(chē)型和維保資料名稱(chēng)/編碼之前的匹配關(guān)系之外,還構(gòu)建了車(chē)型與維保資料具體內(nèi)容數(shù)據(jù)之間的匹配關(guān)系。基于此設(shè)計(jì),該平臺(tái)不僅能夠支持基于車(chē)型或維保資料名稱(chēng)/編碼的檢索,還可以支持基于每個(gè)車(chē)型的維修資料的具體內(nèi)容來(lái)進(jìn)行檢索,從而可以實(shí)現(xiàn)精準(zhǔn)命中,例如可以直接命中該車(chē)型的電機(jī)、安全氣囊的維修資料具體內(nèi)容。采用上述方法,可以實(shí)現(xiàn)維保資料檢索快速響應(yīng),提高汽車(chē)維保資料檢索效率。
1.一種車(chē)輛維保資料檢索平臺(tái)構(gòu)建方法,其特征在于,包括:
2.如權(quán)利要求1所述的方法,其特征在于,還包括:
3.如權(quán)利要求2所述的方法,其特征在于,還包括:
4.如權(quán)利要求1所述的方法,其特征在于,所述車(chē)型數(shù)據(jù)和所述車(chē)輛vin碼的對(duì)應(yīng)關(guān)系采用vin解析規(guī)則解析得到,所述vin解析規(guī)則的構(gòu)建方法包括:
5.一種車(chē)輛維保資料檢索平臺(tái),其特征在于,包括:
6.如權(quán)利要求5所述的車(chē)輛維保資料檢索平臺(tái),其特征在于,所述檢索信息包括車(chē)輛vin碼和維保描述信息;所述檢索模塊響應(yīng)于所述檢索信息執(zhí)行的檢索步驟包括:
7.如權(quán)利要求5所述的車(chē)輛維保資料檢索平臺(tái),其特征在于,所述檢索模塊包括專(zhuān)有詞庫(kù)和分詞器;
8.如權(quán)利要求7所述的車(chē)輛維保資料檢索平臺(tái),其特征在于,所述檢索模塊還包括同義詞替換詞庫(kù),所述同義詞替換詞庫(kù)中存儲(chǔ)有所述專(zhuān)有詞語(yǔ)的同義詞;
9.如權(quán)利要求5所述的車(chē)輛維保資料檢索平臺(tái),其特征在于,還包括vin解析模塊,所述vin解析模塊用于根據(jù)vin解析模塊解析得到所述車(chē)型數(shù)據(jù)和所述車(chē)輛vin碼的對(duì)應(yīng)關(guān)系;所述vin解析規(guī)則的構(gòu)建方法包括: