本公開(kāi)大體涉及技術(shù)手冊(cè)中的技術(shù)信息,并且特別涉及從技術(shù)手冊(cè)提取信息的方法。
背景技術(shù):
1、飛行器發(fā)動(dòng)機(jī)或其他飛行器系統(tǒng)的技術(shù)手冊(cè)可以具有相對(duì)大的尺寸。因此,從飛行器發(fā)動(dòng)機(jī)手冊(cè)手動(dòng)提取主檢查特性(mic)信息和/或其他信息(諸如注釋和注意事項(xiàng))消耗大量的時(shí)間和精力。另外,提取mic信息和/或其他信息的過(guò)程可能容易出現(xiàn)人為錯(cuò)誤??紤]到飛行器發(fā)動(dòng)機(jī)的復(fù)雜性,mic信息對(duì)從事飛行器發(fā)動(dòng)機(jī)工作的工程師來(lái)說(shuō)非常有價(jià)值。然而,提取mic信息的錯(cuò)誤可能會(huì)減慢或暫停所進(jìn)行的工作。另外,從技術(shù)手冊(cè)的相對(duì)大的內(nèi)容尺寸中查找和提取所需的技術(shù)信息可能不實(shí)際,因?yàn)檫@可能需要時(shí)間。
技術(shù)實(shí)現(xiàn)思路
1.一種從技術(shù)手冊(cè)提取信息的方法,所述方法在包括一個(gè)或多個(gè)處理器的計(jì)算機(jī)系統(tǒng)上實(shí)施,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,其中,從所述技術(shù)手冊(cè)提取關(guān)鍵字包括使用基于正則表達(dá)式或有理表達(dá)式的提取程序。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,其中,所述主數(shù)據(jù)包括來(lái)自所述技術(shù)手冊(cè)的主檢查特性(mic)信息。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,其中,將所述所選關(guān)鍵字附加到所述表以提供所述主數(shù)據(jù)包括將所述所選關(guān)鍵字附加到電子表格文件。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,其中,在通過(guò)所述計(jì)算機(jī)系統(tǒng)接收所述主數(shù)據(jù)的所述一部分和對(duì)應(yīng)于所述主數(shù)據(jù)的所述一部分的所述第一標(biāo)簽表之前,手動(dòng)地標(biāo)記所述主數(shù)據(jù)的所述一部分以生成所述第一標(biāo)簽表。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,進(jìn)一步包括在所述計(jì)算機(jī)系統(tǒng)中將卡方檢驗(yàn)的結(jié)果輸入到所述機(jī)器學(xué)習(xí)模型,以獲得所述第二標(biāo)簽表。
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,其中,所述機(jī)器學(xué)習(xí)模型包括線性支持向量機(jī)(svm)分類器。
8.根據(jù)權(quán)利要求1所述的方法,其特征在于,其中,所述主數(shù)據(jù)包括主檢查特性(mic)信息。
9.根據(jù)權(quán)利要求1所述的方法,其特征在于,進(jìn)一步包括在通過(guò)所述計(jì)算機(jī)系統(tǒng)將所述所選關(guān)鍵字附加到表以提供所述主數(shù)據(jù)之前,創(chuàng)建基于域的詞典并通過(guò)所述計(jì)算機(jī)系統(tǒng)將所述所選關(guān)鍵字附加到所述表以基于所述基于域的詞典提供所述主數(shù)據(jù)。
10.根據(jù)權(quán)利要求1所述的方法,其特征在于,其中,所述技術(shù)手冊(cè)的所述數(shù)據(jù)大小在10mb和100mb之間,并且所述第二標(biāo)簽表的所述數(shù)據(jù)大小在1mb和2mb之間。