本公開涉及信息處理
技術(shù)領(lǐng)域:
:,尤其涉及一種文字提取方法及裝置。
背景技術(shù):
::目前,大部分手機都具有拍照功能。用戶在日常生活中遇到需要記錄的重要信息時,往往來不及采用備忘錄進行記錄,此時用戶可以打開照相機拍攝圖片,之后在按照所拍攝的圖片整理出所需信息,提高了用戶記錄信息的便捷性。技術(shù)實現(xiàn)要素:為克服相關(guān)技術(shù)中存在的問題,本公開實施例提供一種文字提取方法及裝置。所述技術(shù)方案如下:根據(jù)本公開實施例的第一方面,提供一種文字提取方法,包括:提取多張圖片中每張圖片的文字,生成多組文字信息,其中,所述多組文字信息與所述多張圖片一一對應(yīng);按照預(yù)設(shè)順序排列所述多組文字信息;根據(jù)排列后的所述多組文字信息,生成文檔。本公開的實施例提供的技術(shù)方案可以包括以下有益效果:若相冊中存儲大量課件圖片,可以將課件圖片中的文字提取為文字信息,并將該文字信息整理成邏輯清晰的文檔,用戶可以保留生成的文檔,刪除相冊中的課件圖片,這樣一來,用戶可以較為便捷的查閱課件信息,同時節(jié)約了相冊的存儲空間,提高了用戶體驗。在一個實施例中,所述生成多組文字信息包括:根據(jù)提取到的每張圖片的文字和每張圖片的文字排版,生成每張圖片對應(yīng)的一組文字信息,每組文字信息的文字排版和與其對應(yīng)的圖片的文字排版相同。本公開的實施例提供的技術(shù)方案可以包括以下有益效果:按照每張課件圖片中的文字排版,提取并生成的每張課件圖片對應(yīng)的一組文字信息,使得每組文字信息的文字排版和與其對應(yīng)的圖片的文字排版相同,避免了因為改變了文字排版導(dǎo)致用戶無法分辨課件中重點內(nèi)容的情況,提高了用戶體驗。在一個實施例中,所述按照預(yù)設(shè)順序排列所述多組文字信息包括:按照所述多張圖片的排列順序排列所述多組文字信息。本公開的實施例提供的技術(shù)方案可以包括以下有益效果:由于圖片的排列順序反映了課件的先后順序,因此根據(jù)圖片的排列順序排列多組文字信息,可以保證文字信息的連貫性,使得生成的文檔邏輯清晰,便于用戶查閱。在一個實施例中,所述方法還包括:根據(jù)用戶操作,調(diào)整所述文檔中所述多組文字信息的組與組之間的先后順序。本公開的實施例提供的技術(shù)方案可以包括以下有益效果:在提取到多張圖片的文字信息之后,用戶可以根據(jù)邏輯順序調(diào)整多組文字信息的排列順序,使得生成的文檔邏輯清晰,便于用戶查閱。在一個實施例中,所述根據(jù)排列后的所述多組文字信息,生成文檔包括:根據(jù)所述排列后的多組文字信息,生成可編輯文檔。本公開的實施例提供的技術(shù)方案可以包括以下有益效果:生成可編輯文檔,使得用戶可以根據(jù)需要在已生成的可編輯文檔中添加新的內(nèi)容,提高了用戶使用文檔的靈活性,進一步提高了用戶體驗。在一個實施例中,所述可編輯文檔中相鄰兩組文字信息之間設(shè)置有分隔標(biāo)識。本公開的實施例提供的技術(shù)方案可以包括以下有益效果:生成可編輯文檔中相鄰兩組文字信息之間設(shè)置有分隔標(biāo)識,便于用戶區(qū)分不同的文字信息,確定查閱的位置。根據(jù)本公開實施例的第二方面,提供一種文字提取裝置,包括:提取模塊,用于提取多張圖片中每張圖片的文字,生成多組文字信息,其中,所述多組文字信息與所述多張圖片一一對應(yīng);排列模塊,用于按照預(yù)設(shè)順序排列所述多組文字信息;生成模塊,用于根據(jù)所述排列后的所述多組文字信息,生成文檔。在一個實施例中,所述生成模塊包括:生成子模塊,用于根據(jù)提取到的每張圖片的文字和每張圖片的文字排版,生成每張圖片對應(yīng)的一組文字信息,每組文字信息的文字排版和與其對應(yīng)的圖片的文字排版相同。在一個實施例中,所述排列模塊包括:排列子模塊,用于按照所述多張圖片的排列順序排列所述多組文字信息。在一個實施例中,所述裝置還包括:調(diào)整模塊,用于根據(jù)用戶操作,調(diào)整所述文檔中所述多組文字信息的組與組之間的先后順序。在一個實施例中,所述生成模塊根據(jù)所述排列后的多組文字信息,生成可編輯文檔。在一個實施例中,所述可編輯文檔中相鄰兩組文字信息之間設(shè)置有分隔標(biāo)識。根據(jù)本公開實施例的第三方面,提供一種文字提取裝置,包括:處理器;用于存儲處理器可執(zhí)行指令的存儲器;其中,所述處理器被配置為:提取多張圖片中每張圖片的文字,生成多組文字信息,其中,所述多組文字信息與所述多張圖片一一對應(yīng);按照預(yù)設(shè)順序排列所述多組文字信息;根據(jù)排列后的所述多組文字信息,生成文檔。應(yīng)當(dāng)理解的是,以上的一般描述和后文的細(xì)節(jié)描述僅是示例性和解釋性的,并不能限制本公開。附圖說明此處的附圖被并入說明書中并構(gòu)成本說明書的一部分,示出了符合本公開的實施例,并與說明書一起用于解釋本公開的原理。圖1a是根據(jù)一示例性實施例示出的文字提取方法的流程圖1。圖1b是根據(jù)一示例性實施例示出的文字提取方法的流程圖2。圖1c是根據(jù)一示例性實施例示出的文字提取方法的流程圖3。圖1d是根據(jù)一示例性實施例示出的文字提取方法的流程圖4。圖1e是根據(jù)一示例性實施例示出的文字提取方法的流程圖5。圖2是根據(jù)一示例性實施例示出的文字提取方法的流程圖6。圖3是根據(jù)一示例性實施例示出的文字提取方法的流程圖7。圖4a是根據(jù)一示例性實施例示出的文字提取裝置的結(jié)構(gòu)示意圖1。圖4b是根據(jù)一示例性實施例示出的文字提取裝置的結(jié)構(gòu)示意圖2。圖4c是根據(jù)一示例性實施例示出的文字提取裝置的結(jié)構(gòu)示意圖3。圖4d是根據(jù)一示例性實施例示出的文字提取裝置的結(jié)構(gòu)示意圖4。圖5是根據(jù)一示例性實施例示出的文字提取裝置的結(jié)構(gòu)框圖1。圖6是根據(jù)一示例性實施例示出的文字提取裝置的結(jié)構(gòu)框圖2。具體實施方式這里將詳細(xì)地對示例性實施例進行說明,其示例表示在附圖中。下面的描述涉及附圖時,除非另有表示,不同附圖中的相同數(shù)字表示相同或相似的要素。以下示例性實施例中所描述的實施方式并不代表與本公開相一致的所有實施方式。相反,它們僅是與如所附權(quán)利要求書中所詳述的、本公開的一些方面相一致的裝置和方法的例子。本公開實施例提供的技術(shù)方案用于終端,所述終端包括手機,平板電腦,以及其他能夠拍攝并保存圖片的設(shè)備。實際應(yīng)用中,若用戶正在接受培訓(xùn),講師在講解的過程中為了便于用戶理解講解內(nèi)容,可以使用投影儀播放課件。用戶為了更好的記錄講解的重點,可以使用手機的照相功能將播放的課件拍攝下來。但是一般的課件頁數(shù)較多,用戶可能需要拍攝多張圖片才能記錄完整,這些課件圖片會占用大量的存儲空間,導(dǎo)致終端可用的存儲空間減小。并且用戶在查看圖片格式的課件時,需要來回翻頁以便于銜接相鄰兩頁課件之間的內(nèi)容,較為不便。本公開實施例中,終端可以提取課件圖片中的文字,獲取每張課件圖片對應(yīng)的文字信息,然后根據(jù)這些文字信息生成文檔供用戶查閱,因此用戶可以較為便捷的查閱課件信息,同時節(jié)約了終端相冊的存儲空間,提高了用戶體驗。圖1a是根據(jù)一示例性實施例示出的一種文字提取方法的流程圖,所述文字提取方法用于終端,所述終端包括手機,平板電腦,以及其他能夠拍攝并保存圖片的設(shè)備,本公開實施例在此不做限定。如圖1a所示,所述文字提取方法包括以下步驟101至步驟103:在步驟101中,提取多張圖片中每張圖片的文字,生成多組文字信息。通常的,講師的課件除小部分示意圖之外,其他大部分內(nèi)容都以文字的形式體現(xiàn)。這些文字以圖片的形式進行存儲,占用了大量的存儲空間,因此在終端中存儲有大量課件圖片時,用戶可以根據(jù)需要選擇其中的多張圖片,依次提取每張圖片的文字,組成每張圖片對應(yīng)的文字信息,即生成多組文字信息,其中,多組文字信息與多張圖片一一對應(yīng)。示例的,終端中可以存儲多種文字的模板,在提取圖片上的文字時,可以通過圖像識別,確定圖片上的圖像與終端中存儲的某個文字是否匹配,若圖片上的圖像與終端中存儲的第一文字匹配,說明該圖像對應(yīng)的文字即為第一文字。在步驟102中,按照預(yù)設(shè)順序排列所述多組文字信息。示例的,用戶在拍攝課件圖片的時候,可能是按照課件的先后順序拍攝的,也可能是用戶隨機拍攝的,因此在獲取到每張圖片的文字信息之前,可以預(yù)先設(shè)置文字信息的排列順序。例如,可以按照所述多張圖片的排列順序排列,也可以按照多張圖片的存儲順序排列,或者還可以按照用戶選擇多張圖片的選擇順序進行排列,本公開實施例在此不做限定。在步驟103中,根據(jù)所述排列后的多組文字信息,生成文檔。示例的,所述文檔的格式可以為Word(MicrosoftofficeWord,文字處理軟件),TXT(TextFile,文本文件),PDF(PortableDocumentFormat,便攜式文檔格式)或者其他文本格式,本公開實施例對此不作限定。以文檔的格式為Word為例,在按照預(yù)設(shè)順序排列多組文字信息的順序之后,可以按照排列后的先后順序依次將多組文字信息寫入新建的Word文檔,并可以按照當(dāng)前時間為該Word文檔設(shè)置標(biāo)題或命名,最終生成以當(dāng)前時間命名或以當(dāng)前時間為標(biāo)題的Word文檔。實際應(yīng)用中,終端也可以接收用戶輸入的標(biāo)題或名稱,終端在將文字信息寫入新建的Word文檔之后,根據(jù)用戶的輸入信息為文檔設(shè)置標(biāo)題,或者為文檔命名。本公開的實施例提供的技術(shù)方案中,若相冊中存儲大量課件圖片,可以將課件圖片中的文字提取為文字信息,并將該文字信息整理成邏輯清晰的文檔,用戶可以保留生成的文檔,刪除相冊中的課件圖片,這樣一來,用戶可以較為便捷的查閱課件信息,同時節(jié)約了相冊的存儲空間,提高了用戶體驗。在一個實施例中,如圖1b所示,在步驟103中,生成多組文字信息,可以通過步驟1031實現(xiàn):在步驟1031中,根據(jù)提取到的每張圖片的文字和每張圖片的文字排版,生成每張圖片對應(yīng)的一組文字信息,每組文字信息的文字排版和與其對應(yīng)的圖片的文字排版相同。示例的,講師在編寫課件時,為了區(qū)分不同的內(nèi)容以及突出重點內(nèi)容,課件上文字的位置,大小以及顏色等會有區(qū)別,為了避免轉(zhuǎn)化成文檔之后,出現(xiàn)邏輯不清的情況,終端可以按照每張圖片的文字排版,提取每張圖片的文字信息,使得生成每張圖片對應(yīng)的文字信息的文字排版和與其對應(yīng)的圖片的文字排版相同。所述文字排版包括文字的位置,文字排列的方向,文字的大小,或者文字的顏色。以第一圖片為例,假設(shè)第一圖片包括三行文字,其中第一行文字為橫向排列,位于第一圖片的上方,三號字體,顏色為紅色;第二行文字為橫向排列,位于第一行文字下方,四號字體,顏色為黑色,其中第二行文字的第三個文字與第四個文字之間存在間隔;第三行文字為縱向排列,位于第一行文字和第二行文字下方,五號字體,顏色為綠色。按照上述排版提取第一圖片的文字信息,該文字信息中三行字體的排版與第一圖片的排版相同,即選用橫向排列方式,三號紅色字體記錄提取到的第一行文字;選用橫向排列方式,四號黑色字體記錄提取到的第二行文字;選用縱向排列方式,五號綠色字體記錄提取到的第三行文字。為了更進一步的體現(xiàn)第二行文字的第三個文字與第四個文字之間的間隔,文字信息中第二行文字的第三個文字與第四個文字之間可以采用空格或者“;”等分隔符斷開。本公開的實施例提供的技術(shù)方案中,按照每張課件圖片中的文字排版,提取并生成的每張課件圖片對應(yīng)的一組文字信息,使得每組文字信息的文字排版和與其對應(yīng)的圖片的文字排版相同,避免了因為改變了文字排版導(dǎo)致用戶無法分辨課件中重點內(nèi)容的情況,提高了用戶體驗。在一個實施例中,如圖1c所示,在步驟102中,按照預(yù)設(shè)順序排列所述多組文字信息,可以通過步驟1021實現(xiàn):在步驟1021中,按照所述多張圖片的排列順序排列所述多組文字信息。示例的,用戶在接受培訓(xùn)時,通常按照講師的講解順序拍攝課件,終端通常按照照片的拍攝時間的先后順序排列照片,因此終端中多張課件圖片的排列順序符合課件的邏輯順序,終端可以按照多張課件圖片在終端中的排列順序排列從所述多張課件圖片中提取得到的多組文字信息,使得根據(jù)排列后的多組文字信息生成的文檔邏輯清晰,便于用戶查閱。上述實施例同樣適用于圖1b所示的技術(shù)方案。本公開的實施例提供的技術(shù)方案中,由于圖片的排列順序反映了課件的先后順序,因此根據(jù)圖片的排列順序排列多組文字信息,可以保證文字信息的連貫性,使得生成的文檔邏輯清晰,便于用戶查閱。在一個實施例中,如圖1d所示,所述方法還包括步驟104:在步驟104中,根據(jù)用戶操作,調(diào)整所述文檔中所述多組文字信息的組與組之間的先后順序。示例的,在用戶接受培訓(xùn)的過程中,有可能根據(jù)講課的重點隨機的拍攝課件圖片,終端中課件圖片的排列順序較為混亂。為了查閱方便,用戶在終端將課件圖片轉(zhuǎn)化為文檔時可以調(diào)整多組文字信息組與組之間的先后順序。例如,用戶在相冊中選取多張課件圖片時,可以按照邏輯順序依次選取,終端在接收用戶選定的多張圖片時,可以記錄多張圖片的選取順序,當(dāng)終端獲取到多組文字信息之后,按照該選取順序調(diào)整多組文字信息的先后順序。或者,終端可以將用戶選擇的多張圖片顯示在排列界面上,用戶在該排列界面上按照邏輯順序調(diào)整圖片的順序,終端可以記錄用戶最終確定的圖片的邏輯順序,當(dāng)終端獲取到多組文字信息之后,按照該邏輯順序調(diào)整多組文字信息的先后順序?;蛘?,終端可以為用戶選擇的多張圖片進行編號,在終端提取圖片的文字信息之后,圖片可以根據(jù)邏輯順序依次輸入圖片編號,終端可以記錄用戶輸入的圖片編號的編號順序,當(dāng)終端獲取到多組文字信息之后,按照該編號順序調(diào)整多組文字信息的先后順序?;蛘?,當(dāng)終端獲取多組文字信息之后,可以顯示編輯頁面,該編輯頁面顯示多組文字信息的可編輯狀態(tài),用戶可以根據(jù)課件的邏輯順序,調(diào)整多組文字信息組與組之間的順序,調(diào)整完畢之后,終端根據(jù)編輯頁面上各組文字信息之間的順序,生成文檔。上述實施例同樣適用于圖1b所示的技術(shù)方案。本公開的實施例提供的技術(shù)方案中,在提取到多張圖片的文字信息之后,用戶可以根據(jù)邏輯順序調(diào)整多組文字信息的排列順序,使得生成的文檔邏輯清晰,便于用戶查閱。在一個實施例中,如圖1e所示,在步驟103中,根據(jù)所述排列后的多組文字信息,生成文檔,可以通過步驟1032實現(xiàn):在步驟1032中,根據(jù)所述排列后的多組文字信息,生成可編輯文檔。示例的,所述可編輯文檔包括Word或者TXT。以Word為例,終端在按照預(yù)設(shè)順序排列多組文字信息之后,可以按照排列后的多組文字信息的先后順序依次將該多組文字信息寫入新建的Word文檔,并以當(dāng)前時間作為該Word文檔的名稱。示例的,終端在提取課件圖片中的文字信息時,難免會出現(xiàn)提取不正確或者遺漏的情況,因此用戶在查閱生成的文檔時,可以根據(jù)需要修改該文檔或者補充遺漏的內(nèi)容。例如,用戶在終端屏幕上點擊需要補充內(nèi)容的位置,此時終端顯示輸入界面,用戶在該輸入界面上輸入需要補充的文字內(nèi)容,當(dāng)用戶確定輸入完成時,終端將用戶輸入的文字內(nèi)容顯示在用戶確定的需要補充內(nèi)容的位置?;蛘?,若用戶確定Word文檔中出現(xiàn)錯誤時,可以在屏幕上點擊錯誤的位置,此時終端顯示修改界面,該修改界面上顯示有用戶點擊位置的文字,用戶可以根據(jù)需要進行刪除,并輸入修改后的內(nèi)容。當(dāng)用戶確定修改完成時,終端在用戶確定的錯誤位置顯示修改后的內(nèi)容。實際應(yīng)用中,用戶輸入的內(nèi)容也可以是圖片、圖標(biāo)等。上述實施例同樣適用于圖1c或圖1d所示的技術(shù)方案。本公開的實施例提供的技術(shù)方案中,用戶可以根據(jù)需要在已生成的可編輯文檔中添加新的內(nèi)容,提高了用戶使用文檔的靈活性,進一步提高了用戶體驗。在一個實施例中,所述可編輯文檔中相鄰兩組文字信息之間設(shè)置有分隔標(biāo)識。為了便于用戶將查閱的Word文檔的位置定位至課件的位置,在將文字信息寫入Word文檔時,相鄰兩組文字信息之間可以通過分隔標(biāo)識隔開,所述分隔標(biāo)識可以為分隔線,空行或者以“*”組成的標(biāo)識,本公開實施例在此不做限定。本公開的實施例提供的技術(shù)方案中,生成可編輯文檔中相鄰兩組文字信息之間設(shè)置有分隔標(biāo)識,便于用戶區(qū)分不同的文字信息,確定查閱的位置。下面通過幾個實施例詳細(xì)介紹實現(xiàn)過程。圖2是根據(jù)一示例性實施例示出的一種文字提取方法的流程圖,執(zhí)行主體為終端,如圖2所示,所述文字提取方法包括以下步驟:在步驟201中,根據(jù)用戶指示,選擇多張圖片。在步驟202中,依次提取多張圖片中每張圖片的文字信息。在步驟203中,獲取所述多張圖片的排列順序。在步驟204中,按照所述排列順序排列從所述多張圖片中提取到的多組文字信息。在步驟205中,根據(jù)所述排列后的多組文字信息,生成可編輯文檔,所述可編輯文檔中相鄰兩組文字信息之間設(shè)置有分隔標(biāo)識。本公開的實施例公開一種文字提取方法,在該方法提供的技術(shù)方案中,若相冊中存儲大量課件圖片,可以將課件圖片中的文字提取為文字信息,并將該文字信息整理成邏輯清晰的文檔,用戶可以保留生成的文檔,刪除相冊中的課件圖片,這樣一來,用戶可以較為便捷的查閱課件信息,同時節(jié)約了相冊的存儲空間,提高了用戶體驗。圖3是根據(jù)一示例性實施例示出的一種文字提取方法的流程圖,執(zhí)行主體為終端,如圖3所示,所述文字提取方法包括以下步驟:在步驟301中,根據(jù)用戶指示,選擇多張圖片。在步驟302中,依次提取多張圖片中每張圖片的文字信息。在步驟303中,接收用戶輸入的調(diào)整順序。在步驟304中,按照所述調(diào)整順序調(diào)整多組文字信息組與組之間的順序。在步驟305中,根據(jù)所述調(diào)整后的多組文字信息,生成可編輯文檔,所述可編輯文檔中相鄰兩組文字信息之間設(shè)置有分隔標(biāo)識。在步驟306中,接收用戶輸入的文字內(nèi)容。在步驟307中,根據(jù)用戶指示將所述文字內(nèi)容寫入所述可編輯文檔中所述用戶指示指定位置。本公開的實施例公開一種文字提取方法,在該方法提供的技術(shù)方案中,若相冊中存儲大量課件圖片,可以將課件圖片中的文字提取為文字信息,并將該文字信息整理成邏輯清晰的文檔,用戶可以保留生成的文檔,刪除相冊中的課件圖片,這樣一來,用戶可以較為便捷的查閱課件信息,同時節(jié)約了相冊的存儲空間,提高了用戶體驗。下述為本公開裝置實施例,可以用于執(zhí)行本公開方法實施例。圖4a是根據(jù)一示例性實施例示出的一種文字提取裝置40的結(jié)構(gòu)示意圖,該裝置40可以通過軟件、硬件或者兩者的結(jié)合實現(xiàn)成為電子設(shè)備的部分或者全部。如圖4a所示,該文字提取裝置40包括:提取模塊401,用于提取多張圖片中每張圖片的文字,生成多組文字信息,其中,所述多組文字信息與所述多張圖片一一對應(yīng)。排列模塊402,用于按照預(yù)設(shè)順序排列所述多組文字信息。生成模塊403,用于根據(jù)所述排列后的所述多組文字信息,生成文檔。在一個實施例中,如圖4b所示,所述生成模塊403包括:生成子模塊4031,用于根據(jù)提取到的每張圖片的文字和每張圖片的文字排版,生成每張圖片對應(yīng)的一組文字信息,每組文字信息的文字排版和與其對應(yīng)的圖片的文字排版相同。在一個實施例中,如圖4c所示,所述排列模塊402包括:排列子模塊4021,用于按照所述多張圖片的排列順序排列所述多組文字信息。上述實施例也適用于圖4b所示的文字提取裝置40。在一個實施例中,如圖4d所示,所述裝置40還包括:調(diào)整模塊404,用于根據(jù)用戶操作,調(diào)整所述文檔中所述多組文字信息的組與組之間的先后順序。上述實施例也適用于圖4b或圖4c所示的文字提取裝置40。在一個實施例中,所述生成模塊403根據(jù)所述排列后的多組文字信息,生成可編輯文檔。在一個實施例中,所述可編輯文檔中相鄰兩組文字信息之間設(shè)置有分隔標(biāo)識。本公開的實施例公開一種文字提取裝置,若相冊中存儲大量課件圖片,該裝置可以將課件圖片中的文字提取為文字信息,并將該文字信息整理成邏輯清晰的文檔,用戶可以保留生成的文檔,刪除相冊中的課件圖片,這樣一來,用戶可以較為便捷的查閱課件信息,同時節(jié)約了相冊的存儲空間,提高了用戶體驗。本公開實施例提供一種文字提取裝置,該裝置包括:處理器;用于存儲處理器可執(zhí)行指令的存儲器;其中,處理器被配置為:提取多張圖片中每張圖片的文字,生成多組文字信息,其中,所述多組文字信息與所述多張圖片一一對應(yīng);按照預(yù)設(shè)順序排列所述多組文字信息;根據(jù)排列后的所述多組文字信息,生成文檔。在一個實施例中,上述處理器還可被配置為:根據(jù)提取到的每張圖片的文字和每張圖片的文字排版,生成每張圖片對應(yīng)的一組文字信息,每組文字信息的文字排版和與其對應(yīng)的圖片的文字排版相同。在一個實施例中,上述處理器還可被配置為:按照所述多張圖片的排列順序排列所述多組文字信息。在一個實施例中,上述處理器還可被配置為:根據(jù)用戶操作,調(diào)整所述文檔中所述多組文字信息的組與組之間的先后順序。在一個實施例中,上述處理器還可被配置為:根據(jù)所述排列后的多組文字信息,生成可編輯文檔。在一個實施例中,所述可編輯文檔中相鄰兩組文字信息之間設(shè)置有分隔標(biāo)識。本公開的實施例公開一種文字提取裝置,若相冊中存儲大量課件圖片,該裝置可以將課件圖片中的文字提取為文字信息,并將該文字信息整理成邏輯清晰的文檔,用戶可以保留生成的文檔,刪除相冊中的課件圖片,這樣一來,用戶可以較為便捷的查閱課件信息,同時節(jié)約了相冊的存儲空間,提高了用戶體驗。關(guān)于上述實施例中的裝置,其中各個模塊執(zhí)行操作的具體方式已經(jīng)在有關(guān)該方法的實施例中進行了詳細(xì)描述,此處將不做詳細(xì)闡述說明。圖5是根據(jù)一示例性實施例示出的一種用于文字提取裝置50的框圖,該裝置適用于終端設(shè)備。例如,裝置50可以是移動電話,計算機,數(shù)字廣播終端,消息收發(fā)設(shè)備,游戲控制臺,平板設(shè)備,醫(yī)療設(shè)備,健身設(shè)備,個人數(shù)字助理等。裝置50可以包括以下一個或多個組件:處理組件502,存儲器504,電源組件506,多媒體組件508,音頻組件510,輸入/輸出(I/O)的接口512,傳感器組件514,以及通信組件516。處理組件502通常控制裝置50的整體操作,諸如與顯示,電話呼叫,數(shù)據(jù)通信,相機操作和記錄操作相關(guān)聯(lián)的操作。處理組件502可以包括一個或多個處理器520來執(zhí)行指令,以完成上述的方法的全部或部分步驟。此外,處理組件502可以包括一個或多個模塊,便于處理組件502和其他組件之間的交互。例如,處理組件502可以包括多媒體模塊,以方便多媒體組件508和處理組件502之間的交互。存儲器504被配置為存儲各種類型的數(shù)據(jù)以支持在裝置50的操作。這些數(shù)據(jù)的示例包括用于在裝置50上操作的任何應(yīng)用程序或方法的指令,聯(lián)系人數(shù)據(jù),電話簿數(shù)據(jù),消息,圖片,視頻等。存儲器504可以由任何類型的易失性或非易失性存儲設(shè)備或者它們的組合實現(xiàn),如靜態(tài)隨機存取存儲器(SRAM),電可擦除可編程只讀存儲器(EEPROM),可擦除可編程只讀存儲器(EPROM),可編程只讀存儲器(PROM),只讀存儲器(ROM),磁存儲器,快閃存儲器,磁盤或光盤。電源組件506為裝置50的各種組件提供電力。電源組件506可以包括電源管理系統(tǒng),一個或多個電源,及其他與為裝置50生成、管理和分配電力相關(guān)聯(lián)的組件。多媒體組件508包括在所述裝置50和用戶之間的提供一個輸出接口的屏幕。在一些實施例中,屏幕可以包括液晶顯示器(LCD)和觸摸面板(TP)。如果屏幕包括觸摸面板,屏幕可以被實現(xiàn)為觸摸屏,以接收來自用戶的輸入信號。觸摸面板包括一個或多個觸摸傳感器以感測觸摸、滑動和觸摸面板上的手勢。所述觸摸傳感器可以不僅感測觸摸或滑動動作的邊界,而且還檢測與所述觸摸或滑動操作相關(guān)的持續(xù)時間和壓力。在一些實施例中,多媒體組件508包括一個前置攝像頭和/或后置攝像頭。當(dāng)裝置50處于操作模式,如拍攝模式或視頻模式時,前置攝像頭和/或后置攝像頭可以接收外部的多媒體數(shù)據(jù)。每個前置攝像頭和后置攝像頭可以是一個固定的光學(xué)透鏡系統(tǒng)或具有焦距和光學(xué)變焦能力。音頻組件510被配置為輸出和/或輸入音頻信號。例如,音頻組件510包括一個麥克風(fēng)(MIC),當(dāng)裝置50處于操作模式,如呼叫模式、記錄模式和語音識別模式時,麥克風(fēng)被配置為接收外部音頻信號。所接收的音頻信號可以被進一步存儲在存儲器504或經(jīng)由通信組件516發(fā)送。在一些實施例中,音頻組件510還包括一個揚聲器,用于輸出音頻信號。I/O接口512為處理組件502和外圍接口模塊之間提供接口,上述外圍接口模塊可以是鍵盤,點擊輪,按鈕等。這些按鈕可包括但不限于:主頁按鈕、音量按鈕、啟動按鈕和鎖定按鈕。傳感器組件514包括一個或多個傳感器,用于為裝置50提供各個方面的狀態(tài)評估。例如,傳感器組件514可以檢測到裝置50的打開/關(guān)閉狀態(tài),組件的相對定位,例如所述組件為裝置50的顯示器和小鍵盤,傳感器組件514還可以檢測裝置50或裝置50一個組件的位置改變,用戶與裝置50接觸的存在或不存在,裝置50方位或加速/減速和裝置50的溫度變化。傳感器組件514可以包括接近傳感器,被配置用來在沒有任何的物理接觸時檢測附近物體的存在。傳感器組件514還可以包括光傳感器,如CMOS或CCD圖像傳感器,用于在成像應(yīng)用中使用。在一些實施例中,該傳感器組件514還可以包括加速度傳感器,陀螺儀傳感器,磁傳感器,壓力傳感器或溫度傳感器。通信組件516被配置為便于裝置50和其他設(shè)備之間有線或無線方式的通信。裝置50可以接入基于通信標(biāo)準(zhǔn)的無線網(wǎng)絡(luò),如WiFi,2G或3G,或它們的組合。在一個示例性實施例中,通信組件516經(jīng)由廣播信道接收來自外部廣播管理系統(tǒng)的廣播信號或廣播相關(guān)信息。在一個示例性實施例中,所述通信組件516還包括近場通信(NFC)模塊,以促進短程通信。例如,在NFC模塊可基于射頻識別(RFID)技術(shù),紅外數(shù)據(jù)協(xié)會(IrDA)技術(shù),超寬帶(UWB)技術(shù),藍(lán)牙(BT)技術(shù)和其他技術(shù)來實現(xiàn)。在示例性實施例中,裝置50可以被一個或多個應(yīng)用專用集成電路(ASIC)、數(shù)字信號處理器(DSP)、數(shù)字信號處理設(shè)備(DSPD)、可編程邏輯器件(PLD)、現(xiàn)場可編程門陣列(FPGA)、控制器、微控制器、微處理器或其他電子組件實現(xiàn),用于執(zhí)行上述方法。在示例性實施例中,還提供了一種包括指令的非臨時性計算機可讀存儲介質(zhì),例如包括指令的存儲器504,上述指令可由裝置50的處理器520執(zhí)行以完成上述方法。例如,所述非臨時性計算機可讀存儲介質(zhì)可以是ROM、隨機存取存儲器(RAM)、CD-ROM、磁帶、軟盤和光數(shù)據(jù)存儲設(shè)備等。圖6是根據(jù)一示例性實施例示出的一種用于文字提取裝置60的框圖。例如,裝置60可以被提供為一服務(wù)器。裝置60包括處理組件602,其進一步包括一個或多個處理器,以及由存儲器603所代表的存儲器資源,用于存儲可由處理組件602的執(zhí)行的指令,例如應(yīng)用程序。存儲器603中存儲的應(yīng)用程序可以包括一個或一個以上的每一個對應(yīng)于一組指令的模塊。此外,處理組件602被配置為執(zhí)行指令,以執(zhí)行上述方法。裝置60還可以包括一個電源組件606被配置為執(zhí)行裝置60的電源管理,一個有線或無線網(wǎng)絡(luò)接口605被配置為將裝置60連接到網(wǎng)絡(luò),和一個輸入輸出(I/O)接口608。裝置60可以操作基于存儲在存儲器603的操作系統(tǒng),例如WindowsServerTM,MacOSXTM,UnixTM,LinuxTM,F(xiàn)reeBSDTM或類似。一種非臨時性計算機可讀存儲介質(zhì),當(dāng)所述存儲介質(zhì)中的指令由裝置50的處理器或者裝置60的處理組件執(zhí)行時,使得裝置50或裝置60能夠執(zhí)行上述文字提取的方法,所述方法包括:提取多張圖片中每張圖片的文字,生成多組文字信息,其中,所述多組文字信息與所述多張圖片一一對應(yīng);按照預(yù)設(shè)順序排列所述多組文字信息;根據(jù)排列后的所述多組文字信息,生成文檔。在一個實施例中,所述生成多組文字信息包括:根據(jù)提取到的每張圖片的文字和每張圖片的文字排版,生成每張圖片對應(yīng)的一組文字信息,每組文字信息的文字排版和與其對應(yīng)的圖片的文字排版相同。在一個實施例中,所述按照預(yù)設(shè)順序排列所述多組文字信息包括:按照所述多張圖片的排列順序排列所述多組文字信息。在一個實施例中,所述方法還包括:根據(jù)用戶操作,調(diào)整所述文檔中所述多組文字信息的組與組之間的先后順序。在一個實施例中,所述根據(jù)排列后的所述多組文字信息,生成文檔包括:根據(jù)所述排列后的多組文字信息,生成可編輯文檔。在一個實施例中,所述可編輯文檔中相鄰兩組文字信息之間設(shè)置有分隔標(biāo)識。本領(lǐng)域技術(shù)人員在考慮說明書及實踐這里公開的公開后,將容易想到本公開的其它實施方案。本申請旨在涵蓋本公開的任何變型、用途或者適應(yīng)性變化,這些變型、用途或者適應(yīng)性變化遵循本公開的一般性原理并包括本公開未公開的本
技術(shù)領(lǐng)域:
:中的公知常識或慣用技術(shù)手段。說明書和實施例僅被視為示例性的,本公開的真正范圍和精神由下面的權(quán)利要求指出。應(yīng)當(dāng)理解的是,本公開并不局限于上面已經(jīng)描述并在附圖中示出的精確結(jié)構(gòu),并且可以在不脫離其范圍進行各種修改和改變。本公開的范圍僅由所附的權(quán)利要求來限制。當(dāng)前第1頁1 2 3 當(dāng)前第1頁1 2 3