欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于圖像識(shí)別的試題搜索方法和系統(tǒng)的制作方法

文檔序號(hào):9667339閱讀:1543來源:國知局
一種基于圖像識(shí)別的試題搜索方法和系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,尤其涉及一種基于圖像識(shí)別的試題搜索方法和系統(tǒng)。
【背景技術(shù)】
[0002]隨著互聯(lián)網(wǎng)時(shí)代浪潮的到來,教育行業(yè)也慢慢在開始被顛覆,在線教育產(chǎn)品也隨著這個(gè)趨勢(shì)井噴式地爆發(fā)出來,在這些產(chǎn)品之中最為突出的產(chǎn)品類型當(dāng)屬題庫類和拍照答疑類,為了解決現(xiàn)在學(xué)生們作業(yè)多,作業(yè)中遇到難題等問題,題庫類和拍照答疑類產(chǎn)品必須保證后臺(tái)題庫類大,滿足學(xué)生們能夠搜索到他們想要的題目和答案解析。然而題目中含有較多的圖形、公式、字母符號(hào),而且由于目前圖像識(shí)別的技術(shù)受限等原因,在傳統(tǒng)搜索方法中,學(xué)生們?cè)诶门恼沾鹨深惍a(chǎn)品的時(shí)候,拍出來的照片經(jīng)過圖像識(shí)別后,產(chǎn)生了大量的亂碼、錯(cuò)誤字符等問題,導(dǎo)致搜索查找出來的題目與學(xué)生們拍照上傳的題目不符,這樣會(huì)導(dǎo)致大量使用該產(chǎn)品的用戶流失。

【發(fā)明內(nèi)容】

[0003]本發(fā)明提供了一種基于圖像識(shí)別的試題搜索方法和系統(tǒng),大大提高了搜索的準(zhǔn)確度,解決了因圖像識(shí)別技術(shù)缺陷產(chǎn)生的亂碼、錯(cuò)誤字符,而導(dǎo)致的搜索不到準(zhǔn)確的題目推送給用戶的問題。
[0004]為實(shí)現(xiàn)上述設(shè)計(jì),本發(fā)明采用以下技術(shù)方案:
[0005]—方面,提供了一種基于圖像識(shí)別的試題搜索方法,該方法,包括:
[0006]識(shí)別試題圖像的原始信息;
[0007]使用所述原始信息對(duì)題庫的試題進(jìn)行搜索,匹配出預(yù)置數(shù)量的試題;刪除所述原始信息中不屬于漢字、數(shù)字、字母的信息和亂碼信息,得到文本信息;
[0008]分別計(jì)算所述預(yù)置數(shù)量的試題與所述文本信息的最大公共子序列;
[0009]根據(jù)所述最大公共子序列的長度推送檢索結(jié)果。
[0010]優(yōu)選地,所述根據(jù)最大公共子序列的長度推送檢索結(jié)果,包括:
[0011]推送最大公共子序列長度最長的試題;或
[0012]推送最大公共子序列長度最長的試題及試題對(duì)應(yīng)的答案和解析。
[0013]優(yōu)選地,所述根據(jù)最大公共子序列的長度推送檢索結(jié)果,包括:對(duì)最大公共子序列按長度從長到短進(jìn)行排序,推送長度排在前面的預(yù)置數(shù)目的試題。
[0014]優(yōu)選地,所述根據(jù)根據(jù)最大公共子序列的長度推送檢索結(jié)果,包括:
[0015]分別計(jì)算所述預(yù)置數(shù)量的試題與所述文本信息的相似度,相似度=最大公共子序列的長度/文本信息的長度;
[0016]根據(jù)所述相似度推送檢索結(jié)果。
[0017]優(yōu)選地,所述根據(jù)所述相似度推送檢索結(jié)果,包括:
[0018]推送最大相似度的試題;或
[0019]推送最大相似度的試題及試題對(duì)應(yīng)的答案和解析。
[0020]優(yōu)選地,所述根據(jù)所述相似度推送檢索結(jié)果,包括:對(duì)所述相似度進(jìn)行從大到小排序,推送相似度排在前面的預(yù)置數(shù)目的試題。
[0021 ]另一方面,提供了一種基于圖像識(shí)別的試題搜索系統(tǒng),該系統(tǒng),包括:
[0022]識(shí)別模塊,識(shí)別試題圖像的原始信息;
[0023]匹配模塊,使用所述原始信息對(duì)題庫的試題進(jìn)行搜索,匹配出預(yù)置數(shù)量的試題;
[0024]刪除模塊,刪除所述原始信息中不屬于漢字、數(shù)字、字母的信息和亂碼信息,得到文本信息;
[0025]計(jì)算模塊,分別計(jì)算所述預(yù)置數(shù)量的試題與所述文本信息的最大公共子序列;
[0026]推送模塊,根據(jù)所述最大公共子序列的長度推送檢索結(jié)果。
[0027]優(yōu)選地,所述推送模塊,具體用于,
[0028]推送最大公共子序列長度最長的試題;或
[0029]推送最大公共子序列長度最長的試題及試題對(duì)應(yīng)的答案和解析;或
[0030]對(duì)最大公共子序列按長度從長到短進(jìn)行排序,推送長度排在前面的預(yù)置數(shù)目的試題;
[0031 ] 優(yōu)選地,所述推送模塊還包括:
[0032]計(jì)算單元,分別計(jì)算所述預(yù)置數(shù)量的試題與所述文本信息的相似度,相似度=最大公共子序列的長度/文本信息的長度;
[0033]推送單元,根據(jù)所述相似度推送檢索結(jié)果。
[0034]優(yōu)選地,所述推送單元具體用于:
[0035]推送最大相似度的試題;或
[0036]推送最大相似度的試題的試題及試題對(duì)應(yīng)的答案和解析;或
[0037]對(duì)所述相似度進(jìn)行從大到小排序,推送相似度排在前面的預(yù)置數(shù)目的試題。
[0038]與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果為:一種基于圖像識(shí)別的試題搜索方法,包括:識(shí)別試題圖像的原始信息;使用所述原始信息對(duì)題庫的試題進(jìn)行搜索,匹配出預(yù)置數(shù)量的試題;刪除所述原始信息中不屬于漢字、數(shù)字、字母的信息和亂碼信息,得到文本信息;分別計(jì)算所述預(yù)置數(shù)量的試題與所述文本信息的最大公共子序列;根據(jù)所述最大公共子序列的長度推送檢索結(jié)果。本發(fā)明根據(jù)題庫試題中的信息特點(diǎn),對(duì)圖像識(shí)別出來的原始信息進(jìn)行加工處理,再利用最大公共子序列的容錯(cuò)性和魯棒性,減少了搜索匹配時(shí)的干擾因素,大大提高了搜索的準(zhǔn)確度,能夠搜索到準(zhǔn)確的題目,并推送給用戶。
【附圖說明】
[0039]為了更清楚地說明本發(fā)明實(shí)施例中的技術(shù)方案,下面將對(duì)本發(fā)明實(shí)施例描述中所需要使用的附圖作簡單的介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)本發(fā)明實(shí)施例的內(nèi)容和這些附圖獲得其他的附圖。
[0040]圖1是本發(fā)明【具體實(shí)施方式】中提供的一種基于圖像識(shí)別的試題搜索方法的第一實(shí)施例的方法流程圖。
[0041]圖2是本發(fā)明【具體實(shí)施方式】中提供的一種基于圖像識(shí)別的試題搜索方法的第二實(shí)施例的方法流程圖。
[0042]圖3是本發(fā)明【具體實(shí)施方式】中提供的一種基于圖像識(shí)別的試題搜索系統(tǒng)的第一實(shí)施例的結(jié)構(gòu)方框圖。
[0043]圖4是本發(fā)明【具體實(shí)施方式】中提供的一種基于圖像識(shí)別的試題搜索系統(tǒng)的第二實(shí)施例的結(jié)構(gòu)方框圖。
【具體實(shí)施方式】
[0044]為使本發(fā)明解決的技術(shù)問題、采用的技術(shù)方案和達(dá)到的技術(shù)效果更加清楚,下面將結(jié)合附圖對(duì)本發(fā)明實(shí)施例的技術(shù)方案作進(jìn)一步的詳細(xì)描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域技術(shù)人員在沒有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0045]請(qǐng)參考圖1,其是本發(fā)明【具體實(shí)施方式】中提供的一種基于圖像識(shí)別的試題搜索方法的第一實(shí)施例的方法流程圖。如圖所示,該方法,包括:
[0046]步驟S101:識(shí)別試題圖像的原始信息。
[0047]利用圖像識(shí)別技術(shù)識(shí)別試題圖像的原始信息。
[0048]步驟S102:使用所述原始信息對(duì)題庫的試題進(jìn)行搜索,匹配出預(yù)置數(shù)量的試題。
[0049]所述預(yù)置數(shù)量可以為30道、50道、100道或120道,優(yōu)選地,本實(shí)施例的預(yù)置數(shù)量為100道。
[0050]優(yōu)選地,搜索匹配的過程包括:
[0051]1.索引過程:
[0052]a)取數(shù)據(jù)庫的試題以及其屬性記錄,每一條記錄為一個(gè)文檔,離線構(gòu)建索引文件;
[0053]b)被索引文件經(jīng)過語法分析和語言處理形成一系列詞;
[0054]c)經(jīng)過索引創(chuàng)建形成詞典和反向索引表;
[0055]d)通過索引存儲(chǔ)將索引寫入硬盤。
[0056]2.搜索過程:
[0057]a)用戶輸入識(shí)別后的文本進(jìn)行查詢;
[0058]b)對(duì)查詢語句經(jīng)過語法分析和語言分析得到一系列詞;
[0059]c)通過語法分析得到一個(gè)查詢樹;
[0060]d)通過索引存儲(chǔ)將索引讀入到內(nèi)存;
[0061]e)利用查詢樹搜索索引,從而得到每個(gè)詞的文檔鏈表,對(duì)文檔鏈表進(jìn)行交差,并得到結(jié)果文檔;
[0062]f)將搜索到的結(jié)果文檔對(duì)查詢的相關(guān)性進(jìn)行排序;
[0063]g)返回查詢結(jié)果中最相關(guān)的100道試題。
[0064]步驟S103:刪除所述原始信息中不屬于漢字、數(shù)字、字母的信息和亂碼信息,得到文本信息。
[0065]采用圖像識(shí)別技術(shù)對(duì)試題圖像進(jìn)行識(shí)別后,會(huì)產(chǎn)生大量的亂碼、錯(cuò)誤字符等。例如:
[0066]原題為:
[0067]2011 ?云南曲靖中考)珠江流域某江段江水流向經(jīng)過B、C、D三點(diǎn)拐彎后與原來相同,如圖 7 — 1 — 20 ①所示,若Z ABC = 120。,Z BCD = 80°,則ZCDE =_度.
[0068]圖像識(shí)別后,得到的原始信息為:
[0069]0①珠江流域某江殷江水流向經(jīng)過二點(diǎn)拐彎后與一妒_ABC = 1200ZB⑶=800則乙d站=②麵圖已知ABn⑶八五=a-E⑶=戶則E =孑D慝a6的式一 E4㈧\
[0070]這時(shí),刪除原始信息中不屬于漢字、數(shù)字、字母的信息和亂碼信息,例如,①、㈧、慝、\等,能提高搜索的準(zhǔn)確性。
[0071]優(yōu)選地,步驟S102與步驟S103沒有固定順序,也可以先執(zhí)行步驟S103,再執(zhí)行步驟S102,或者步驟S102與步驟S103同時(shí)進(jìn)行。
[0072]步驟S104:分別計(jì)算所述預(yù)置數(shù)量的試題與所述文本信息的最大公共子序列。
[0073]利用動(dòng)態(tài)規(guī)劃理想中的求最大公共子序列的方法對(duì)搜索結(jié)果進(jìn)行優(yōu)化,由于該方法具有很強(qiáng)的魯棒性,對(duì)識(shí)別后的錯(cuò)誤信息又具有很好的容錯(cuò)性,這樣能夠降低干擾因子的干擾,提高搜索的準(zhǔn)確性。求最大公共子序列時(shí),不要求所求的字符在字符串中是連續(xù)的,而最大公共子串是要求在字符串中是連續(xù)存在的。對(duì)于原始數(shù)據(jù)基本有序或者順序不會(huì)改變的問題有一個(gè)較好的適用效果。
[0074]求最大公共子序列的基本原理為:
[0075]設(shè)X = (xl,x2,..., xm),Y = (yl, y2,..., yn),Z = (zl,z2,..., zk)為 X 和 Y
的任意最大公共子序列;
[0076]1、如果xm等于yn,則xm = yn = zk,且Zk_l是Xm_l與Yn_l的一個(gè)最大公共子序列;
[0077]2、如果xm不等于yn,那么zk不等于xm,意味著Z是Xm_l與Y的一個(gè)最大公共子序列;
[0078]3、如果xm不等于yn,那么zk不等于yn,意味著Z是Yn_l與X的一個(gè)最大公共子序列。
[0079]步驟S105:根據(jù)所述最大公共子序列的長度推送檢索結(jié)果。
[0080]優(yōu)選地,所述根據(jù)所述最大公共子序列的長度推送檢索結(jié)果,包括:推送最大公共子序列長度最長的試題;或推送最大公共子序列長度最長的試題及試題對(duì)應(yīng)的答案和解析。根據(jù)所述最大公共子序列的長度,可以只推送最大公共子序列長度最大的試題給用戶,也可以把試題及其對(duì)應(yīng)的答案和解析一起推送給用戶。
[0081]優(yōu)選地,所述根據(jù)所述最大公共子序列的長度
當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
乌兰察布市| 阿克苏市| 阜新市| 冀州市| 繁峙县| 华蓥市| 开原市| 云阳县| 庆城县| 沙湾县| 沙田区| 定南县| 嘉兴市| 昔阳县| 余庆县| 顺昌县| 轮台县| 甘孜县| 磐安县| 襄垣县| 灯塔市| 杭锦后旗| 内丘县| 胶州市| 清丰县| 茌平县| 盘山县| 谢通门县| 巍山| 许昌县| 崇信县| 黄龙县| 南丹县| 阿尔山市| 阳朔县| 合阳县| 玉环县| 北川| 昭苏县| 阿拉善左旗| 琼中|