ingr_from=&select-key%3Ashenqingr_to=&attribute-node:record_start-row=60&attribute-node:record_page-row=100&#anchor
2.商標(biāo)公告數(shù)據(jù):
http://sbcx.saic.gov.cn:9080/tmois/wszhcx_getLikeCondit1n.xhtml?appCnName=<%cname%>&intCls=&paiType=0
3.軟件著作權(quán)公告數(shù)據(jù):
http://www.ccopyright.com.cn/cpcc/RRegisterAct1n.do?method=list&no=fck&sql_name=&sql_regnum=&sql_author=〈%=cname%>&curPage=l&count=10&sort0rder=&sortLabel=。
[0029]步驟S106,通過(guò)getHTTPPage方式訪問(wèn)步驟S105生成的第一 URL,獲得第一 URL對(duì)應(yīng)的頁(yè)面的HTML格式的數(shù)據(jù)源碼供步驟S107進(jìn)行標(biāo)記截取。
[0030]步驟S107,通過(guò)S106獲得的HTML格式的數(shù)據(jù)源碼,通過(guò)以“〈title〉”標(biāo)記開始和“〈/title〉”標(biāo)記結(jié)束生成第一信息碼;三種類別的知識(shí)產(chǎn)權(quán)類型對(duì)應(yīng)如下標(biāo)記生成第二信息碼:專利類型的開始標(biāo)記為“sop-totalCount”,結(jié)束標(biāo)記為“〈/span〉]”,商標(biāo)類型的開始標(biāo)記為“regNum”,結(jié)束標(biāo)記為“regNum”,軟件著作權(quán)類型的開始標(biāo)記為“登記日期”,結(jié)束標(biāo)記為“>2” ;軟件著作權(quán)類型時(shí)獲取第三信息碼,其開始標(biāo)記為“中國(guó)”,結(jié)束標(biāo)記為“<tdclass=”,其中商標(biāo)類型和專利類型沒有第三信息碼。
[0031]當(dāng)?shù)谝恍畔⒋a的值為空時(shí),返回S102步驟,同時(shí)檢查網(wǎng)絡(luò)是否正常;當(dāng)?shù)诙畔⒋a為空時(shí),跳過(guò)步驟S108,并設(shè)置第四信息碼的值為“O”;當(dāng)?shù)诙畔⒋a不為空時(shí),執(zhí)行步驟S108o
[0032]步驟S108,生成第四信息碼:知識(shí)產(chǎn)權(quán)類型為軟件著作權(quán)類型時(shí),當(dāng)?shù)诙畔⒋a不為空,并且第三信息碼為空時(shí),第四信息碼通過(guò)開始標(biāo)記為“[總數(shù)”,結(jié)束標(biāo)記為T獲取生成,第二信息碼不為空并且第三信息碼不為空時(shí),第四信息碼的值為“Γ;知識(shí)產(chǎn)權(quán)類型為專利時(shí),第二信息碼不為空時(shí),第四信息碼通過(guò)第二信息碼去雜質(zhì)后剩下數(shù)字;知識(shí)產(chǎn)權(quán)類型為商標(biāo)時(shí),第二信息碼不為空時(shí),第四信息碼的值為“I”。
[0033]步驟S109,當(dāng)?shù)诙畔⒋a不為空時(shí),將第一信息碼、第二信息碼和第四信息碼的信息,以及相應(yīng)的輔助數(shù)據(jù)對(duì)應(yīng)存貯在擁有知識(shí)產(chǎn)權(quán)的企業(yè)信息庫(kù)中,輔助數(shù)據(jù)包括通過(guò)步驟S102所讀出的企業(yè)名稱傳遞而獲得企業(yè)名稱,通過(guò)步驟S107和步驟S108追加獲取當(dāng)前的系統(tǒng)時(shí)間。
[0034]將所有數(shù)據(jù)執(zhí)行步驟SllO存入知識(shí)產(chǎn)權(quán)的企業(yè)信息總表,同時(shí)返回步驟SlOl將已經(jīng)成功檢索的記錄的進(jìn)行已執(zhí)行的標(biāo)記然后,返回步驟S102循環(huán)執(zhí)行,直至所有符合條件的企業(yè)數(shù)據(jù)檢索完成為止。
[0035]在執(zhí)行步驟S102前,通過(guò)設(shè)置一定數(shù)量的采樣數(shù)據(jù)進(jìn)行采樣,采樣數(shù)據(jù)包括企業(yè)擁有三種知識(shí)產(chǎn)權(quán)類別的一種、兩種、三種及上述組合的一定量的企業(yè),以及沒有任何知識(shí)產(chǎn)權(quán)的一定量的企業(yè),采樣走完整個(gè)流程,查看相關(guān)采集是否正常,此步驟確定網(wǎng)絡(luò)是否正常,官方公布數(shù)據(jù)格式是否發(fā)生變化和確定所設(shè)置的數(shù)據(jù)編碼方式是否正確。
[0036]當(dāng)全部待查的企業(yè)信息庫(kù)中符合條件的數(shù)據(jù)均已被正確執(zhí)行,并存入第一比對(duì)信息庫(kù)后,第一比對(duì)信息庫(kù)里的信息即為擁有知識(shí)產(chǎn)權(quán)的企業(yè),并且記錄著對(duì)應(yīng)擁有商標(biāo)、專利和軟件著作權(quán)的一種或多種組合的記錄,接下來(lái)執(zhí)行步驟S201獲取詳細(xì)的知識(shí)產(chǎn)權(quán)狀態(tài)記錄及年費(fèi)信息;
步驟S201從第一比對(duì)信息庫(kù)中獲取企業(yè)名稱,將根據(jù)第一比對(duì)信息庫(kù)中知識(shí)產(chǎn)權(quán)的類型分別生成對(duì)應(yīng)的編碼方式和URLencode/URLDecode加密/解密函數(shù)對(duì)應(yīng)生成符合規(guī)范的企業(yè)名稱數(shù)據(jù),并設(shè)置為第二變量; 步驟S202,以第二變量為基礎(chǔ),對(duì)應(yīng)不同的知識(shí)產(chǎn)權(quán)類型并發(fā)生成對(duì)應(yīng)的帶第二變量的第二 URL,并通過(guò)getHTTPPage方式訪問(wèn)第二 URL,將結(jié)果HTML靜態(tài)化,供步驟S203分別進(jìn)行標(biāo)記截?。?br> 步驟S203,根據(jù)不同的知識(shí)產(chǎn)權(quán)類別進(jìn)行不同的標(biāo)記進(jìn)行HTML內(nèi)容截取獲得第五信息碼、第六信息碼、第七信息碼和第八信息碼;當(dāng)?shù)谖逍畔⒋a為空時(shí),對(duì)應(yīng)的企業(yè)的知識(shí)產(chǎn)權(quán)截取出錯(cuò),返回步驟S201,并檢查網(wǎng)絡(luò)連接狀態(tài)、第一信息庫(kù)連接情況和對(duì)應(yīng)的知識(shí)產(chǎn)權(quán)公告信息發(fā)布網(wǎng)站的URL是否發(fā)生變化;
當(dāng)?shù)谖逍畔⒋a不為空,第六信息碼為空時(shí),表明該企業(yè)對(duì)應(yīng)的知識(shí)產(chǎn)權(quán)公布頁(yè)面中顯示只有一頁(yè)的對(duì)應(yīng)的知識(shí)產(chǎn)權(quán),不翻頁(yè),程序依次標(biāo)記并截取生成如下字段:企業(yè)名稱、知識(shí)產(chǎn)權(quán)名稱、知識(shí)產(chǎn)權(quán)類型、知識(shí)產(chǎn)權(quán)狀態(tài)、知識(shí)產(chǎn)權(quán)編號(hào)和知識(shí)產(chǎn)權(quán)公開時(shí)間,同時(shí)與第二輔助信息存貯到第一企業(yè)知識(shí)產(chǎn)權(quán)信息庫(kù);
當(dāng)?shù)谖逍畔⒋a和第六信息碼同時(shí)不為空,并且第七信息碼為空時(shí),第八信息碼即為頁(yè)碼,將第八信息碼去雜余數(shù)字后加入U(xiǎn)RL的頁(yè)碼參數(shù),生成第三URL,以第三URL中的第八信息碼為結(jié)束碼,O為開始碼生成FOR循環(huán)列出第三URL的子URL,并且依次執(zhí)行步驟S203步驟,直至FOR循環(huán)結(jié)束;
步驟S204,通過(guò)步驟S203,知識(shí)產(chǎn)權(quán)的基本信息存入第一企業(yè)知識(shí)產(chǎn)權(quán)信息庫(kù)后,當(dāng)知識(shí)產(chǎn)權(quán)類型為專利時(shí),按照步驟S201和步驟S202的方法,以第一企業(yè)知識(shí)產(chǎn)權(quán)信息庫(kù)為數(shù)據(jù)基礎(chǔ),讀取出企業(yè)名稱、專利名稱和專利申請(qǐng)?zhí)柣蛘邔@?hào),經(jīng)過(guò)格式轉(zhuǎn)化后獲得對(duì)應(yīng)的非加密的企業(yè)名稱,不帶點(diǎn)的專利號(hào)和通過(guò)URLencode加密后的專利名稱,并通過(guò)專利號(hào)或?qū)@暾?qǐng)?zhí)枮樽兞繀?shù),與專利公告發(fā)布網(wǎng)站的URL形成第三URL,并通過(guò)getHTTPPage方式訪問(wèn)第三URL,將結(jié)果HTML靜態(tài)化,供步驟S205分別進(jìn)行標(biāo)記截??;
步驟S205,通過(guò)標(biāo)記截取獲得第九信息碼、第十信息碼、第十一信息碼和第十二信息碼,其中第九信息為申請(qǐng)人名稱,第十信息碼為專利申請(qǐng)?zhí)柣蛘邔@?hào),第十一信息碼為申請(qǐng)日期,第十二信息碼為專利狀態(tài),當(dāng)專利法律狀態(tài)為“專利權(quán)維持”時(shí),轉(zhuǎn)到對(duì)應(yīng)的以專利申請(qǐng)?zhí)柣蛘邔@?hào)為變量參數(shù)的指向“專利費(fèi)用信息”的第四URL,并通過(guò)getHTTPPage方式訪問(wèn)第四URL,將結(jié)果HTML靜態(tài)化,通過(guò)標(biāo)識(shí)截取首年年費(fèi)金額,將上述信息與第三輔助信息一并存入第二企業(yè)知識(shí)產(chǎn)權(quán)信息庫(kù);
步驟S206,當(dāng)知識(shí)產(chǎn)權(quán)類型為專利時(shí),讀出第二企業(yè)知識(shí)產(chǎn)權(quán)信息庫(kù)的專利狀態(tài)為“專利權(quán)維持”的專利的專利申請(qǐng)?zhí)柣驅(qū)@?hào)、專利名稱、專利申請(qǐng)日期、專利首年年費(fèi)金額信息,通過(guò)公式計(jì)算出第二年所需要繳納的年費(fèi)金額及繳費(fèi)時(shí)間,然后發(fā)出信號(hào)提醒年費(fèi)時(shí)間;
步驟3301,上述所有步驟完成后,分別對(duì)第一組步驟3101、3102、3103、3104、3105、5106、5107、5108和5109,第二組步驟5201、5202、5203、5204、5205和5206分別設(shè)定下一次的執(zhí)行時(shí)間以定期檢索,并且可以對(duì)SlOl的企業(yè)信息庫(kù)中新增的企業(yè)進(jìn)行增量的檢索;
步驟S302,上述所有步驟完成后,結(jié)束全部步驟。
[0037] 所述的第一信息碼:通過(guò)以“〈title〉”標(biāo)記開始和“〈/title〉”標(biāo)記結(jié)束生成;三種類別的知識(shí)產(chǎn)權(quán)類型對(duì)應(yīng)如下標(biāo)記生成第二信息碼:專利類型的開始標(biāo)記為“sop-totalCount”,結(jié)束標(biāo)記為“〈/span〉]”,商標(biāo)類型的開始標(biāo)記為“regNum”,結(jié)束標(biāo)記為“regNum”,軟件著作權(quán)類型的開始標(biāo)記為“登記日期”,結(jié)束標(biāo)記為“>2” ;軟件著作權(quán)類型時(shí)獲取第三信息碼,其開始標(biāo)記為“中國(guó)”,結(jié)束標(biāo)記為“<td class=”,其中商標(biāo)類型和專利類型沒有第三信息碼;第四信息碼通過(guò)開始標(biāo)記為“[總數(shù)”,結(jié)束標(biāo)記為“]”獲取生成,步驟S203所述的第五信息碼截取的開始標(biāo)記與結(jié)束標(biāo)記與第一信息碼的標(biāo)記相同,第六信息碼截取的開始標(biāo)記與結(jié)束標(biāo)記與二信息碼的標(biāo)記相同,第七信息碼截取的開始標(biāo)記與結(jié)束標(biāo)記與三信息碼的標(biāo)記相同,第八信息碼對(duì)應(yīng)的起止標(biāo)記分別如下:
專利:開始標(biāo)記 “〈input type=’text’ class=' form-control' value=' I '/> /,’,結(jié)束標(biāo)記為“