欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種知識(shí)產(chǎn)權(quán)信息抓取與管理的方法_2

文檔序號:9667441閱讀:來源:國知局
&select-key%3Ashenqingr_from=&select-key%3Ashenqingr_to=&attribute_node:record_start-row=60&attribute_node:record_page-row=100&#anchor
2.商標(biāo)公告數(shù)據(jù):
http://sbcx.saic.gov.cn:9080/tmois/wszhcx_getLikeCondit1n.xhtml?appCnName=<%cname%>&intCls=&paiType=0
3.軟件著作權(quán)公告數(shù)據(jù):
http://www.ccopyright.com.cn/cpcc/RRegisterAct1n.do?method=list&no=fck&sql_name=&sql_regnum=&sql_author=<%=cname%>&curPage=l&count=10&sort0rder=&sortLabel=o
[0020]步驟S106,通過getHTTPPage方式訪問步驟S105生成的第一 URL,獲得第一 URL對應(yīng)的頁面的HTML格式的數(shù)據(jù)源碼供步驟S107進(jìn)行標(biāo)記截取。
[0021]步驟S107,通過S106獲得的HTML格式的數(shù)據(jù)源碼,通過以“〈title〉”標(biāo)記開始和“〈/title〉”標(biāo)記結(jié)束生成第一信息碼;三種類別的知識(shí)產(chǎn)權(quán)類型對應(yīng)如下標(biāo)記生成第二信息碼:專利類型的開始標(biāo)記為“sop-totalCount”,結(jié)束標(biāo)記為“〈/span〉] ”,商標(biāo)類型的開始標(biāo)記為“regNum”,結(jié)束標(biāo)記為“regNum”,軟件著作權(quán)類型的開始標(biāo)記為“登記日期”,結(jié)束標(biāo)記為“>2” ;軟件著作權(quán)類型時(shí)獲取第三信息碼,其開始標(biāo)記為“中國”,結(jié)束標(biāo)記為“<td class=”,其中商標(biāo)類型和專利類型沒有第三信息碼。
[0022]當(dāng)?shù)谝恍畔⒋a的值為空時(shí),返回S102步驟,同時(shí)檢查網(wǎng)絡(luò)是否正常;當(dāng)?shù)诙畔⒋a為空時(shí),跳過步驟S108,并設(shè)置第四信息碼的值為“0”;當(dāng)?shù)诙畔⒋a不為空時(shí),執(zhí)行步驟S108o
[0023]步驟S108,生成第四信息碼:知識(shí)產(chǎn)權(quán)類型為軟件著作權(quán)類型時(shí),當(dāng)?shù)诙畔⒋a不為空,并且第三信息碼為空時(shí),第四信息碼通過開始標(biāo)記為“[總數(shù)”,結(jié)束標(biāo)記為“]”獲取生成,第二信息碼不為空并且第三信息碼不為空時(shí),第四信息碼的值為“ 1” ;知識(shí)產(chǎn)權(quán)類型為專利時(shí),第二信息碼不為空時(shí),第四信息碼通過第二信息碼去雜質(zhì)后剩下數(shù)字;知識(shí)產(chǎn)權(quán)類型為商標(biāo)時(shí),第二信息碼不為空時(shí),第四信息碼的值為“1”。
[0024]步驟S109,當(dāng)?shù)诙畔⒋a不為空時(shí),將第一信息碼、第二信息碼和第四信息碼的信息,以及相應(yīng)的輔助數(shù)據(jù)對應(yīng)存貯在擁有知識(shí)產(chǎn)權(quán)的企業(yè)信息庫中,輔助數(shù)據(jù)包括通過步驟S102所讀出的企業(yè)名稱傳遞而獲得企業(yè)名稱,通過步驟S107和步驟S108追加獲取當(dāng)前的系統(tǒng)時(shí)間。
[0025]將所有數(shù)據(jù)執(zhí)行步驟S110存入知識(shí)產(chǎn)權(quán)的企業(yè)信息總表,同時(shí)返回步驟S101將已經(jīng)成功檢索的記錄的進(jìn)行已執(zhí)行的標(biāo)記然后,返回步驟S102循環(huán)執(zhí)行,直至所有符合條件的企業(yè)數(shù)據(jù)檢索完成為止。
[0026]在執(zhí)行步驟S102前,通過設(shè)置一定數(shù)量的采樣數(shù)據(jù)進(jìn)行采樣,采樣數(shù)據(jù)包括企業(yè)擁有三種知識(shí)產(chǎn)權(quán)類別的一種、兩種、三種及上述組合的一定量的企業(yè),以及沒有任何知識(shí)產(chǎn)權(quán)的一定量的企業(yè),采樣走完整個(gè)流程,查看相關(guān)采集是否正常,此步驟確定網(wǎng)絡(luò)是否正常,官方公布數(shù)據(jù)格式是否發(fā)生變化和確定所設(shè)置的數(shù)據(jù)編碼方式是否正確。
[0027]上述實(shí)施方式僅僅為本發(fā)明的其中實(shí)施方式之一。
【主權(quán)項(xiàng)】
1.一種知識(shí)產(chǎn)權(quán)信息抓取與管理的方法,其特征包括,其主要包含以下步驟: 步驟S102,在企業(yè)信息庫中讀出企業(yè)名稱的待查數(shù)據(jù); 步驟S103,根據(jù)三種類別將步驟S102所讀出的企業(yè)名稱通過函數(shù)轉(zhuǎn)為下列所列的對應(yīng)數(shù)據(jù)編碼:專利公告信息對應(yīng)編碼方式為UTF8,軟件著作權(quán)公告信息對應(yīng)編碼方式為GB2312,商標(biāo)公告信息對應(yīng)編碼方式為UTF8 ; 步驟S104,在步驟S103生成的對應(yīng)編碼方式的數(shù)據(jù)后,通過URLencode/URLDecode加密/解密函數(shù)將上述步驟S103的數(shù)據(jù)進(jìn)行加密,并輸出為第一變量,其中軟件著作權(quán)公告信息中,第一變量為明文,不進(jìn)行加密; 步驟S105,以上述第一變量作為對應(yīng)的URL的對應(yīng)參數(shù)值生成第一 URL ; 步驟S106,通過getHTTPPage方式訪問步驟S105生成的第一 URL,獲得第一 URL對應(yīng)的頁面的HTML格式的數(shù)據(jù)源碼供步驟S107進(jìn)行標(biāo)記截?。? 步驟S107,通過S106獲得的HTML格式的數(shù)據(jù)源碼,通過以“〈title〉”標(biāo)記開始和“〈/title〉”標(biāo)記結(jié)束生成第一信息碼;三種類別的知識(shí)產(chǎn)權(quán)類型對應(yīng)如下標(biāo)記生成第二信息碼:專利類型的開始標(biāo)記為“sop-totalCount”,結(jié)束標(biāo)記為“〈/span〉] ”,商標(biāo)類型的開始標(biāo)記為“regNum”,結(jié)束標(biāo)記為“regNum”,軟件著作權(quán)類型的開始標(biāo)記為“登記日期”,結(jié)束標(biāo)記為“ >2 ” ;軟件著作權(quán)類型時(shí)獲取第三信息碼,其開始標(biāo)記為“中國”,結(jié)束標(biāo)記為“ <tdclass=”,其中商標(biāo)類型和專利類型沒有第三信息碼; 當(dāng)?shù)谝恍畔⒋a的值為空時(shí),返回S102步驟,同時(shí)檢查網(wǎng)絡(luò)是否正常;當(dāng)?shù)诙畔⒋a為空時(shí),跳過步驟S108,并設(shè)置第四信息碼的值為“0”;當(dāng)?shù)诙畔⒋a不為空時(shí),執(zhí)行步驟S108 ; 步驟S108,生成第四信息碼:知識(shí)產(chǎn)權(quán)類型為軟件著作權(quán)類型時(shí),當(dāng)?shù)诙畔⒋a不為空,并且第三信息碼為空時(shí),第四信息碼通過開始標(biāo)記為“[總數(shù)”,結(jié)束標(biāo)記為“]”獲取生成,第二信息碼不為空并且第三信息碼不為空時(shí),第四信息碼的值為“ 1” ;知識(shí)產(chǎn)權(quán)類型為專利時(shí),第二信息碼不為空時(shí),第四信息碼通過第二信息碼去雜質(zhì)后剩下數(shù)字;知識(shí)產(chǎn)權(quán)類型為商標(biāo)時(shí),第二信息碼不為空時(shí),第四信息碼的值為“ 1” ; 步驟S109,當(dāng)?shù)诙畔⒋a不為空時(shí),將第一信息碼、第二信息碼和第四信息碼的信息,以及相應(yīng)的輔助數(shù)據(jù)對應(yīng)存貯在擁有知識(shí)產(chǎn)權(quán)的企業(yè)信息庫中; 將所有數(shù)據(jù)執(zhí)行步驟S110存入知識(shí)產(chǎn)權(quán)的企業(yè)信息總表,同時(shí)返回步驟S101將已經(jīng)成功檢索的記錄的進(jìn)行已執(zhí)行的標(biāo)記然后,返回步驟S102循環(huán)執(zhí)行,直至所有符合條件的企業(yè)數(shù)據(jù)檢索完成為止;執(zhí)行步驟S102前執(zhí)行步驟S101進(jìn)行企業(yè)信息查詢中,進(jìn)行企業(yè)類型、企業(yè)名稱、企業(yè)成立時(shí)間、企業(yè)注冊資金和企業(yè)注冊地址的一種條件或者多個(gè)條件組合檢索篩選出所需要檢索的數(shù)據(jù);步驟S110還可以通過將數(shù)據(jù)存貯在步驟S101所述的企業(yè)信息表對應(yīng)的字段中,同時(shí)將相應(yīng)的執(zhí)行標(biāo)記字段的值標(biāo)記為已執(zhí)行,然后步驟S102循環(huán)執(zhí)行,直至所有符合條件的企業(yè)數(shù)據(jù)檢索完成為止;步驟S109所述的輔助數(shù)據(jù)包括通過步驟S102所讀出的企業(yè)名稱傳遞而獲得企業(yè)名稱,通過步驟S107和步驟S108追加獲取當(dāng)前的系統(tǒng)時(shí)間;在執(zhí)行步驟S102前,通過設(shè)置一定數(shù)量的采樣數(shù)據(jù)進(jìn)行采樣,采樣數(shù)據(jù)包括企業(yè)擁有三種知識(shí)產(chǎn)權(quán)類別的一種、兩種、三種及上述組合的一定量的企業(yè),以及沒有任何知識(shí)產(chǎn)權(quán)的一定量的企業(yè),采樣走完整個(gè)流程,查看相關(guān)采集是否正常,此步驟確定網(wǎng)絡(luò)是否正常,官方公布數(shù)據(jù)格式是否發(fā)生變化和確定所設(shè)置的數(shù)據(jù)編碼方式是否正確;S107所述的知識(shí)產(chǎn)權(quán)類型為軟件著作權(quán)時(shí),當(dāng)?shù)诙畔⒋a不為空時(shí),通過設(shè)置第四信息碼的值為“1”而不采集生成第三信息碼;步驟S103所述的編碼方式,當(dāng)官方機(jī)構(gòu)公布的數(shù)據(jù)對應(yīng)的編碼發(fā)生變更時(shí),本方法將根據(jù)實(shí)際所發(fā)生的變化變更編碼方式;步驟S104所述的URL中,當(dāng)官方機(jī)構(gòu)公布時(shí)采用的URL進(jìn)行加密發(fā)布時(shí),本方法將根據(jù)實(shí)際情況進(jìn)行數(shù)據(jù)加密編碼?’步驟S104所述的URLencode/URLDecode加密/解密函數(shù)將上述步驟S103的數(shù)據(jù)進(jìn)行加密,其加密編碼根據(jù)實(shí)際情況進(jìn)行一次加密、二次和多次加密。
【專利摘要】本發(fā)明公開了一種知識(shí)產(chǎn)權(quán)信息抓取與管理的方法,其基于專利、商標(biāo)和軟件著作權(quán)三種常用的知識(shí)產(chǎn)權(quán)的公眾公開的登記或變更公告數(shù)據(jù)的頁面級別的通過getHTTPPage方法的抓取技術(shù),再結(jié)合標(biāo)記分析方法獲得第一信息碼、第二信息碼和第三信息碼,再通過上述信息碼之間的對比,在相應(yīng)程序下生成第四信息碼,然后依對應(yīng)的方法寫入第一知識(shí)產(chǎn)權(quán)信息庫和第二知識(shí)產(chǎn)權(quán)信息庫,以備不同的場合使用的一種企業(yè)知識(shí)產(chǎn)權(quán)信息抓取與管理的方法。
【IPC分類】G06F17/30
【公開號】CN105426492
【申請?zhí)枴緾N201510820954
【發(fā)明人】陳秀成
【申請人】清遠(yuǎn)市恒南資訊有限公司
【公開日】2016年3月23日
【申請日】2015年11月24日
當(dāng)前第2頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊!
1
安图县| 宁都县| 阿尔山市| 中超| 鄂托克旗| 长丰县| 安西县| 巴楚县| 特克斯县| 淮阳县| 淮滨县| 望谟县| 冀州市| 江安县| 武宣县| 攀枝花市| 荣昌县| 南召县| 兴业县| 彭阳县| 蒲江县| 开原市| 弥勒县| 英山县| 孟津县| 昭苏县| 南丰县| 会泽县| 慈溪市| 北京市| 南康市| 新河县| 台东县| 犍为县| 措勤县| 长垣县| 屏东县| 上虞市| 永登县| 天全县| 修水县|