欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種電信運營商用戶號碼采集的方法

文檔序號:7967402閱讀:362來源:國知局
專利名稱:一種電信運營商用戶號碼采集的方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種電信運營商用戶號碼采集的方法,該方法涉及電信運營商 獲取異網(wǎng)用戶數(shù)據(jù)和本網(wǎng)用戶流失信息的一種手段,從中獲取不同電信運營商 的用戶號碼,并根據(jù)最后使用的時間,判斷用戶是否在網(wǎng)的方法,特別適合于 分析各個電信運營商的用戶數(shù)量,并能記錄號碼信息的動態(tài)變化過程,屬于電 通信技術(shù)領(lǐng)域。
背景技術(shù)
對電信運營商而言,用戶號碼是其最寶貴的資源之一,由于目前各個運營 商間相對獨立和市場競爭,各自的號碼資源不能充分共享,這樣不利于充分利 用號碼資源,也不利于監(jiān)管機構(gòu)對電信運營商的監(jiān)管。目前獲取號碼資源的方法是從電信運營商的號碼資源庫中讀取記錄,這種 方式注重了本運營商的號碼占用情況,對其他運營商的號碼占用情況了解不多, 在競爭過程中處于不利地位,不能有針對性的提高用戶服務(wù)質(zhì)量,擴大用戶群。采集用戶號碼, 一般需要區(qū)分本地網(wǎng)和運營商,并記錄每天各自的新增用 戶、退網(wǎng)用戶即超過三個月未使用的號碼、總用戶數(shù),以及對應(yīng)的用戶號碼列 表。要得到這些數(shù)據(jù),就需要記錄每個本地網(wǎng)及運營商所有號碼、號碼最先出 現(xiàn)曰期,用于分析每天新增用戶、最后出現(xiàn)日期,用于分析退網(wǎng)用戶。一般處理系統(tǒng)對于數(shù)據(jù)的比較分析都在計算機內(nèi)存中進行,處理過程方便 快捷。但用戶號碼是海量數(shù)據(jù),例如, 一個具有一億號碼的大本地網(wǎng),如果將號碼排序置入內(nèi)存中進行,以平均每個號碼占10字節(jié)計算,就需要大約1G內(nèi)
存,再加上與號碼相關(guān)的信息,總體需要約3G大小的內(nèi)存,這超出了目前32 位計算機的處理能力,如果監(jiān)測范圍有多個本地網(wǎng),則占用的內(nèi)存空間還需更 大。發(fā)明內(nèi)容本發(fā)明的目的是提供一種能夠提高分析效率、運行在普通32位PC機上的 電信運營商用戶號碼采集的方法。為實現(xiàn)以上目的,本發(fā)明的技術(shù)方案是提供一種電信運營商用戶號碼采集 的方法,其特征在于,利用散列文件記錄號碼的信息,通過對散列文件的分析,得出各運營商的用戶號碼信息,其方法為步驟h初始化散列文〈牛在監(jiān)測范圍內(nèi),根據(jù)號碼的本地網(wǎng)和運營商從已建立的七號信令監(jiān)測系統(tǒng) 獲取呼叫記錄,以號碼的后六位數(shù)字作為散列鍵,組合生成一批散列文件,每個散列文件每行固定字節(jié)數(shù),為200字節(jié),共1000000行,每行的行號就是號 碼的后六位數(shù)字,再生成一個空的溢出文件;步驟2:分析呼叫記錄,提取呼叫中的主被叫信息等待從七號信令監(jiān)測系統(tǒng)中獲取呼叫記錄,并根據(jù)呼叫記錄的有效性,提 取有效呼叫記錄中的主被叫號碼,并分析其所在本地網(wǎng)和所屬運營商,査找、修改或創(chuàng)建號碼散列文件中的數(shù)據(jù);根據(jù)號碼的本地網(wǎng)和運營商,找到所屬散列文件,取號碼的后6位,組成 一個整數(shù),作為散列文件的檢索索引,不足6位,就以該號碼對應(yīng)的整數(shù)作為號碼散列文件的檢索索引,艮P:首先,對號碼散列文件讀取指針進行偏移,偏移量為檢索索引x每行字節(jié)數(shù);然后,讀取該行數(shù)據(jù),根據(jù)分隔符的位置,判斷是否有對應(yīng)用戶號碼,如
果有對應(yīng)的用戶號碼,修改該號碼的最后出現(xiàn)日期,如果沒有對應(yīng)用戶號碼, 在分隔符后添加該號碼,并注明第一次出現(xiàn)日期和最后出現(xiàn)日期; 步驟3:重復(fù)步驟l、 2直至軟件退出或呼叫記錄處理完畢; 步驟4:處理散列文件以定時處理或按需處理的方式,讀取號碼散列文件,根據(jù)每個號碼的第一 次出現(xiàn)日期和最后出現(xiàn)日期得出每天的新增用戶和退網(wǎng)用戶。目前,各地主要運營商均建立了七號信令監(jiān)測系統(tǒng),該系統(tǒng)的一個重要作 用是產(chǎn)生監(jiān)測范圍內(nèi)的所有呼叫記錄。本發(fā)明就是從七號信令監(jiān)測系統(tǒng)獲取呼 叫記錄,從中提取用戶號碼,并利用散列文件記錄號碼的相關(guān)信息,通過對散 列文件的分析,得出各運營商的用戶號碼信息。為了克服分析海量號碼帶來的計算機內(nèi)存問題,又能提高分析速度,本發(fā) 明利用散列文件方式進行號碼處理,以號碼的后六位數(shù)字作為散列鍵,建立一個ASCII文件即稱為散列文件,該方法首先按本地網(wǎng)和運營商的組合,建立一 批散列文件,每個散列文件每行固定字節(jié)數(shù),通常為200字節(jié),共1000000行, 每行的行號就是號碼的后六位數(shù)字。整個文件的大小通常約200M,這樣每行 可以記錄6個號碼的信息,文件大小合適便于讀取,且不會造成太多的存儲空 間浪費,另外,為了防止一行不夠記錄所有相同散列鍵的號碼即稱為溢出,還 需生成一個溢出文件,溢出文件每行的格式與散列文件相同,但行數(shù)按需生成, 按照現(xiàn)有的一個省網(wǎng)的號碼量計算,溢出總行數(shù)不會超過一千萬行,即總大小 不會超過2G,在目前32位計算機的處理能力之內(nèi)。在分析時,每次讀取七號信令監(jiān)測系統(tǒng)的一條呼叫記錄,首先判斷是不是 可以分析的有效記錄,從有效的呼叫記錄中分析出號碼,并判斷出其所屬本地 網(wǎng)和運營商,找到其存儲的散列文件,取其后6位數(shù)字作為一個整數(shù),并以此 整數(shù)作為散列文件的檢索索引。小于6位數(shù)字的號碼就以該號碼對應(yīng)的整數(shù)作 為散列文件的檢索索引。在文件中偏移檢索索引X每行字節(jié)數(shù),即可定位到該 號碼所在的存儲位置。如果該號碼第一次出現(xiàn),則在該行數(shù)據(jù)中寫入相關(guān)的日 期信息和6位數(shù)字以外的號碼信息;如果該號碼不是第一次出現(xiàn),則在該行數(shù) 據(jù)中修改對應(yīng)的最后出現(xiàn)日期記錄,以明確該號碼的第一次出現(xiàn)日期和最后一 次出現(xiàn)日期。如果某一行溢出,則在溢出文件的最后添加一行,并將行號記錄 在散列文件中。如果溢出文件的行記錄也溢出,則也在溢出文件的最后添加一 行,將新行號記錄在前一溢出行中。當需要獲取號碼集合時,根據(jù)各本地網(wǎng)和運營商,選擇散列文件,通過掃 描該散列文件獲取不同運營商當前的號碼資料,并統(tǒng)計計數(shù),保存入庫,便于 今后查詢各個運行商的用戶數(shù)量的變化曲線。本發(fā)明的優(yōu)點是1. 能夠達到較高的分析效率,并通過使用格式化的散列文件方式避免了對 處理機內(nèi)存的過度使用,可以在一臺32位PC機上完成,對處理機CPU的要 求不高;2. 由于文件具有可以長期保存的特點,滿足對電信用戶號碼的長期監(jiān)測, 經(jīng)過長期的數(shù)據(jù)積累,數(shù)據(jù)的準確性和有效性得到極大提高,加上文件格式的 可讀性,可以隨時讀出各個運營商的用戶數(shù)量、列表及新增、流失情況;3. 分析七號信令監(jiān)測系統(tǒng)中的呼叫記錄,也是對系統(tǒng)已有數(shù)據(jù)的深入挖掘 的一種方式,提高了系統(tǒng)的利用效率,增強了系統(tǒng)的支撐作用。


圖1為一種電信運營商用戶號碼采集的方法技術(shù)方案的流程圖; 圖2為一種電信運營商用戶號碼采集的方法實施的程序流程圖。
具體實施方式
以下結(jié)合附圖和實施例對本發(fā)明作進一步說明。但本實施例并不用于限制 本發(fā)明,凡是采用本發(fā)明的相似結(jié)構(gòu)、相似方法及其相似變化,均應(yīng)列入本發(fā) 明的保護范圍。實施例如圖1所示,為一種電信運營商用戶號碼采集的方法技術(shù)方案的流程圖, 如圖2所示,為一種電信運營商用戶號碼采集的方法實施的程序流程圖,左圖 為以散列文件的方法記錄用戶號碼信息的流程,右圖為從散列文件統(tǒng)計分析用 戶號碼的流程?,F(xiàn)以上海地區(qū)為例,分析02155886688這個號碼,說明該號碼采集方法的 實施步驟-步驟l:初始化號碼散列文件根據(jù)本電信領(lǐng)域用戶號碼采集單元所監(jiān)測的范圍即本地網(wǎng)與所關(guān)心的運營 商確定所需的散列文件,通常一個本地網(wǎng)有中國電信、中國網(wǎng)通、中國移動、 中國聯(lián)通和中國鐵通5個運營商,每個本地網(wǎng)和運營商的組合為一個文件,如 上海電信的散列文件可標識為21—1, "21"為上海本地網(wǎng)代號,"1"為中國電 信編號;步驟2:分析呼叫記錄,提取呼叫中的主被叫信息;從七號信令監(jiān)測系統(tǒng)中獲取呼叫記錄,并根據(jù)呼叫記錄的有效性,提取有 效呼叫記錄中的主被叫號碼,呼叫有效性判斷依據(jù)是應(yīng)答呼叫或呼損為用戶 忙的呼叫,然后根據(jù)運營商的號段,找出該號碼所在本網(wǎng)和所屬運營商,剔除 號碼的長途字冠,本例021為上海,運營商為電信,去除長途字冠后的號碼為55886688,査找、修改或創(chuàng)建號碼序列文件中的數(shù)據(jù)。 根據(jù)號碼所在本地網(wǎng)和所屬運營商,確定散列文件為21一1,根據(jù)號碼的后 6位,組成一個整數(shù),作為散列文件的檢索索引即散列鍵,不足6位,就以該號碼對應(yīng)的整數(shù)作為號碼散列文件的檢索索引,艮P:首先,對號碼散列文件讀取指針進行偏移,偏移量為檢索索引X每行字節(jié) 數(shù)為886688X200;然后,讀取該行數(shù)據(jù),根據(jù)分隔符的位置, 一般為V,判斷是否有對應(yīng)用 戶號碼,如果有對應(yīng)的用戶號碼,修改該號碼的最后出現(xiàn)日期;如果沒有對應(yīng)用戶號碼,在分隔符后添加該號碼,并注明第一次出現(xiàn)日期和最后出現(xiàn)日期,本例結(jié)果886688\t0000000\t66, 20060723, 20060724\t55, 20060724, 20060724\t\0\ 0\0\0\0... \0,其中886688的部分為號碼后六位,第一個V之后的7個0用 于記錄溢出行,接著是號碼剩余的前幾位、第一次出現(xiàn)日期和最后出現(xiàn)日期, 然后是另一個號碼的記錄,最后是填充若干個\0直至使整行為200字節(jié);散列文件中每一行為固定大小,如200字節(jié),只能記錄有限個號碼,如果 具有相同散列鍵(號碼后6位)的號碼超過一行所能記錄的大小(稱為溢出), 則在溢出文件的最后添加一行,并將行號記錄在散列文件相應(yīng)的行上。如果溢 出文件中的行還溢出,則在溢出文件最后再添加一行,將新行號記錄在上一溢 出行中。步驟3:重復(fù)步驟l、 2直至軟件退出或呼叫記錄處理完畢;步驟4:處理號碼散列文件以定時處理或按需處理的方式,讀取號碼散列文件,根據(jù)每個號碼的第一 次出現(xiàn)日期和最后出現(xiàn)日期得出每天的新增用戶和退網(wǎng)用戶,統(tǒng)計每個運營商 的總用戶數(shù)、新增用戶數(shù)及退網(wǎng)用戶數(shù),并提供號碼列表。本實施例在上海電信調(diào)試,調(diào)試機器為臺式PC機,配置為Intel P4CPU、
IDE接口 7200轉(zhuǎn)硬盤一個、Windows2003中文操作系統(tǒng),代碼采用Cll編寫。分 析一個月左右的呼叫記錄,發(fā)現(xiàn)兩千多萬個用戶號碼,運營商分別是上海電信、 上海網(wǎng)通、上海鐵通、上海移動、上海聯(lián)通,溢出文件大小238M。分析時由任 務(wù)程序定時從七號信令監(jiān)測系統(tǒng)下載呼叫記錄文件,分析程序只要發(fā)SL有未分 析的文件就繼續(xù)讀取并分析。按照上述配置,集中分析一天的呼叫記錄大約需 要6小時,速度上完全能達到實際的需求。如果提高硬盤的轉(zhuǎn)速即采用SCSI接 口的萬轉(zhuǎn)以上硬盤、將呼叫記錄文件與散列文件分別存放在兩個物理盤中,分 析速度將會大大地提高。
權(quán)利要求
1.一種電信運營商用戶號碼采集的方法,其特征在于,利用散列文件記錄號碼的信息,通過對散列文件的分析,得出各運營商的用戶號碼信息,其方法為步驟1初始化散列文件在監(jiān)測范圍內(nèi),根據(jù)號碼的本地網(wǎng)和運營商從已建立的七號信令監(jiān)測系統(tǒng)獲取呼叫記錄,以號碼的后六位數(shù)字作為散列鍵,組合生成一批散列文件,每個散列文件每行固定字節(jié)數(shù),為200字節(jié),共1000000行,每行的行號就是號碼的后六位數(shù)字,再生成一個空的溢出文件;步驟2分析呼叫記錄,提取呼叫中的主被叫信息等待從七號信令監(jiān)測系統(tǒng)中獲取呼叫記錄,并根據(jù)呼叫記錄的有效性,提取有效呼叫記錄中的主被叫號碼,并分析其所在本地網(wǎng)和所屬運營商,查找、修改或創(chuàng)建號碼散列文件中的數(shù)據(jù);根據(jù)號碼的本地網(wǎng)和運營商,找到所屬散列文件,取號碼的后6位,組成一個整數(shù),作為散列文件的檢索索引,不足6位,就以該號碼對應(yīng)的整數(shù)作為號碼散列文件的檢索索引,即首先,對號碼散列文件讀取指針進行偏移,偏移量為檢索索引×每行字節(jié)數(shù);然后,讀取該行數(shù)據(jù),根據(jù)分隔符的位置,判斷是否有對應(yīng)用戶號碼,如果有對應(yīng)的用戶號碼,修改該號碼的最后出現(xiàn)日期,如果沒有對應(yīng)用戶號碼,在分隔符后添加該號碼,并注明第一次出現(xiàn)日期和最后出現(xiàn)日期;步驟3重復(fù)步驟1、2直至軟件退出或呼叫記錄處理完畢;步驟4處理散列文件以定時處理或按需處理的方式,讀取號碼散列文件,根據(jù)每個號碼的第一次出現(xiàn)日期和最后出現(xiàn)日期得出每天的新增用戶和退網(wǎng)用戶。
全文摘要
一種電信運營商用戶號碼采集的方法,其特征在于,利用散列文件記錄號碼的信息,通過對散列文件的分析,得出各運營商的用戶號碼信息,本發(fā)明的優(yōu)點是能夠達到較高的分析效率,并通過使用格式化的散列文件方式避免了對處理機內(nèi)存的過度使用,可以在一臺32位PC機上完成,對處理機CPU的要求不高;由于文件具有可以長期保存的特點,滿足對電信用戶號碼的長期監(jiān)測,經(jīng)過長期的數(shù)據(jù)積累,數(shù)據(jù)的準確性和有效性得到極大提高,加上文件格式的可讀性,可以隨時讀出各個運營商的用戶數(shù)量、列表及新增、流失情況;分析七號信令監(jiān)測系統(tǒng)中的呼叫記錄,提高了系統(tǒng)的利用效率,增強了系統(tǒng)的支撐作用。
文檔編號H04W24/00GK101150822SQ200610116140
公開日2008年3月26日 申請日期2006年9月18日 優(yōu)先權(quán)日2006年9月18日
發(fā)明者偉 劉, 洋 施, 蔣乃華 申請人:上海欣泰通信技術(shù)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
元江| 陕西省| 合肥市| 揭东县| 梁平县| 星座| 新泰市| 庆安县| 潞西市| 元朗区| 紫云| 旺苍县| 塔城市| 班玛县| 沙坪坝区| 石嘴山市| 建阳市| 黔东| 邯郸县| 华安县| 白朗县| 涿州市| 科技| 任丘市| 临城县| 平遥县| 徐水县| 九龙县| 遵化市| 边坝县| 临海市| 广南县| 额济纳旗| 南康市| 巴彦淖尔市| 灯塔市| 陆川县| 星子县| 三都| 隆安县| 连南|