專利名稱:一種簡化電子郵件操作的方法及裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及電子郵件技術(shù),具體地說涉及一種簡化電子郵件操作的方法。本發(fā)明同時提供一種簡化電子郵件操作的裝置。
背景技術(shù):
電子郵件已經(jīng)成為辦公、通信的重要工具,獲得了廣泛的應(yīng)用。隨著電子郵件量的增加,使用者耗費在電子郵件處理上的時間不斷增加。用戶對電子郵件的處理包括多種方式,主要包括將電子郵件在郵箱的各個文件夾之間進(jìn)行移動;刪除電子郵件;改變電子郵件的屬性(例如改變電子郵件的重要性等級,保存電子郵件到郵箱之外的指定文件夾中等)。為了節(jié)省使用者的操作時間,如何在上述電子郵件處理過程中簡化使用者的操作,成為一個重要的研究課題。
在目前的處理電子郵件的操作中,對垃圾郵件的處理是其中首要的問題。所謂垃圾郵件,是指未經(jīng)用戶請求,強(qiáng)行發(fā)到用戶信箱中的任何廣告、宣傳資料、病毒等內(nèi)容的電子郵件,一般具有批量發(fā)送的特征。伴隨著電子郵件的廣泛使用,垃圾郵件日益增多,使用者往往需要花費大量時間處理毫無意義的垃圾郵件,嚴(yán)重干擾用戶對正常郵件的使用。更為嚴(yán)重的是,垃圾郵件還可能作為計算機(jī)病毒的載體,對計算機(jī)的運行造成損害。
現(xiàn)有技術(shù)下,對于垃圾郵件采取了許多措施。首先是避免郵箱成為垃圾郵件的發(fā)送對象,在這種措施未能成功的情況下,就需要對電子郵件采取過濾措施,將接收到的屬于垃圾郵件的電子郵件存放到特定的郵箱中,避免其影響正常郵件的使用,這是目前針對已經(jīng)接收到的垃圾郵件的主要處理辦法。
目前,收發(fā)郵件有兩種方式,一種是通過Outlook Express、Foxmail等郵件客戶端軟件收發(fā)電子郵件;另外一種是登陸服務(wù)商的站點收發(fā)郵件,稱為Webmail方式。在兩種方式下,都可以建立過濾垃圾郵件的規(guī)則,由垃圾郵件過濾模塊根據(jù)這些規(guī)則判定接收的郵件是否是垃圾郵件,并將判定為垃圾郵件的郵件存放到垃圾郵件箱文件夾。
由于現(xiàn)在反垃圾技術(shù)還不是很成熟,所以總有一些垃圾郵件被漏判為好郵件,或是好郵件被誤判為垃圾郵件。對于誤判和漏判的郵件,需要用戶人工去將其分撿出來移動到正確的文件夾。在foxmail等郵件客戶端軟件中,以及一些Webmail中,帶有垃圾郵件學(xué)習(xí)模塊,這些模塊能夠?qū)⒁呀?jīng)被判斷為垃圾郵件的郵件特征用于以后的判斷中,這種情況下,為了避免學(xué)習(xí)錯誤,更需要用戶去將這部分誤判和漏判的郵件分揀出來,否則將會造成更多的誤判和漏判。
由于需要用戶進(jìn)行手工分揀垃圾郵件,對于漏判的郵件,用戶需要手工一封一封選擇,然后移動到垃圾郵件箱中;而對于誤判的郵件,用戶要一封封選擇后,再移動到收件箱中。在這兩個過程中,用戶需要對每封郵件都進(jìn)行選擇,耗費大量時間。例如,如果一個用戶一天內(nèi)受到300封郵件,那么可能會有20封好郵件會被誤判為垃圾郵件,50封垃圾郵件被漏判。用戶就需要進(jìn)行70次的操作來分揀出這20封誤判和50封漏判的郵件。當(dāng)然,用戶可以一次選中多封垃圾郵件,但是這個過程仍然需要人工確認(rèn),即用戶需要確認(rèn)每封選中的郵件是否屬于垃圾郵件,然后才能對該郵件進(jìn)行處理,尤其是由于正常郵件有可能被埋沒在大量垃圾郵件中,用戶就更需要小心謹(jǐn)慎,防止將重要郵件錯判而造成損失,這一過程會消耗用戶的大量時間。
與上述處理垃圾郵件相似,現(xiàn)有技術(shù)下進(jìn)行其他類型的郵件處理也需要用戶對每一封郵件進(jìn)行選擇和處理,耗費大量時間。
發(fā)明內(nèi)容
針對上述缺陷,本發(fā)明解決的技術(shù)問題在于,提供一種電子郵件操作方法,該方法可簡化用戶對電子郵件的移動、刪除、分類等各類操作,尤其是簡化用戶對垃圾郵件進(jìn)行處理的過程。本發(fā)明同時提供的一種對電子郵件進(jìn)行操作的裝置。
本發(fā)明提供的一種簡化電子郵件操作的方法,包括11)對某個用戶郵箱分類郵件夾的所有郵件進(jìn)行相似性分類,即將判定為相似的郵件分為一個相似類;12)接收用戶對該分類郵件夾中郵件進(jìn)行的操作;13)根據(jù)用戶請求,對該分類郵件夾中與所述被操作的郵件屬于同一相似類的其他郵件進(jìn)行同樣的操作處理。
優(yōu)選地,所述步驟11)與12)之間包括21)用戶郵箱接收發(fā)送到本郵箱的新郵件,并將該郵件放入相應(yīng)的分類郵件夾;22)將所接收的郵件與相應(yīng)的分類郵件夾中已經(jīng)存放的郵件比較,根據(jù)比較結(jié)果進(jìn)行相似性歸類,即將該郵件歸入與其相似的相似類;若該郵件無法歸入任何已存在的相似類,則為該郵件設(shè)置新的相似類。
優(yōu)選地,所述步驟11)中對已存在的郵件進(jìn)行相似性分類后,對屬于一個相似類的郵件計數(shù);所述步驟22)之后,若對于進(jìn)入該分類郵件夾的所述新郵件判定為屬于某個已經(jīng)存在的相似類,則將該類的計數(shù)值加1;若該新郵件不屬于任何一個該郵件夾中已存在的相似類,則為該郵件設(shè)置新的相似類的同時,為該新設(shè)置的相似類計數(shù)。
優(yōu)選地,所述的相似性分類和相似性歸類中,對于相似的判定,是根據(jù)郵件文本進(jìn)行相似匹配計算,根據(jù)計算結(jié)果判定文本是否相似;所述相似匹配計算可以采用編輯距離算法、覆蓋率計算、余弦距離算法、詞頻、反向文本頻率類方法。
優(yōu)選地,所述步驟13)包括51)詢問是否需要對該郵件夾中的相似郵件作相同的操作,接收用戶的選擇;若選擇是,則進(jìn)入步驟52);若選擇否,則結(jié)束操作;52)選定屬于同一相似類的其他郵件;53)對上述選定的郵件進(jìn)行所述相同的操作。
優(yōu)選地,若所述步驟12)中的用戶對該郵件夾的郵件的操作為刪除,則步驟51)詢問是否要刪除該郵件夾中的同類郵件,若是,則步驟53)所述的操作為刪除操作;若所述步驟12)中的用戶對該郵件夾的郵件的操作為移動操作,則步驟51)詢問是否要對該郵件夾中的同類郵件進(jìn)行相同的移動,若是,則步驟53)中所述的操作為移動操作,并且在移動后的文件夾中,所有被移動的電子郵件在新的分類郵件夾中以時間順序排序。
優(yōu)選地,所述步驟13)后還包括,若所述操作為將郵件從垃圾郵件夾移動到其他郵件夾,則將所有被操作郵件的發(fā)件人加入白名單;若所述操作為將郵件移入垃圾郵件夾或直接刪除,則將所有被操作郵件的發(fā)件人加入黑名單。
本發(fā)明同時提供一種簡化電子郵件操作的裝置,包括相似性分類單元,用于讀取電子郵件樣本,并根據(jù)一定的相似性判斷策略進(jìn)行相似性分類,將相似的郵件分為一個相似類;所述電子郵件樣本為用戶郵箱的某一分類文件夾中的所有文件;執(zhí)行單元,用于接收用戶輸入的操作內(nèi)容,以及用戶選擇的作為操作對象的初始電子郵件,并據(jù)此進(jìn)行操作;若所述操作對象具有相似電子郵件時,根據(jù)用戶的選擇,對相似的電子郵件進(jìn)行相同的操作。
優(yōu)選地,該簡化電子郵件操作的裝置還包括相似性歸類單元,用于將新接收的電子郵件與該分類郵件夾中已存在的電子郵件進(jìn)行相似性判斷,若該新接收的電子郵件與某個相似類的電子郵件相似,則將該信接收的電子郵件歸入該相似類;如果未發(fā)現(xiàn)與該電子郵件相似的電子郵件,則將該電子郵件作為一個獨立的相似類。
優(yōu)選地,該裝置中,對應(yīng)于每一個相似類設(shè)置有相似郵件計數(shù)器,用于記錄該相似類的郵件數(shù)。
優(yōu)選地,所述的相似性分類單元和相似性歸類單元,對于相似的判定,是根據(jù)郵件文本進(jìn)行相似匹配計算,根據(jù)計算結(jié)果判定文本是否相似;所述相似匹配計算可以采用編輯距離算法、覆蓋率計算、余弦距離算法、詞頻.反向文本頻率類方法。
優(yōu)選地,該裝置還包括查詢單元,用于接收用戶選擇的初始電子郵件,并據(jù)此查詢對應(yīng)于該電子郵件的相似郵件計數(shù)器,獲得該初始電子郵件是否存在相似電子郵件的信息,并輸出該信息;問詢單元,用于接收所述查詢單元輸出的初始電子郵件是否存在相似郵件的信息,若該信息為存在相似電子郵件,則向用戶詢問是否對該分類郵件夾中的相似郵件作相同的操作,并接收用戶的選擇,以及將用戶的選擇結(jié)果輸出到所述執(zhí)行單元;選擇單元,接收所述問詢單元輸出的用戶的選擇結(jié)果,若用戶選擇對相似電子郵件進(jìn)行相同的操作,則選定與該郵件屬于同一相似類的所有郵件;所述執(zhí)行單元,接收上述問詢單元的輸出結(jié)果,以及所述選擇單元的選擇結(jié)果,并根據(jù)用戶初始選擇的操作內(nèi)容,對所述被選擇的所有同一相似類的電子郵件進(jìn)行該操作。
優(yōu)選地,若所述執(zhí)行單元進(jìn)行的操作為刪除操作,則所述問詢單元詢問用戶是否刪除該分類郵件夾中的所有同類郵件,并接收用戶的選擇,若用戶選擇是,則執(zhí)行單元刪除所述選擇單元選擇的所有屬于同一相似類的郵件;若所述執(zhí)行單元接收的操作選擇是對該分類文件夾中的被選擇郵件進(jìn)行移動操作,并且所述問詢單元輸出的用戶選擇結(jié)果為需要對相似電子郵件進(jìn)行相同的操作,則所述執(zhí)行單元對所述選擇單元選擇的屬于同一相似類的郵件進(jìn)行移動操作,并且將被移動的電子郵件在新的分類郵件夾中以時間順序排序。
優(yōu)選地,該裝置還包括學(xué)習(xí)單元;若所述執(zhí)行單元的操作為將郵件從垃圾郵件夾移動到其他郵件夾,則該學(xué)習(xí)單元將所有被移動郵件的發(fā)件人加入白名單;若所述執(zhí)行單元的操作為將郵件移入垃圾郵件夾或刪除,則該學(xué)習(xí)單元將所有被刪除郵件的發(fā)件人加入黑名單。
本發(fā)明的基本思路是,利用相似性分析技術(shù),根據(jù)電子郵件的相似性,將郵箱的各分類電子郵件夾中的郵件分為若干相似類,當(dāng)用戶對某一個電子郵件進(jìn)行操作時,則自動提示用戶是否對于該電子郵件的相似郵件作同樣的操作。當(dāng)用戶選擇“是”時,可以將用戶對一個初始郵件的操作加之于該電子郵件的相似郵件。
由于電子郵件,特別是垃圾電子郵件具有重復(fù)發(fā)送以及內(nèi)容重復(fù)的特點,用戶往往需要進(jìn)行同樣的操作處理,本發(fā)明提供的方法和裝置提供的處理機(jī)制,根據(jù)郵件之間的相似性,自動提取需要進(jìn)行相同操作的電子郵件,用戶無需自己進(jìn)行判斷,從而達(dá)到簡化用戶操作,為用戶節(jié)省時間。
圖1是本發(fā)明第一實施例的流程圖;圖2是本發(fā)明第二實施例的結(jié)構(gòu)框圖。
具體實施例方式
請參看圖1,為本發(fā)明第一實施例的流程圖。
步驟101,分別對用戶郵箱中各個分類郵件夾的郵件進(jìn)行相似性分類。
用戶郵箱一般具有多個分類郵件夾,每個分類郵件夾用于存放一種類型的郵件。對于本發(fā)明而言,較重要的是垃圾郵件夾和收件夾。大多數(shù)郵箱都首先將接收的郵件放入收件夾,垃圾郵件夾則用于存放垃圾郵件。所述的垃圾郵件可以由用戶從其他郵件夾中進(jìn)行刪除操作后進(jìn)入垃圾郵件夾,或者用戶將其他郵件夾的郵件直接移動到垃圾郵件夾;也可以是該用戶郵箱根據(jù)所設(shè)置的過濾條件,在接收郵件時直接放入垃圾郵件夾的郵件。
對于上述各個分類郵件夾中的郵件,首先進(jìn)行相似性分類。對于相似性分類這一過程而言,每個分類郵件夾的郵件組成一個郵件樣本庫。在一個分類郵件夾中,被判定為相似的郵件組成一類,成為相似類。進(jìn)行上述分類后,郵件夾中的郵件將以相似性為標(biāo)準(zhǔn)分為若干相似類,每一類的文件相互之間為相似的文件。為了便于識別相似類,本實施例為每一個電子郵件設(shè)置相似屬性標(biāo)志,同一相似類的電子郵件具有相同的相似屬性標(biāo)志。當(dāng)然,也可以通過設(shè)置專用的相似類列表并結(jié)合指針,進(jìn)行相似類的標(biāo)示?,F(xiàn)有技術(shù)下也存在許多其他的方法,對相似的郵件進(jìn)行標(biāo)記以便識別,不論采用何種方法,只要便于后續(xù)的相似性歸類即可。
為了便于后續(xù)操作,本實施例還對每個相似類的郵件數(shù)進(jìn)行計數(shù)。
進(jìn)行上述相似性分類,實際是根據(jù)文本進(jìn)行相似匹配,通常是全文匹配,具體的匹配部分包括發(fā)件人,收件人,郵件主題,郵件正文等內(nèi)容。現(xiàn)有技術(shù)已經(jīng)提供了多種比較成熟的相似度分析算法。主要包括編輯距離(Edit distance)算法。編輯距離來源于英文字之間的相似度計算,比如在計算“abcd”和“aecd”時,按照經(jīng)典的編輯距離計算editDist(abcd,aecd)=1。此時,相似度可以按照如下方法計算simedit(x,y)=11+editDist(x,y)]]>由于漢字的特點并不能直接利用編輯距離,但如果我們把漢字當(dāng)作字母看待,把文本當(dāng)作一串漢字看待的時候則可以利用編輯距離計算相似度。該種算法的優(yōu)點是計算簡單,帶入了字之間的順序信息;缺點是計算數(shù)值容易受到某些因素干擾,如偶然插入的干擾詞匯。
覆蓋率計算方法。如果我們簡單的將一個詞在某個文本中出現(xiàn)標(biāo)記為1,未出現(xiàn)標(biāo)記為0,則兩個文本之間的距離可以用覆蓋率來表示。此時用兩個文本之間共享的詞的個數(shù)除以共有的詞的個數(shù)就可以獲得一個最基本的覆蓋率信息。同樣,我們也可以很容易的將將詞頻信息帶入覆蓋率計算,這就是大量衍生的覆蓋率算法。該方法的優(yōu)點是計算方法簡單,一般>0.5級就可認(rèn)為相似。
余弦(COSINE)距離算法。此種方法采用的不再是具體出現(xiàn)次數(shù),而是詞在文本內(nèi)的權(quán)重信息等,比如,出現(xiàn)概率,TF/IDF等等以及大量衍生的計算公式。此方法需要計算兩個文本向量之間的余弦角。角度越小則表示這兩個文本越接近。該種方法的優(yōu)點是計算簡單,缺點是由于計算過程中一般要求全部文本集合固定,這樣勢必要隨時更新某些數(shù)值。對于頻繁出現(xiàn)新文本的郵件環(huán)境來說,需要考慮如何有效地更新這些信息。
詞頻.反向文本頻率(TF.IDF)類方法。TF(Term frequency)tfi,j為wi在文本dj中出現(xiàn)的次數(shù);DF(Document frequency)dfi為包含wi的所有文本個數(shù);CF(Collection frequency)cfi為wi在所有文本中出現(xiàn)的總數(shù);IDF(Inversedocument frequency);采用上述定義后,采用某種方法將TF/DF/CF值組織成某種權(quán)重公式,就是TF.IDF方法。這類方法計算公式變化多端,包含有數(shù)量眾多的衍生公式,其優(yōu)點是簡單有效,應(yīng)用廣泛;其缺點是需要大量文本來獲得較好的效果,但這種缺點剛好和垃圾郵件的特點吻合。
采用上述算法的一種或幾種,都可以較好的實現(xiàn)對每個分類郵件夾中的郵件的分類。
步驟S102,用戶郵箱接收發(fā)送到本郵箱的郵件,若有新郵件,則將該郵件放入相應(yīng)的分類郵件夾。
所述郵箱具體可以是郵件客戶端軟件郵箱,如采用Outlook Express或者Foxmail等郵件客戶端軟件設(shè)置的電子郵箱,也可以是采用網(wǎng)頁郵箱(Webmail)方式的電子郵箱。不論何種郵箱,一般都為用戶提供了防范垃圾郵件的功能。用戶可以利用這些功能進(jìn)行相應(yīng)的設(shè)置,例如設(shè)置過濾條件,對所接收的郵件進(jìn)行過濾,根據(jù)過濾條件將一些接收的郵件判斷為垃圾郵件,并直接存入垃圾郵件夾,其他正常郵件則存放入收件夾。
伴隨著垃圾郵件的迅速增加,現(xiàn)有技術(shù)提供了多種過濾垃圾郵件的技術(shù)措施。目前,至少有8-10種以上基本的郵件過濾方法,用于單獨或被組合過濾垃圾郵件。其中,一些垃圾郵件過濾技術(shù)簡單地使用是或否來明確定義垃圾郵件,而另一些過濾技術(shù)使用打分規(guī)則來評判一個郵件接近于垃圾郵件的程度?,F(xiàn)有技術(shù)下,無論采用何種垃圾郵件過濾技術(shù),都不可避免的存在對垃圾郵件的誤判或漏判,需要采取進(jìn)一步的措施將誤判或漏判的郵件放入合適的郵件夾。
步驟S103,將所接收的郵件與相應(yīng)郵件夾中已經(jīng)存放的郵件進(jìn)行比較,進(jìn)行相似性歸類。
由于收件夾或者垃圾郵件夾中的郵件,已經(jīng)進(jìn)行了相似性分類,所有的郵件中被判定為相似的郵件屬于同一相似類。對于新接收的郵件,可以與已經(jīng)存在的各類的郵件中的典型郵件進(jìn)行相似性比較,以便快速判斷其所屬的相似性類別。如果該郵件與一相似性分類的郵件相似,則將該郵件歸入該類,同時該相似類的計數(shù)值加1;如果該新郵件與任何已經(jīng)存在的相似性分類都不相似,則該郵件可以作為一個單獨的相似性分類,并將相似性分類的計數(shù)值設(shè)為1;上述過程成為相似性歸類。經(jīng)過相似性歸類,使郵件夾的每一個郵件都和與其相似的郵件屬于一類,也就是使相似的郵件產(chǎn)生了關(guān)聯(lián)。
步驟S104,接收用戶對某個文件夾中的文件的操作。
所述用戶對某個文件夾中的文件進(jìn)行操作,包括將電子郵件在郵箱的各個文件夾之間進(jìn)行移動;刪除電子郵件;改變電子郵件的屬性等等。
步驟S105,判斷被操作的電子郵件的相似郵件計數(shù)值是否為1。若是,則進(jìn)入步驟S109;若否,則進(jìn)入步驟S106由于為每相似郵件類的電子郵件均進(jìn)行了計數(shù),因此,讀取該計數(shù)值可以判斷與被操作的電子郵件屬于同類的相似郵件的數(shù)量,并根據(jù)該數(shù)量進(jìn)行相應(yīng)的選擇。若所述計數(shù)值為1,則不存在與該被操作的電子郵件同類的郵件,因此無需向用戶詢問是否需要對相似郵件進(jìn)行同樣的操作,若所述計數(shù)值不為1,則說明存在與該郵件相似的郵件,需要向用戶詢問是否需要對與該被操作郵件相似郵件進(jìn)行同樣的操作。
步驟S106,自動選擇所有與被操作郵件相似的郵件。
上述選擇的過程,具體而言,就是選中所有與該郵件屬于同一相似類的郵件。由于本實施例為屬于同一相似類的郵件設(shè)置了相同的相似屬性標(biāo)志,因此,實際只需尋找在該分類郵件夾中,與該郵件具有相同的相似屬性標(biāo)志的郵件。由于對每一個相似類的郵件數(shù)設(shè)置了計數(shù),因此,可以使用該計數(shù)值校核是否選中了所有相似郵件。
步驟S107,詢問是否對該分類郵件夾中的所有相似郵件執(zhí)行相同的操作。接收用戶的選擇,并判斷選擇內(nèi)容。若用戶選擇是,則進(jìn)入步驟S108;若用戶選擇否,則進(jìn)入步驟S109。
步驟S108,對所有與所述被操作郵件相似的郵件進(jìn)行相同的操作。
該步驟的內(nèi)容具體而言,就是將步驟S104中用戶對選定郵件進(jìn)行的操作,對步驟S106中選擇的所有郵件進(jìn)行。由于目前的許多電子郵件具有重復(fù)性、相似性,對于相似的電子郵件自動進(jìn)行相同的操作,可以節(jié)約用戶大量時間。尤其是對于大量不斷重發(fā)和復(fù)制的垃圾郵件,該步驟可以使用戶快速的進(jìn)行刪除,不需要將所有郵件打開進(jìn)行判斷。
步驟S109,判斷所進(jìn)行的操作是否為刪除郵件(或者向垃圾郵件箱移動)。若是,則進(jìn)入步驟S110;若否,則進(jìn)入步驟S112。
在目前的各類電子郵箱中,對于需要刪除的郵件,一般設(shè)有垃圾郵件箱,在其他分類郵件箱中刪除郵件,實際上是將郵件移入垃圾郵件箱。也可以直接將其他郵件箱的郵件移入垃圾郵件箱,與刪除郵件的效果相同。如果在垃圾郵件箱中刪除郵件,則是將郵件徹底刪除。當(dāng)然,也可以直接將郵件從普通的分類郵件夾中徹底刪除。為了應(yīng)對垃圾郵件的侵?jǐn)_,可以利用已經(jīng)確定的垃圾郵件的信息,為以后過濾垃圾郵件提供信息。目前,為垃圾郵件設(shè)立黑名單是一種常用的手段。所謂黑名單,實質(zhì)上是記錄用戶過濾垃圾郵件的攔截列表,郵件客戶端或者webmail會自動攔截進(jìn)入黑名單的發(fā)件人發(fā)出的信件。在本實施例中,由于前述操作為刪除操作,則應(yīng)當(dāng)考慮被刪除郵件的發(fā)件人是否屬于需要用戶希望阻止的發(fā)件人,并將此信息反映到黑名單中,以便郵箱在以后接收郵件時直接過濾該發(fā)信人的郵件。
步驟S110,詢問用戶是否將該郵件的發(fā)件人加入黑名單,并接收用戶的選擇;若用戶選擇否,則進(jìn)入步驟S115;若用戶選擇是,則進(jìn)入步驟S111。
步驟S111,將該操作所針對的郵件的發(fā)件人添加到黑名單中,然后跳轉(zhuǎn)到步驟S115。
所述概操作所針對的郵件,具體是指用戶最初操作針對的郵件,以及步驟S108中,進(jìn)行相同操作的所有相似郵件步驟S112,判斷所進(jìn)行的操作是否為恢復(fù)被刪除的郵件;若是,則進(jìn)入步驟S113;若否,則進(jìn)入步驟S115。
為了避免用戶郵箱的自動過濾功能出現(xiàn)錯誤,還設(shè)置有白名單,該名單記錄用戶可信任發(fā)件人列表,郵件客戶端或者webmail會自動放行白名單中發(fā)件人發(fā)出的郵件。如果上述操作是從垃圾郵件箱恢復(fù)被刪除的郵件,則說明用戶郵箱的自動過濾功能錯誤的將可信任的發(fā)件人的郵件作為垃圾郵件處理,為避免以后出現(xiàn)此種情況,應(yīng)當(dāng)根據(jù)該操作,將郵件的發(fā)件人加入白名單,避免以后再次出現(xiàn)錯誤。
步驟S113,詢問用戶是否將郵件的發(fā)件人加入白名單,并接收用戶的選擇。若是,則進(jìn)入步驟S114;若否,則進(jìn)入步驟S115。
所述的郵件包括用戶最初操作的郵件,也包括步驟S108中進(jìn)行了相同操作的其他相似郵件。
步驟S114,將該郵件的發(fā)件人加入白名單。
步驟S115,操作結(jié)束。
以上實施例說明了一種對電子郵件進(jìn)行操作的方法。該方法可以根據(jù)郵件的相似性,將用戶對某個分類郵件夾中某個郵件的操作實施于所有與其相似的郵件上,從而簡化用戶對電子郵件的操作,為用戶節(jié)省時間。該實施例提供的方法,尤其適用于用戶針對垃圾郵件的處理。這是由于垃圾郵件之間具有很多相似的特點,易于被歸為相似類,從而通過本實施例的方法簡化操作。
以下第二實施例說明一種對電子郵件進(jìn)行簡化操作的裝置,該裝置能夠完成上述第一實施例所述的操作方法。
該第二實施例提供的裝置包括相似性分類單元201、相似性歸類單元202、相似郵件計數(shù)器203、執(zhí)行單元204、查詢單元205、問詢單元206、選擇單元207、學(xué)習(xí)單元208。
該裝置應(yīng)用于至少具有垃圾郵件夾和其他至少一個分類郵件夾的郵箱環(huán)境中,并且本實施例中,該郵件項具有白名單和黑名單。所謂白名單,是記錄用戶可信任發(fā)件人的列表,,郵件客戶端或者webmail會自動放行白名單中發(fā)件人發(fā)出的郵件,避免將該郵件過濾到垃圾郵件。所謂黑名單,是記錄用戶過濾的垃圾郵件的發(fā)件人的攔截列表,郵件客戶端或者webmail會自動攔截進(jìn)入黑名單的發(fā)件人發(fā)出的信件。
請參看圖2,該圖示出本發(fā)明第二實施例的結(jié)構(gòu)框圖。
所述相似性分類單元201,用于讀取電子郵件樣本,并根據(jù)一定的相似性判斷策略進(jìn)行相似性分類,對于屬于同一相似類的電子郵件,設(shè)置同樣的電子郵件的相似屬性標(biāo)記。在本實施例中,所述電子郵件樣本為用戶郵箱的某一分類郵件夾中的所有文件。該相似性分類單元讀取一個分類郵件夾的電子郵件后,將各個電子郵件的文本互相之間作比較,將判定為相似的郵件加上相同的相似屬性標(biāo)記,從而使一組相互之間具有相似性的郵件形成一個相似類。也可以采用為各相似類建立列表,記錄各個相似類的所有的相似電子郵件。通過上述過程,該分類郵件夾中的所有郵件將被分為若干個相似類。對于存在多封郵件的一個相似類,可以選擇其中一個郵件作為該類的典型郵件。以所述的分類郵件夾為垃圾郵件夾為例,該相似性分類單元將垃圾郵件夾的所有郵件作為垃圾郵件的樣本進(jìn)行讀取并分類,通過這一分類將有助于對垃圾郵件的識別篩選。所述的相似性判斷的具體計算方法可以采用現(xiàn)有技術(shù)下進(jìn)行文本分析的各種方法,例如第一實施例所提及的幾種方法中的一種或幾種。
所述相似郵件計數(shù)器203,對應(yīng)于所述相似性分類單元201分類后獲得的相似類,用于記錄每個相似類包括的電子郵件數(shù)。
所述執(zhí)行單元204,用于接收用戶輸入的操作內(nèi)容,以及用戶選擇作為操作對象的初始電子郵件,并據(jù)此進(jìn)行操作。該執(zhí)行單元204還用于接收所述問詢單元206輸出的用戶對是否將該操作加之于相似電子郵件的選擇結(jié)果(圖2中的用戶選擇1),當(dāng)該選擇結(jié)果為“是”時,則進(jìn)一步接收選擇單元207選擇的與所述初始電子郵件相似的所有電子郵件,將其作為操作對象,并進(jìn)行與所述初始電子郵件相同的操作。該執(zhí)行單元204接收的用戶操作內(nèi)容主要包括對文件的刪除、移動以及改變文件的屬性等。
所述查詢單元205,用于接收用戶選擇的初始電子郵件,并根據(jù)該電子郵件的相似屬性標(biāo)記以及與該電子郵件對應(yīng)的相似類的相似郵件計數(shù)器203,判斷是否存在與該電子郵件相似的其他電子郵件,并將查詢結(jié)果輸出。
所述問詢單元206,用于接收所述查詢單元輸出的是否存在相似電子郵件的信息,若為存在相似的電子郵件,則通過產(chǎn)生對話窗口等方式,向用戶詢問是否對該分類郵件夾中的相似郵件作相同的操作,并接收用戶的選擇信息,以及將用戶的選擇輸出到所述選擇單元和執(zhí)行單元。若不存在相似電子郵件,則不進(jìn)行所述詢問。所述問詢單元206還用于接收學(xué)習(xí)單元208輸出的詢問是否要將電子郵件的發(fā)件人加入黑名單或白名單的詢問請求,并向用戶進(jìn)行詢問;該單元接收用戶的選擇,并將選擇內(nèi)容(圖2中用戶選擇2)輸出到所述學(xué)習(xí)單元208。
所述選擇單元207,用于接收所述問詢單元206輸出的用戶的選擇結(jié)果(圖2中示為用戶選擇1),若用戶選擇對相似電子郵件進(jìn)行相同的操作,則選定與該郵件屬于同一相似類的所有郵件,并將選擇結(jié)果輸出到執(zhí)行單元204和學(xué)習(xí)單元208。具體的選擇標(biāo)準(zhǔn),可以根據(jù)所述用戶初始操作涉及的電子郵件的相似屬性標(biāo)記,查詢該分類郵件夾中其他具有相同相似屬性標(biāo)記的郵件。當(dāng)然,如果相似郵件根據(jù)相似類建立了列表,則可以直接查詢列表,獲得所有的相似電子郵件。
所述學(xué)習(xí)單元208,用于獲取所述執(zhí)行單元204的操作內(nèi)容,若操作內(nèi)容為刪除電子郵件,則向所述問詢單元206發(fā)出是否將該電子郵件的發(fā)件人加入黑名單的問詢請求,并接收所述問詢單元輸出的用戶選擇內(nèi)容(圖2中用戶選擇2);若用戶選擇是,則學(xué)習(xí)單元將所有被操作電子郵件的發(fā)件人加入黑名單。與其相似,若操作內(nèi)容為從垃圾郵件夾移動電子郵件到其他郵件夾,則向所述問詢單元發(fā)出是否將該電子郵件的發(fā)件人加入白名單的問詢請求,并接收所述問詢單元輸出的用戶選擇內(nèi)容(圖2中用戶選擇2);若用戶選擇是,則學(xué)習(xí)單元將所有被操作電子郵件的發(fā)件人加入白名單。當(dāng)用戶選擇將郵件發(fā)件人添加到黑名單或白名單時,該單元同樣對所有相似電子郵件做同樣的處理。
所述相似性歸類單元202,用于將新接收的電子郵件與該分類郵件夾中已存在的電子郵件進(jìn)行相似性判斷,若該新接收的電子郵件與某個相似類的電子郵件相似,則將該信接收的電子郵件歸入該相似類,同時將該相似類對應(yīng)的相似郵件計數(shù)器加1;如果未發(fā)現(xiàn)與該電子郵件相似的電子郵件,則將該電子郵件作為一個獨立的相似類,并設(shè)置相應(yīng)的相似郵件計數(shù)器,并設(shè)該計數(shù)器的初始值為1。
以下說明使用上述裝置簡化電子郵件操作的過程。
例如,若所述執(zhí)行單元204進(jìn)行的操作為對某個初始郵件的刪除操作,并且所述查詢單元205查詢獲知該初始郵件具有相似電子郵件時,則所述問詢單元205詢問用戶是否刪除該分類郵件夾中的所有同類郵件,并接受用戶的選擇;若用戶選擇是,則執(zhí)行單元204刪除所述選擇單元207選擇的所有屬于同一相似類的郵件,并進(jìn)一步詢問是否將被刪除郵件的發(fā)件人加入黑名單。由于垃圾郵件具有內(nèi)容重復(fù)性的特點,上述操作可以一次性刪除所有重復(fù)的郵件,避免人工檢核。
再如,若所述執(zhí)行單元204接收的操作選擇是對該分類文件夾中的被選擇郵件進(jìn)行移動操作,并且所述問詢單元206輸出的用戶選擇結(jié)果為需要對相似電子郵件進(jìn)行相同的操作,則所述執(zhí)行單元204對所述選擇單元207選擇的相似電子郵件進(jìn)行移動操作,并且被移動的電子郵件在新的分類郵件夾中以時間順序排序。
本實施例提供的裝置,能夠在相似性分析基礎(chǔ)上,簡化用戶的操作,達(dá)到為用戶節(jié)省時間的目的,特別適用于處理垃圾郵件。
以上所述僅是本發(fā)明的優(yōu)選實施方式,應(yīng)當(dāng)指出,對于本技術(shù)領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明原理的前提下,還可以做出若干改進(jìn)和潤飾,這些改進(jìn)和潤飾也應(yīng)視為本發(fā)明的保護(hù)范圍。
權(quán)利要求
1.一種簡化電子郵件操作的方法,其特征在于,包括11)對某個用戶郵箱分類郵件夾的所有郵件進(jìn)行相似性分類,即將判定為相似的郵件分為一個相似類;12)接收用戶對該分類郵件夾中郵件進(jìn)行的操作;13)根據(jù)用戶請求,對該分類郵件夾中與所述被操作的郵件屬于同一相似類的其他郵件進(jìn)行同樣的操作處理。
2.根據(jù)權(quán)利要求1所述的簡化電子郵件操作的方法,其特征在于,所述步驟11)與12)之間包括21)用戶郵箱接收發(fā)送到本郵箱的新郵件,并將該郵件放入相應(yīng)的分類郵件夾;22)將所接收的郵件與相應(yīng)的分類郵件夾中已經(jīng)存放的郵件比較,根據(jù)比較結(jié)果進(jìn)行相似性歸類,即將該郵件歸入與其相似的相似類;若該郵件無法歸入任何已存在的相似類,則為該郵件設(shè)置新的相似類。
3.根據(jù)權(quán)利要求2所述的簡化電子郵件操作的方法,其特征在于,所述步驟11)中對已存在的郵件進(jìn)行相似性分類后,對屬于一個相似類的郵件計數(shù);所述步驟22)之后,若對于進(jìn)入該分類郵件夾的所述新郵件判定為屬于某個已經(jīng)存在的相似類,則將該類的計數(shù)值加1;若該新郵件不屬于任何一個該郵件夾中已存在的相似類,則為該郵件設(shè)置新的相似類的同時,為該新設(shè)置的相似類計數(shù)。
4.根據(jù)權(quán)利要求1或2所述的簡化電子郵件操作方法,其特征在于,所述的相似性分類和相似性歸類中,對于相似的判定,是根據(jù)郵件文本進(jìn)行相似匹配計算,根據(jù)計算結(jié)果判定文本是否相似;所述相似匹配計算可以采用編輯距離算法、覆蓋率計算、余弦距離算法、詞頻、反向文本頻率類方法。
5.根據(jù)權(quán)利要求1所述的簡化電子郵件操作方法,其特征在于,所述步驟13)包括;51)詢問是否需要對該郵件夾中的相似郵件作相同的操作,接收用戶的選擇;若選擇是,則進(jìn)入步驟52);若選擇否,則結(jié)束操作;52)選定屬于同一相似類的其他郵件;53)對上述選定的郵件進(jìn)行所述相同的操作。
6.根據(jù)權(quán)利要求5所述的簡化電子郵件操作方法,其特征在于,若所述步驟12)中的用戶對該郵件夾的郵件的操作為刪除,則步驟51)詢問是否要刪除該郵件夾中的同類郵件,若是,則步驟53)所述的操作為刪除操作;若所述步驟12)中的用戶對該郵件夾的郵件的操作為移動操作,則步驟51)詢問是否要對該郵件夾中的同類郵件進(jìn)行相同的移動,若是,則步驟53)中所述的操作為移動操作,并且在移動后的文件夾中,所有被移動的電子郵件在新的分類郵件夾中以時間順序排序。
7.根據(jù)權(quán)利要求1所述的簡化電子郵件操作的方法,其特征在于,所述步驟13)后還包括,若所述操作為將郵件從垃圾郵件夾移動到其他郵件夾,則將所有被操作郵件的發(fā)件人加入白名單;若所述操作為將郵件移入垃圾郵件夾或直接刪除,則將所有被操作郵件的發(fā)件人加入黑名單。
8.一種簡化電子郵件操作的裝置,其特征在于,包括相似性分類單元,用于讀取電子郵件樣本,并根據(jù)一定的相似性判斷策略進(jìn)行相似性分類,將相似的郵件分為一個相似類;所述電子郵件樣本為用戶郵箱的某一分類文件夾中的所有文件;執(zhí)行單元,用于接收用戶輸入的操作內(nèi)容,以及用戶選擇的作為操作對象的初始電子郵件,并據(jù)此進(jìn)行操作;若所述操作對象具有相似電子郵件時,根據(jù)用戶的選擇,對相似的電子郵件進(jìn)行相同的操作。
9.根據(jù)權(quán)利要求8所述的簡化電子郵件操作的裝置,其特征在于,包括相似性歸類單元,用于將新接收的電子郵件與該分類郵件夾中已存在的電子郵件進(jìn)行相似性判斷,若該新接收的電子郵件與某個相似類的電子郵件相似,則將該信接收的電子郵件歸入該相似類;如果未發(fā)現(xiàn)與該電子郵件相似的電子郵件,則將該電子郵件作為一個獨立的相似類。
10.根據(jù)權(quán)利要求8或9所述的簡化電子郵件操作的裝置,其特征在于,對應(yīng)于每一個相似類設(shè)置有相似郵件計數(shù)器,用于記錄該相似類的郵件數(shù)。
11.根據(jù)權(quán)利要求8或9所述的簡化電子郵件操作的裝置,其特征在于,所述的相似性分類單元和相似性歸類單元,對于相似的判定,是根據(jù)郵件文本進(jìn)行相似匹配計算,根據(jù)計算結(jié)果判定文本是否相似;所述相似匹配計算可以采用編輯距離算法、覆蓋率計算、余弦距離算法、詞頻.反向文本頻率類方法。
12.根據(jù)權(quán)利要求8或9所述的簡化電子郵件操作的裝置,其特征在于,還包括查詢單元,用于接收用戶選擇的初始電子郵件,并據(jù)此查詢對應(yīng)于該電子郵件的相似郵件計數(shù)器,獲得該初始電子郵件是否存在相似電子郵件的信息,并輸出該信息;問詢單元,用于接收所述查詢單元輸出的初始電子郵件是否存在相似郵件的信息,若該信息為存在相似電子郵件,則向用戶詢問是否對該分類郵件夾中的相似郵件作相同的操作,并接收用戶的選擇,以及將用戶的選擇結(jié)果輸出到所述執(zhí)行單元;選擇單元,接收所述問詢單元輸出的用戶的選擇結(jié)果,若用戶選擇對相似電子郵件進(jìn)行相同的操作,則選定與該郵件屬于同一相似類的所有郵件;所述執(zhí)行單元,接收上述問詢單元的輸出結(jié)果,以及所述選擇單元的選擇結(jié)果,并根據(jù)用戶初始選擇的操作內(nèi)容,對所述被選擇的所有同一相似類的電子郵件進(jìn)行該操作。
13.根據(jù)權(quán)利要求12所述的簡化電子郵件操作的裝置,其特征在于,若所述執(zhí)行單元進(jìn)行的操作為刪除操作,則所述問詢單元詢問用戶是否刪除該分類郵件夾中的所有同類郵件,并接收用戶的選擇,若用戶選擇是,則執(zhí)行單元刪除所述選擇單元選擇的所有屬于同一相似類的郵件;若所述執(zhí)行單元接收的操作選擇是對該分類文件夾中的被選擇郵件進(jìn)行移動操作,并且所述問詢單元輸出的用戶選擇結(jié)果為需要對相似電子郵件進(jìn)行相同的操作,則所述執(zhí)行單元對所述選擇單元選擇的屬于同一相似類的郵件進(jìn)行移動操作,并且將被移動的電子郵件在新的分類郵件夾中以時間順序排序。
14.根據(jù)權(quán)利要求8所述的簡化電子郵件操作的裝置,其特征在于,還包括學(xué)習(xí)單元;若所述執(zhí)行單元的操作為將郵件從垃圾郵件夾移動到其他郵件夾,則該學(xué)習(xí)單元將所有被移動郵件的發(fā)件人加入白名單;若所述執(zhí)行單元的操作為將郵件移入垃圾郵件夾或刪除,則該學(xué)習(xí)單元將所有被刪除郵件的發(fā)件人加入黑名單。
全文摘要
本發(fā)明公開一種簡化電子郵件操作的方法,包括11)對某個用戶郵箱分類郵件夾的所有郵件進(jìn)行相似性分類,將判定為相似的郵件分為一個相似類;12)接收用戶對該分類郵件夾中郵件的操作;13)根據(jù)用戶請求,對該分類郵件夾中與所述被操作的郵件屬于同一相似類的其他郵件進(jìn)行同樣的操作。本發(fā)明同時公開一種簡化電子郵件操作的裝置,包括相似性分類單元,用于進(jìn)行相似性分類,將相似的郵件分為一個相似類;執(zhí)行單元,用于接收用戶輸入的操作內(nèi)容,以及用戶選擇的作為操作對象的初始電子郵件,并據(jù)此進(jìn)行操作;若所述操作對象具有相似電子郵件時,根據(jù)用戶的選擇,對相似的電子郵件進(jìn)行相同的操作。本發(fā)明以相似性歸類的方法,簡化電子郵件操作過程。
文檔編號H04L12/54GK101068217SQ20061008708
公開日2007年11月7日 申請日期2006年6月16日 優(yōu)先權(quán)日2006年6月16日
發(fā)明者母天石 申請人:騰訊科技(深圳)有限公司