專利名稱:傾向性分析的蟻群文本組合的處理方法
技術(shù)領(lǐng)域:
本發(fā)明涉及的是一種互聯(lián)網(wǎng)技術(shù)領(lǐng)域的信息處理方法,具體是一種傾向性分析的 蟻群文本組合的處理方法。
背景技術(shù):
隨著網(wǎng)絡(luò)信息技術(shù)的飛速發(fā)展,互聯(lián)網(wǎng)成為最重要的大眾傳播媒體之一,正在全 方位、深層次地改變?nèi)藗兊纳罘绞?,同時也為社會輿論和大眾文化的傳播帶來了潛在的 安全問題,如在新疆烏魯木齊“7. 5”打砸搶燒嚴(yán)重暴力犯罪事件中,境內(nèi)境外不法分子正是 利用互聯(lián)網(wǎng)進(jìn)行虛假信息傳播,顛倒是非,使不明真相者誤信其說,從而引起大規(guī)模群眾聚 集游行,導(dǎo)致嚴(yán)重社會后果,因此互聯(lián)網(wǎng)輿情信息處理技術(shù)逐漸成為專家學(xué)者研究的熱點(diǎn)。 在眾多的信息媒介之中,文本信息占據(jù)著最重要的地位,文本輿情信息分析研究取得了一 定的進(jìn)展。傾向性分析是輿情分析的內(nèi)容之一,文本傾向性分析可以把文本信息分為正面、 負(fù)面和中立面三個方面。在已有的輿情分析方法中,一般是將網(wǎng)絡(luò)上獲取的文本先進(jìn)行內(nèi) 容上的區(qū)別歸并,而后再單獨(dú)進(jìn)行傾向性分析?,F(xiàn)有技術(shù)通過支持向量機(jī)對文本向量構(gòu)造超平面,利用最小二乘法對得到的分類 超平面進(jìn)行擬合,找出最優(yōu)分類超平面,實現(xiàn)文本分類,這種方法需要構(gòu)建超平面和找到最 優(yōu)分類超平面,對待分類文本特征要求較高。經(jīng)過對現(xiàn)有技術(shù)的文獻(xiàn)檢索發(fā)現(xiàn),進(jìn)一步檢索發(fā)現(xiàn),中國專利文獻(xiàn)號CN1936887A, 記載了一種“基于類別概念空間的自動文本分類方法”,該技術(shù)將文本分類分為訓(xùn)練和分類 兩個階段,分別建立訓(xùn)練集類別概念空間的詞語向量表示和待分類文檔向量數(shù)據(jù),依據(jù)待 分類文檔向量中各分量的大小直接獲得待分類文檔的所屬類別,此方法中用了大部分精力 構(gòu)造類別概念空間的詞語向量表示,但是并沒有充分挖掘類別概念空間的詞語向量表示的 處理文本信息的能力,不涉及傾向性分析,不能直接適用于輿情信息的分析和處理。由上述可以看出,針對輿情信息分析,現(xiàn)有技術(shù)中有以下可以改進(jìn)第一就是將文 本內(nèi)容進(jìn)行智能分類和傾向性分析作為整體處理,這對于處理具有突發(fā)性極強(qiáng)特點(diǎn)的海量 輿情信息而言是有必要的,整體處理的優(yōu)勢是效率高;第二是提高文本內(nèi)容組合方法的精 確度和效率,已經(jīng)被應(yīng)用的文本分類方法有基于決策樹、基于統(tǒng)計、基于粗糙集、基于距離、 基于神經(jīng)網(wǎng)絡(luò)、基于遺傳算法等諸多分類方法,但這些方法或者僅針對固定特征的文本,或 者本身尚存在不足。
發(fā)明內(nèi)容
本發(fā)明針對現(xiàn)有技術(shù)存在的上述不足,提供一種傾向性分析的蟻群文本組合的處 理方法,本發(fā)明將傾向性分析放在文本組合的處理過程之中,同時對文本進(jìn)行組合處理,在 完成文本類別智能歸并的同時也做到了傾向性分析,提高文本輿情分析效率和組合的精確度。本發(fā)明是通過以下技術(shù)方案實現(xiàn)的,本發(fā)明包括以下步驟
4
第一步,對標(biāo)準(zhǔn)庫作傾向性分析對標(biāo)準(zhǔn)庫的特征詞集作傾向性分析,每一類別均 分為正面、負(fù)面和中立面三個特征子類,即將原A類別的特征詞集分為A+、A-和Ao三個子 類,原B類別的特征詞集分為B+、B-和Bo三個子類,以此論推。所述的標(biāo)準(zhǔn)庫,是用來訓(xùn)練螞蟻的特征詞庫,里面包含了用來判斷話題種類的特 征詞。所述的特征詞集,是由能表征文本內(nèi)容的特征詞構(gòu)成的集合。所述的特征子類是指正面、負(fù)面和中立面,是指特征詞的肯定、否定和中立或者 褒揚(yáng)、貶損和中立的特性。所述的傾向性分析,即對主觀性特征詞所表示的傾向性意見做出肯定/否定/中 立或者褒揚(yáng)/貶損/中立的判斷,利用已有的褒貶義詞典判定詞典中已有的特征詞的傾向 性,利用同義詞詞庫判定與褒貶義詞典中同義詞的傾向性,利用語義分析技術(shù)判定其他未 知詞及呈現(xiàn)多傾向性特征詞的傾向性。所述的特征子類,包括傾向性特征詞和原類別主題詞,即除了包括觀點(diǎn)性的傾向 性特征詞外,還包括每類的主題相關(guān)特征詞。第二步,初始化參數(shù)并將信息裝入螞蟻初始化文本處理方法中用到的閾值參數(shù), 并將A+、A-和Ao以及B+、B-和Bo等特征子類分別裝入螞蟻,每只螞蟻只攜帶一個子類的 特征詞,螞蟻個數(shù)大于標(biāo)準(zhǔn)庫中子類別個數(shù)。所述螞蟻裝入的信息,包括本螞蟻所攜帶的子類別號和子類別特征詞集。第三步,應(yīng)用蟻群算法進(jìn)行處理1)將待處理文本經(jīng)過分詞、特征選擇與提取等預(yù)處理后散置在平面上,讓螞蟻在 這些節(jié)點(diǎn)上爬行;2)計算螞蟻當(dāng)前所在文本特征詞向量與其攜帶特征詞向量的相似度。每只螞蟻對 當(dāng)前節(jié)點(diǎn)的處理是,若相似度大于閾值a,則對該節(jié)點(diǎn)做出類別標(biāo)記;若相似度不大于閾 值a,則進(jìn)入選擇下一個爬行節(jié)點(diǎn)。3)螞蟻在選擇下一個爬行節(jié)點(diǎn)時,先計算周圍未爬行節(jié)點(diǎn)的相似度,遇到第一個 相似度大于閾值a的節(jié)點(diǎn)則轉(zhuǎn)步驟4)。若與所有未爬行的節(jié)點(diǎn)的相似度均不大于閾值a, 則此只螞蟻對所有結(jié)節(jié)已遍歷完,結(jié)束迭代;4)標(biāo)記類別,并更新信息素,即和上一個爬行節(jié)點(diǎn)通道路;5)轉(zhuǎn)入3)進(jìn)入選擇下一個節(jié)點(diǎn)。所述的相似度,是指文本間相似程度的一個統(tǒng)計量,如果兩個文本間相似度為1, 則說明兩文本對象完全相同,如果相似度為0,則說明兩文本沒有相似之處。在內(nèi)容判別方 法中,相似度是衡量兩文本所屬類別的相關(guān)度。相似度計算公式為 其中,Di=(知,知,知,......),Di= (dli,d2i,d3i,......)為需要計算的文本,
dki、dkJ表示關(guān)鍵詞k發(fā)生在文本中的頻率權(quán)重;所述的類別標(biāo)記,即每一只螞蟻對當(dāng)前所在節(jié)點(diǎn)標(biāo)上它所攜帶的子類別信息,對 其他螞蟻已經(jīng)做過類別標(biāo)記的節(jié)點(diǎn)的處理方法是對屬于不同類(A、B、C類等)的節(jié)點(diǎn)要 做類別標(biāo)記和更新信息素,屬于不同子類(A+、A-*Ao,B+、B-和Bo等)而屬于同一類的節(jié)點(diǎn)則直接跳過。第四步,處理結(jié)果此時可以得到內(nèi)容屬別結(jié)果,裝有A+、A_和Ao類特征詞集的所 有螞蟻所連通的文本節(jié)點(diǎn)均為A類輿情信息,并且這些信息分別為正面的、負(fù)面的和中立 面的,對B、C、D等其他類別的結(jié)果同理可得。所述方法中的文本節(jié)點(diǎn),以特征詞向量表示, 同時節(jié)點(diǎn)在螞蟻遍歷的過程中儲存螞蟻對其已作的類別標(biāo)志和連通信息,在所有螞蟻迭代 結(jié)束后將具有同類別的節(jié)點(diǎn)鏈聚合即得到處理結(jié)果,由此得到的結(jié)果既具有類別區(qū)分度, 又具有傾向性區(qū)分度。與現(xiàn)有技術(shù)相比,本發(fā)明效果在于1)將文本組合和傾向性分析兩步處理合二為一,提高處理效率。2)組合標(biāo)準(zhǔn)庫的特征詞相比于更新速度快、突發(fā)性強(qiáng)的輿情信息而言是相對穩(wěn) 定的,因此對組合標(biāo)準(zhǔn)庫的特征詞進(jìn)行傾向性分析比對輿情信息文本做傾向性分析更為高 效,只需在每次標(biāo)準(zhǔn)庫更新后進(jìn)行。3)由于同類特征庫的特征詞間具有一定的相關(guān)性,可以用語義分析判定可能呈現(xiàn) 多傾向性的特征詞的傾向性,并且在組合過程中度量的尺度是文本特征向量的相似度,這 樣就避免了運(yùn)用詞語判定文本傾向性的片面性。利用蟻群算法的優(yōu)勢,同時由于組合處理前將特征詞集分為子類,允許相對高的 特征詞維數(shù),因此做到了兼顧精確度和效率。
圖1為本發(fā)明流程示意圖。
具體實施例方式下面對本發(fā)明的實施例作詳細(xì)說明,本實施例在以本發(fā)明技術(shù)方案為前提下進(jìn)行 實施,給出了詳細(xì)的實施方式和具體的操作過程,但本發(fā)明的保護(hù)范圍不限于下述的實施 例。如圖1所示,本實施例包括以下步驟第一步將用于組合處理的標(biāo)準(zhǔn)庫中的特征詞集作傾向性分析,利用褒貶義詞典 判定詞典中已有的特征詞的傾向性,利用同義詞詞庫判定與褒貶義詞典中同義詞的傾向 性,利用語義分析技術(shù)判定其他未知詞及呈現(xiàn)多傾向性特征詞的傾向性。這樣就把每個類 別的特征詞集分為正面、負(fù)面和中立面三個特征子類,分別用A+、A-和Ao,B+、B-和Bo等表不。所述組合,是指在無人工監(jiān)督的條件下,應(yīng)用人工智能,計算機(jī)通過學(xué)習(xí),自動將 自然語言根據(jù)內(nèi)容上的區(qū)別進(jìn)行主題合并,形成一類,即其他文獻(xiàn)中的“文本分類”概念。所述標(biāo)準(zhǔn)庫,是用來訓(xùn)練螞蟻的特征詞庫,里面包含了用來組合的特征詞;所述特征詞集,是由能表征文本內(nèi)容的特征詞構(gòu)成的集合;所述正面、負(fù)面和中立面,是指特征詞的肯定、否定和中立或者褒揚(yáng)、貶損和中立 的特性;所述褒貶義詞典,具體為遼寧人民出版社的《現(xiàn)代漢語褒貶用法詞典》、華語教學(xué) 出版社的《漢語褒貶義詞語用法詞典》和中國大百科全書出版社的《學(xué)生褒貶義詞典》等已有的褒貶義詞典;所述利用語義分析技術(shù)判定其他未知詞及呈現(xiàn)多傾向性特征詞的傾向性,具體 為用S0-PMI方法計算未知詞及呈現(xiàn)多傾向性特征詞的傾向性。互信息計算公式為PMI (word” word2) = log [P (word” word2) /P (word》P (word2)]其中,POrorc^worcQ表示特征詞word:,word2同時出現(xiàn)的概率,P (word》表示特 征詞wordi出現(xiàn)的概率。以此為基礎(chǔ)從而得到word的傾向性為SO-PMI (word) = ^ PMI (word, wordi) - ^ PMI [word, wordj)
wordjS posword jSneg其中,pos表示褒義詞集合,neg表示貶義詞集合。若S0-PMI (word)為正值,則 word的傾向性為褒義,若SO-PMI (word)為負(fù)值,則word的傾向性為貶義。所述特征子類,包括傾向性特征詞和原類別主題詞,如未做傾向性分析之前A類 別主題是“2009國慶閱兵”,標(biāo)準(zhǔn)庫中主觀性特征詞有“威武”、“文明”、“活力”、“朝氣”、“信 息化”、“整齊”、“強(qiáng)盛”、“耗力”、“浪費(fèi)”等,則經(jīng)過傾向性分析后A+特征子類包含與主題 “2009國慶閱兵”相關(guān)詞和“威武”、“文明”、“活力”、“朝氣”、“整齊”、“強(qiáng)盛”等肯定詞,A-特 征子類包含與主題“2009國慶閱兵”相關(guān)詞和“耗力”、“浪費(fèi)”等否定詞,Ao特征子類包含 與主題“2009國慶閱兵”相關(guān)詞和“信息化”等中立詞。即每類特征子類除了包含代表觀點(diǎn) 的傾向性詞外,還要包括形如“三軍儀仗隊”、“女民兵方陣”、“檢閱”、“彩車”這樣的主題相 關(guān)詞。第二步設(shè)定組合方法中要用到的閾值參數(shù)a,在具體實施過程中可以根據(jù)組合 結(jié)果對a進(jìn)行調(diào)整,如果需要精確度高,則將閾值調(diào)高,反之同理。第三步將A+、A-和Ao以及B+、B-和Bo等特征子類信息分別裝入螞蟻,每只螞 蟻只攜帶某一類的帶有特定傾向的子類特征詞,螞蟻個數(shù)大于標(biāo)準(zhǔn)庫中子類別個數(shù)。所述螞蟻裝入的信息,包括本螞蟻所攜帶的子類別號和子類別特征詞集。第四步將待處理文本進(jìn)行分詞、特征選擇與提取等預(yù)處理,形成螞蟻將要遍歷的 節(jié)點(diǎn),文本節(jié)點(diǎn)以特征詞和特征詞在文本中相應(yīng)權(quán)重向量的形式表示,即,節(jié)點(diǎn)中同時設(shè)定 用于保存類別標(biāo)記和連通信息的存儲空間。第五步初始化螞蟻位置,將螞蟻散置于文本節(jié)點(diǎn)上,準(zhǔn)備計算。第六步螞蟻開始遍歷,所有螞蟻可以并行進(jìn)行。以攜帶A+類特征詞向量的一只 螞蟻為例,首先計算遍歷到的第一個節(jié)點(diǎn)的文本特征詞向量與其所攜帶的A+類特征詞向 量的相似度,若相似度大于預(yù)先設(shè)定的閾值a,則將該節(jié)點(diǎn)標(biāo)記為A+的類別標(biāo)記存儲到節(jié) 點(diǎn)預(yù)留的空間;若相似度不大于閾值a,則不作標(biāo)記并選擇下一個爬行節(jié)點(diǎn)。螞蟻每訪問 一個節(jié)點(diǎn)都將在其禁忌表中記下該節(jié)點(diǎn)號,保證不重復(fù)遍歷。所述相似度,是指文本間相似程度的一個統(tǒng)計量,如果兩個文本間相似度為1,則 說明兩文本對象完全相同,如果相似度為0,則說明兩文本沒有相似之處。在組合方法中,相 似度是衡量兩文本所屬類別的相關(guān)度。相似度計算公式為
/\ ( I-、
/、 m) m o 肌 osim(Di,Dj)= E+W
u=l J {\k=l k=l其中,Di=(知,知,知,......),Di= (dli,d2i,d3i,......)為需要計算的文本,
dki、dkJ表示關(guān)鍵詞k發(fā)生在文本中的頻率權(quán)重;
7
所述類別標(biāo)記,即每一只螞蟻對當(dāng)前所在節(jié)點(diǎn)標(biāo)上它所攜帶的子類別信息,對其 他螞蟻已經(jīng)做過類別標(biāo)記的節(jié)點(diǎn)的處理方法是對屬于不同類(A、B、C類等)的節(jié)點(diǎn)要做 類別標(biāo)記和更新信息素,屬于不同子類(A+、A-和Ao,B+、B-和Bo)而屬于同一類的節(jié)點(diǎn)則 直接跳過。第七步計算下一個節(jié)點(diǎn)與螞蟻所攜帶信息的相似度,若此節(jié)點(diǎn)相似度大于閾值 a的節(jié)點(diǎn)則螞蟻跳轉(zhuǎn)到該節(jié)點(diǎn)并進(jìn)行類別標(biāo)記,同時將此節(jié)點(diǎn)與上一個相似度大于閾值 a的節(jié)點(diǎn)進(jìn)行連通,形成類別鏈表;否則重復(fù)此步驟進(jìn)行迭代,若所有節(jié)點(diǎn)已遍歷完畢仍 未遇到相似度大于閾值a的節(jié)點(diǎn)則此螞蟻結(jié)束迭代。第八步所有螞蟻均遍歷完畢后進(jìn)行結(jié)果處理,每個標(biāo)記A+、A-和Ao以及B+、 B-和Bo等類別信息的文本都?xì)w屬于各自的節(jié)點(diǎn)鏈表,所有裝有A+、A_和Ao類特征詞集的 螞蟻所連通的文本節(jié)點(diǎn)鏈表均為A類輿情信息,并且這些信息已經(jīng)分別被分成正面的、負(fù) 面的和中立面的,對B、C、D等其他類別的結(jié)果同理可得,由此則完成文本組合的同時也對 文本作出了傾向性分析,提高輿情信息分析的效率。
權(quán)利要求
一種傾向性分析的蟻群文本組合的處理方法,其特征在于,包括以下步驟第一步,對標(biāo)準(zhǔn)庫作傾向性分析對標(biāo)準(zhǔn)庫的特征詞集作傾向性分析,每一類別均分為正面、負(fù)面和中立面三個特征子類,即將原A類別的特征詞集分為A+、A-和Ao三個子類,原B類別的特征詞集分為B+、B-和Bo三個子類,以此論推,第二步,初始化參數(shù)并將信息裝入螞蟻初始化文本處理方法中用到的閾值參數(shù),并將A+、A-和Ao以及B+、B-和Bo等特征子類分別裝入螞蟻,每只螞蟻只攜帶一個子類的特征詞,螞蟻個數(shù)大于標(biāo)準(zhǔn)庫中子類別個數(shù),第三步,應(yīng)用蟻群算法進(jìn)行處理步驟1)將待處理文本經(jīng)過分詞、特征選擇與提取等預(yù)處理后散置在平面上,讓螞蟻在這些節(jié)點(diǎn)上爬行;步驟2)計算螞蟻當(dāng)前所在文本特征詞向量與其攜帶特征詞向量的相似度;步驟3)每只螞蟻對當(dāng)前節(jié)點(diǎn)的處理是,若相似度大于閾值α,則對該節(jié)點(diǎn)做出類別標(biāo)記;步驟4)若相似度不大于閾值α,則進(jìn)入選擇下一個爬行節(jié)點(diǎn);步驟5)螞蟻在選擇下一個爬行節(jié)點(diǎn)時,先計算周圍未爬行節(jié)點(diǎn)的相似度,遇到第一個相似度大于閾值α的節(jié)點(diǎn)則轉(zhuǎn)步驟4);步驟6)若與所有未爬行的節(jié)點(diǎn)的相似度均不大于閾值α,則此只螞蟻對所有結(jié)節(jié)已遍歷完,結(jié)束迭代;步驟7)標(biāo)記類別,并更新信息素,即和上一個爬行節(jié)點(diǎn)通道路;步驟8)轉(zhuǎn)入步驟3)進(jìn)入選擇下一個節(jié)點(diǎn);第四步,處理結(jié)果此時可以得到內(nèi)容屬別結(jié)果,裝有A+、A-和Ao類特征詞集的所有螞蟻所連通的文本節(jié)點(diǎn)均為A類輿情信息,并且這些信息分別為正面的、負(fù)面的和中立面的,對B、C、D等其他類別的結(jié)果同理可得,所述方法中的文本節(jié)點(diǎn),以特征詞向量表示,同時節(jié)點(diǎn)在螞蟻遍歷的過程中儲存螞蟻對其已作的類別標(biāo)志和連通信息,在所有螞蟻迭代結(jié)束后將具有同類別的節(jié)點(diǎn)鏈聚合即得到處理結(jié)果,由此得到的結(jié)果既具有類別區(qū)分度,又具有傾向性區(qū)分度。
2.根據(jù)權(quán)利要求1所述的傾向性分析的蟻群文本組合的處理方法,其特征是,所述的 標(biāo)準(zhǔn)庫,是用來訓(xùn)練螞蟻的特征詞庫,里面包含了用來判斷話題種類的特征詞。
3.根據(jù)權(quán)利要求1所述的傾向性分析的蟻群文本組合的處理方法,其特征是,所述的 特征詞集,是由能表征文本內(nèi)容的特征詞構(gòu)成的集合。
4.根據(jù)權(quán)利要求1所述的傾向性分析的蟻群文本組合的處理方法,其特征是,所述的 特征子類是指正面、負(fù)面和中立面,是指特征詞的肯定、否定和中立或者褒揚(yáng)、貶損和中立 的特性。
5.根據(jù)權(quán)利要求1所述的傾向性分析的蟻群文本組合的處理方法,其特征是,所述的 傾向性分析,即對主觀性特征詞所表示的傾向性意見做出肯定/否定/中立或者褒揚(yáng)/貶 損/中立的判斷,利用已有的褒貶義詞典判定詞典中已有的特征詞的傾向性,利用同義詞 詞庫判定與褒貶義詞典中同義詞的傾向性,利用語義分析技術(shù)判定其他未知詞及呈現(xiàn)多傾 向性特征詞的傾向性。
6.根據(jù)權(quán)利要求1所述的傾向性分析的蟻群文本組合的處理方法,其特征是,所述的特征子類,包括傾向性特征詞和原類別主題詞,即除了包括觀點(diǎn)性的傾向性特征詞外,還包 括每類的主題相關(guān)特征詞。
7.根據(jù)權(quán)利要求1所述的傾向性分析的蟻群文本組合的處理方法,其特征是,所述螞 蟻裝入的信息,包括本螞蟻所攜帶的子類別號和子類別特征詞集。
8.根據(jù)權(quán)利要求1所述的傾向性分析的蟻群文本組合的處理方法,其特征是,所述的 相似度,是指文本間相似程度的一個統(tǒng)計量,如果兩個文本間相似度為1,則說明兩文本對 象完全相同,如果相似度為0,則說明兩文本沒有相似之處,在內(nèi)容判別方法中,相似度是衡 量兩文本所屬類別的相關(guān)度,相似度計算公式為/\ ( I-、/、 m) m o 肌 o sHDi ’叫=^dHdkj + Jea^EA/、/c—丄)^ V k—Y k—L 乂其中Di =(知,d2i,d3i,......),Di =(知,d2i,d3i,......)為需要計算的文本,dki、dkJ表示關(guān)鍵詞k發(fā)生在文本中的頻率權(quán)重。
9.根據(jù)權(quán)利要求1所述的傾向性分析的蟻群文本組合的處理方法,其特征是,所述的 類別標(biāo)記,即每一只螞蟻對當(dāng)前所在節(jié)點(diǎn)標(biāo)上它所攜帶的子類別信息,對其他螞蟻已經(jīng)做 過類別標(biāo)記的節(jié)點(diǎn)的處理方法是對屬于不同類(A、B、C類等)的節(jié)點(diǎn)要做類別標(biāo)記和更 新信息素,屬于不同子類(A+、A-和Ao,B+、B-和Bo等)而屬于同一類的節(jié)點(diǎn)則直接跳過。
全文摘要
一種互聯(lián)網(wǎng)技術(shù)領(lǐng)域的傾向性分析的蟻群文本組合的處理方法,通過將傾向性分析放在文本組合的處理過程之中,同時應(yīng)用蟻群算法對文本進(jìn)行類別組合,即引入傾向性分析的蟻群文本組合處理方法,在完成文本類別智能歸并的同時也做到了傾向性分析,以達(dá)到提高文本輿情分析效率和組合精確率的目的。
文檔編號G06F17/30GK101859327SQ20101020072
公開日2010年10月13日 申請日期2010年6月13日 優(yōu)先權(quán)日2010年6月13日
發(fā)明者張月國, 李建華, 李海燕, 李燕, 李生紅 申請人:上海交通大學(xué)