互聯網違法文本與圖像信息監(jiān)控系統研究.pdf_第1頁
已閱讀1頁,還剩61頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、隨著網絡技術的發(fā)展,信息的發(fā)布和共享更為簡捷方便,網絡信息日益豐富。與此同時,由于信息網絡國際化、社會化、開放化、個人化的特點,越來越多不健康的信息出現在互聯網上,嚴重影響了廣大網絡用戶,特別是青少年身心健康的發(fā)展。
   我國在全國范圍內多次開展了打擊淫穢色情網站的專項活動,但是除了執(zhí)法部門的打擊之外,還需要利用信息技術手段將色情、暴力、反動等違法信息過濾,凈化網絡環(huán)境。近年來,人們把更大的力量投入到有關網絡信息監(jiān)控技術的研究

2、上來,因為危害網絡安全的有害信息不再像幾年前那樣明目張膽地從某一個地址發(fā)出,而往往是包裝成合法的報文,或者加載到合法的報文中間,通過合法的用戶發(fā)布出去。
   當前網絡上違法信息的類型和傳播方式多種多樣,單純采用某一種過濾技術難以有效的遏止違法信息的傳播,本文選題即以此為背景,研究違法信息的監(jiān)控技術,主要監(jiān)控含有色情、暴力、反動等違法信息的文本和圖像信息,對以文本匹配和基于內容的圖像識別為主要手段的網絡違法信息監(jiān)控的關鍵技術進行

3、了研究,采用了兩者相結合的方式,建立文本匹配模型和圖像識別模型并設計監(jiān)控系統原型。
   對文本信息的監(jiān)控,本文根據當前網絡文本信息數量大、隱蔽傳播的特點,結合WM算法和模糊匹配的思想,在精確匹配的基礎上實現模糊匹配,以識別包含敏感詞匯的網絡文本信息。首先針對網絡上敏感文本信息常用的三種隱蔽傳播方式,對文本進行預處理,將模糊匹配轉換成另一種形式上的精確匹配;接著使用WM算法搜索匹配的敏感關鍵詞;若搜索到網頁中出現某一關鍵詞后,再

4、對網頁文字進行模糊匹配,設置一個相似度的閥值,以最后判別網頁中是否包含敏感文字信息。
   對圖像信息的監(jiān)控,本文根據色情圖像本身的特點——有較多裸露肌膚,采用膚色檢測和紋理判別相結合的方式識別膚色區(qū)域以生成掩碼圖像。膚色信息是圖像中最直接、最豐富的信息,在膚色檢測算法中,可以應用許多顏色空間。本文采用YUV與YIQ顏色空間相結合的方法,利用先驗知識與規(guī)則將膚色模型建立在YUV顏色空間的相位角θ和YIQ顏色空間的Ⅰ分量的閥值上來

5、判斷,進行膚色檢測。經過膚色模型檢測后,由于顏色的相似會產生不必要的誤檢,通過比較與分析,采用一階灰度統計方法建立紋理判別模型,來判斷圖像中某點及其周圍部分是否具有皮膚區(qū)域的光滑特性。最后,根據膚色檢測和紋理檢測生成的掩碼圖像從原圖像中提取三個統計特征值,進行SVM分類器的訓練和敏感圖像識別。
   本文最后構建了一個具有信息反饋與控制功能的基于智能代理的網絡違法信息監(jiān)控系統,系統采用網頁文本信息匹配和敏感圖像信息識別相結合的方

6、式,根據網頁中違法信息的分布情況判斷其是否含有敏感內容,然后將違法信息識別情況反饋并對此進行處理和記錄。監(jiān)控系統原型在圖像識別前先進行網頁文本識別,縮短了過濾時間,使之更具有實時性。
   本文的創(chuàng)新之處是:將文本信息監(jiān)控中加入文本預處理的思想,提高了文本信息匹配的準確度,設計的網絡敏感監(jiān)控系統將違法信息的檢測與智能代理相結合,而不是跟瀏覽器結合,能實現分布式的信息監(jiān)控和采集。
   本文的內容分為五章,第一章緒論,簡要

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論