基于用戶行為模式特征的時間序列異常檢測.pdf_第1頁
已閱讀1頁,還剩134頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、時間序列的異常點是用戶(或系統(tǒng))產生的不符合預期行為模式的數據。研究異常點的起因和可能引起的后果,可以輔助用戶(或系統(tǒng))提供有效的決策支持。例如拒絕服務(Denial of service,DoS)攻擊會產生大量異常的網絡流量。研究這些異常數據的起因,并預測可能癱瘓的鏈路,為系統(tǒng)管理員調整路由策略、避免網絡擁塞提供決策支持。由于技術的發(fā)展,當前時間序列數據之間關系的復雜化以及異常種類的增多導致已有的異常檢測算法很難有效的發(fā)現異常。因此,

2、如何從這些異常數據中提取特征,精確的對異常進行檢測是當前時間序列研究中的一個重要方向。
  本研究主要內容包括:⑴數據預處理階段,實際采集到的數據是海量未被標記的時間序列。針對該問題,采用集成學習的思想,提出基于多種異常檢測算法聯(lián)合檢測的數據清理策略。⑵存在“變異”或者類型未知的異常導致已有的異常檢測算法失效或者具有很高的誤檢率。為解決上述問題,基于用戶(或網絡)的正常行為模式提出基函數生成算法,實現正常流量空間的構建,并將無法投

3、影到該空間的數據看做異常。⑶實際應用中,時間序列數據的動態(tài)變化導致已有的基函數無法表示新數據。針對該問題,基于用戶(或網絡)的正常行為模式緩慢變化的特性,利用增量學習的思想,提出基函數更新算法。⑷對大規(guī)模時間序列的異常檢測通常會產生大量的異常點,需要消耗大量的資源進行分析處理。針對該問題,在異常檢測階段基于相同原因生成異常點的時間集中性,提出異常點的聚類算法和評價準則。⑸基于預測的異常檢測就是通過比較未來時間序列數據的評估值和實際值進行

4、異常檢測。針對基于神經網絡(Artificial neural networks,ANNs)的預測模型在構建時需要大量訓練時間的問題,提出基于趨勢預測模型的時間序列異常檢測方法。⑹針對推薦系統(tǒng)中項目的評分時間序列異常檢測問題,提出基于動態(tài)時間區(qū)間分割和假設檢驗的異常檢測模型(Dynamic time interval segmentation and hypothesis test detection-based framework,S

5、DF)。該模型分析了用戶的異常行為模式(主要是異常評分行為),提取異常評分特征,實現對異常的實時檢測。另外,提出了算法的穩(wěn)定性準則用于評價時間序列異常檢測算法的性能。⑺提出動態(tài)分割項目評分時間序列的算法,對相鄰評分進行聚類,并以假設檢驗的形式對每個類進行異常檢測。該算法解決了在線異常檢測的實時性要求。⑻不同時間尺度下,同一個算法對同一個數據點的異常檢測可能產生不同的結果。針對該問題,我們分析了檢測結果不一致的起因和后果,并設計了算法的穩(wěn)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論