基于人工免疫的自適應(yīng)譜聚類算法研究與應(yīng)用.pdf_第1頁
已閱讀1頁,還剩75頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、社會保險審計是關(guān)乎國計民生的重大事情。有效的審計措施能夠及時發(fā)現(xiàn)社會保險繳納是夠違規(guī),來維護勞動者的合法權(quán)益。目前審計手段主要有人工審計和計算機審計。其中人工審計主要方法為抽樣審計,人工審計相對滯后且費時費力,而抽樣審計則存在盲目性,漏洞較多。計算機審計方面主要是采用審計系統(tǒng),雖然在一定程度上提高了審計效率但是審計精確度較低。面對海量社保審計數(shù)據(jù),傳統(tǒng)人工審計方法和計算機審計方法顯得捉襟見肘。
   數(shù)據(jù)挖掘能從海量數(shù)據(jù)中挖掘有

2、用的知識,因此研究學(xué)者開始應(yīng)用數(shù)據(jù)挖掘的方法來對審計數(shù)據(jù)進行分析。在數(shù)據(jù)挖掘中有多種方法,其中聚類分析具有伸縮性強、對領(lǐng)域知識依賴性弱、受噪聲影響小等優(yōu)點。因此本文采用聚類來分析社保審計數(shù)據(jù)。
   傳統(tǒng)聚類算法雖然實現(xiàn)簡單、使用方便,但是較易陷入局部最優(yōu)解,且在非凸空間聚類效果較差。譜聚類算法根據(jù)譜圖劃分理論,對數(shù)據(jù)進行譜映射,在任意樣本空間有較好的魯棒性,因此本文采用譜聚類算法來解決傳統(tǒng)聚類算法存在的問題。
   本

3、文深刻分析了譜聚類算法,提出傳統(tǒng)譜聚類算法雖然能夠解決一些問題,但是仍然需要人工方法輸入聚類分組數(shù)K值。聚類分組數(shù)的確定至關(guān)重要,急需對傳統(tǒng)譜聚類算法進行優(yōu)化。針對傳統(tǒng)譜聚類算法的優(yōu)化需求,本文深入研究和分析了人工免疫系統(tǒng)。在此基礎(chǔ)之上提出了一種基于人工免疫的自適應(yīng)譜聚類算法,實現(xiàn)了聚類分組數(shù)的自動獲取,提高了聚類效果。該算法模擬了抗體的克隆變異,經(jīng)過初次免疫應(yīng)答和二次免疫應(yīng)答,完成了抗體對抗原的免疫識別。實現(xiàn)算法之后在一些常用數(shù)據(jù)集上

4、進行了實驗,并與傳統(tǒng)譜聚類、遺傳算法的實驗結(jié)果進行了對比,驗證了基于人工免疫的自適應(yīng)譜聚類算法的可行性和穩(wěn)定性。
   本文對社保審計數(shù)據(jù)特點進行了分析之后,發(fā)現(xiàn)還需對算法做出進一步改進,因此本文在基于人工免疫的自適應(yīng)譜聚類算法的基礎(chǔ)上做出改進,根據(jù)數(shù)據(jù)的屬性對數(shù)據(jù)分析的貢獻大小不同,對數(shù)據(jù)屬性加權(quán),加入了一定的專家知識,提出了一種基于半監(jiān)督的自適應(yīng)譜聚類算法。本文對社保審計數(shù)據(jù)進行了屬性選擇、數(shù)據(jù)填補、數(shù)據(jù)合并、分類屬性轉(zhuǎn)換等

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論