海洋環(huán)境下聚類算法的研究.pdf_第1頁
已閱讀1頁,還剩128頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、聚類分析是數(shù)據(jù)挖掘(Data Mining,DM)重要方法之一,在圖像處理,環(huán)境預測,天氣預報等許多領域有著廣泛應用,也是進行海洋颶風和赤潮研究的一種新方法。
  針對目前海洋環(huán)境中的颶風和赤潮的分析方法單一性和不完善性,本文采用聚類分析方法對這兩種現(xiàn)象進行分析。傳統(tǒng)的颶風研究方法依據(jù)氣象學或空氣動力學的原理進行分析,本文采用聚類方法,根據(jù)颶風生成的移動特征,把颶風抽象為軌跡,并以此聚類。赤潮過程包含多個階段,各階段具有不確定性,

2、這是由赤潮理化因子的不同作用而引起的。傳統(tǒng)研究赤潮對所有影響因子數(shù)據(jù)統(tǒng)一處理,這種方法難以發(fā)現(xiàn)個體因子對赤潮的影響作用。針對這一不足之處以及赤潮過程多階段模糊的特點,提出模糊聚類與權重值相結合的方法,并以此分析赤潮產生過程以及各階段的特征。影響赤潮發(fā)生的理化因子具有高維性,高維數(shù)據(jù)綜合分析,更適合采用模糊聚類分析方法。為了表明算法的有效性,本文構造了一種新有效性評價指標,克服傳統(tǒng)依靠距離作為衡量標準的有效性指標的不足。本文以提出的聚類創(chuàng)

3、新理論為研究重點,以海洋環(huán)境領域中的應用為背景,內容涉及計算智能技術、海洋颶風以及赤潮,屬于交叉學科的研究課題,具有十分重要的理論意義和實際應用價值。論文的主要工作如下:
  1.研究了颶風軌跡聚類算法。提出了一種基于相似子軌跡的聚類算法。該算法基于子軌跡的劃分,提出相似子軌跡的概念,利用相似子軌跡近似代表一個子軌跡聚類區(qū)域的空間特征,因此可以減少空間搜尋,算法能夠有效的降低時間復雜度和空間復雜度,提高了算法的執(zhí)行效率。
 

4、 2.研究了軌跡聚類算法輸入?yún)?shù)問題。針對軌跡聚類過程中對輸入?yún)?shù)ε和MinLns具有敏感性,提出了一種對輸入?yún)?shù)非敏感的軌跡聚類算法,算法根據(jù)軌跡劃分的子軌跡指定距離和可達距離概念,計算得到上一個參數(shù)化的簇排序,通過此排序序列表示軌跡數(shù)據(jù)內在聚類結構,并且使用此排序序列聚類的結果等效于利用一個參數(shù)范圍實現(xiàn)軌跡聚類的結果。因此算法能夠避免由唯一參數(shù)值帶來聚類結果的不確定性,有效降低了聚類結果對輸入?yún)?shù)的敏感性。
  3.研究了赤潮

5、發(fā)生過程中各階段的模糊聚類。赤潮發(fā)生過程可以分為四個階段,這四個階段受多種理化因子制約,各階段之間難以區(qū)別,具有模糊性。某一理化因子在四個階段都有可能有相同的值,或者值變化非常大。因此不同理化因子在赤潮過程各個階段的作用大小并不相同。針對赤潮過程的模糊性和各因子對赤潮各階段影響的重要程度不同的特點,提出一種基于權重的模糊聚類算法,為隸屬度函數(shù)和典型值函數(shù)分配不同的權值。算法克服了模糊可能性均值聚類算法(Fuzzy possibiliti

6、c C-Means,FPCM)中限制典型值的不足之處,也克服了可能性模糊聚類算法(Possibilitic Fuzzy C-Means,PFCM)中隨機確定參數(shù)的不合理性。算法運用基于原型驅動的學習方法確定權重參數(shù),使得權重參數(shù)計算更合理。實驗結果表明該方法聚類效果明顯。
  4.研究了區(qū)間數(shù)據(jù)集的模糊聚類問題。隨著應用的需要,使用區(qū)間值變量描述對象大量存在于實際生活中?;跉W氏距離的聚類方法雖然對點數(shù)據(jù)聚類效果明顯,但對區(qū)間數(shù)據(jù)

7、的處理歐氏距離度量方法則顯得不足,聚類效果不明顯。針對這一特點,提出了區(qū)間數(shù)據(jù)集的三種二次型距離度量方法,在此基礎上修改目標方程產生三種算法。在UCI數(shù)據(jù)集和海洋魚類數(shù)據(jù)集上的實驗結果表明,新算法能夠得到較好的聚類效果,并且有較低誤分率。
  5.研究了聚類有效性指標。在未知數(shù)據(jù)集中如何確定最佳聚類數(shù)和如何確定真實聚類中心,以及如何度量類內緊致度和類間分離度屬于聚類有效性研究的問題。目前許多有效性指標算法的類內和類間的度量方法都基

8、于歐氏距離方法,這種方法對于球狀數(shù)據(jù)能夠較好的發(fā)現(xiàn)最佳聚類數(shù),但對于重疊度較高的數(shù)據(jù)集和不規(guī)則數(shù)據(jù)集,效果不明顯。本文提出了一種非歐氏距離有效性指標VI,指標對類內采用隸屬度表示數(shù)據(jù)集的緊致程度,而類間度量采用反貼近度方法,能夠有效克服采用歐氏距離作為重疊數(shù)據(jù)集和不規(guī)則數(shù)據(jù)集的度量指標而引起的不準確性。該方法既考慮了模糊劃分又結合了數(shù)據(jù)的分布特征,對聚類結果的評價更客觀,颶風和赤潮以及其他數(shù)據(jù)集實驗結果表明,該有效性指標都能夠找出最佳聚

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論