

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、近年來,隨著數(shù)據(jù)庫管理系統(tǒng)被廣泛應(yīng)用,以及計算機和網(wǎng)絡(luò)的發(fā)展,產(chǎn)生了各種各樣的數(shù)據(jù)。在如何從海量數(shù)據(jù)中提取有價值的知識和信息,更好利用這些數(shù)據(jù),來預(yù)測未來發(fā)展趨勢等迫切的需求下,數(shù)據(jù)挖掘便應(yīng)運而生,引起了信息產(chǎn)業(yè)界和整個社會的廣泛關(guān)注,成為目前研究熱點之一。
關(guān)聯(lián)規(guī)則挖掘是數(shù)據(jù)挖掘的一個重要研究內(nèi)容和研究熱點之一。粗糙集與概念格是數(shù)據(jù)分析和知識處理的有力工具。粗糙集理論是一種處理不完備和不確定知識的數(shù)學(xué)工具,已經(jīng)廣泛應(yīng)用于數(shù)據(jù)
2、挖掘等領(lǐng)域。基于粗集屬性約簡,刪除冗余屬性,降低屬性的維數(shù),來減少數(shù)據(jù)挖掘規(guī)模和大量候選項集的產(chǎn)生,是粗糙集理論在數(shù)據(jù)挖掘領(lǐng)域的重要研究內(nèi)容之一。而概念格產(chǎn)生于形式概念分析,它的每個結(jié)點實質(zhì)上是一個最大項目集,通過構(gòu)造概念格,利用Hasse圖可視化的優(yōu)點,方便計算支持度和置信度,以及快速地找出感興趣的或有意義的關(guān)聯(lián)規(guī)則,使用戶能更好的分析挖掘結(jié)果,得到較好的關(guān)聯(lián)規(guī)則。因此,利用概念格提取關(guān)聯(lián)規(guī)則是有意義的。
本文分析了經(jīng)典的關(guān)
3、聯(lián)規(guī)則挖掘算法,對進一步需要研究的問題進行了分析,包括挖掘過程中產(chǎn)生大量候選項集、多次掃描數(shù)據(jù)庫,以及當(dāng)數(shù)據(jù)屬性數(shù)目較多時挖掘效率低下等問題。分析了經(jīng)典的屬性約簡算法,包括 Pawlak屬性約簡算法,信息熵約簡算法和Skowron矩陣約簡算法,而這些算法要么不夠直觀,要么比較復(fù)雜,要么計算量大,空間性能較低,要么實現(xiàn)困難。接著以這些問題為突破口,將粗集約簡和構(gòu)造概念格關(guān)聯(lián)規(guī)則提取這兩種方法綜合,實現(xiàn)關(guān)聯(lián)規(guī)則挖掘。本文主要工作及結(jié)果如下:
4、
1)本文提出一種改進的基于知識劃分粒度的決策表約簡算法。該算法從知識劃分粒度概念出發(fā),定義了相對知識劃分粒度和相對知識劃分粒度的相對重要度,以相對知識劃分粒度相對重要度為終止條件,求取相對屬性約簡集。該算法采用的啟發(fā)式算法,首先通過決策表信息求出相對核,然后在核的基礎(chǔ)上求出相應(yīng)的相對約簡集。并通過實驗分析表明該算法是有效的,能得到精確的約簡集,表現(xiàn)形式簡潔,易于理解,易于在計算機上實現(xiàn)。
2)本文將粗集約簡和構(gòu)造概
5、念格關(guān)聯(lián)規(guī)則提取這兩種方法綜合,來提取關(guān)聯(lián)規(guī)則。主要思想是,在數(shù)據(jù)挖掘數(shù)據(jù)預(yù)處理階段完成后,使用改進的基于知識劃分粒度的屬性約簡算法對數(shù)據(jù)預(yù)處理好的數(shù)據(jù)進行屬性約簡,刪除冗余屬性,降低屬性的維數(shù),來減少數(shù)據(jù)挖掘規(guī)模和大量候選項集的產(chǎn)生。然后通過構(gòu)造概念格算法對約簡結(jié)果集構(gòu)造概念格,通過 Hasse圖形式表現(xiàn)決策表信息。利用Hasse圖可視化的優(yōu)點,方便計算支持度和置信度,以及快速地找出感興趣的或有意義的關(guān)聯(lián)規(guī)則,使用戶能更好分析挖掘結(jié)果
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于概念格的關(guān)聯(lián)規(guī)則挖掘.pdf
- 基于本體與概念格的關(guān)聯(lián)規(guī)則挖掘.pdf
- 基于概念格擴展模型的關(guān)聯(lián)規(guī)則挖掘.pdf
- 基于概念格的關(guān)聯(lián)規(guī)則挖掘的研究.pdf
- 基于概念格的關(guān)聯(lián)規(guī)則挖掘方法的研究.pdf
- 基于概念格的關(guān)聯(lián)規(guī)則挖掘研究與實現(xiàn).pdf
- 基于量化概念格的關(guān)聯(lián)規(guī)則挖掘模型研究.pdf
- 基于區(qū)別度概念格的關(guān)聯(lián)規(guī)則挖掘算法設(shè)計.pdf
- 基于概念格的關(guān)聯(lián)規(guī)則挖掘及變化模式研究.pdf
- 基于概念格模型關(guān)聯(lián)規(guī)則挖掘的關(guān)鍵問題研究.pdf
- 基于概念格模型的關(guān)聯(lián)規(guī)則挖掘算法研究及實現(xiàn).pdf
- 基于粗糙集和概念格的關(guān)聯(lián)規(guī)則挖掘研究.pdf
- 基于概念格模型的分布式關(guān)聯(lián)規(guī)則挖掘研究.pdf
- 基于概念格模型的粗糙集約簡方法研究.pdf
- 基于概念格理論的粗集屬性約簡算法研究.pdf
- 基于概念格的多值屬性關(guān)聯(lián)規(guī)則可視化挖掘.pdf
- 量化概念格關(guān)聯(lián)規(guī)則挖掘的主題地圖方法研究.pdf
- 概念格的構(gòu)造、約簡及形式概念分析的應(yīng)用.pdf
- 基于粗糙集和概念格的數(shù)據(jù)挖掘關(guān)聯(lián)規(guī)則的研究.pdf
- 基于粗集理論的關(guān)聯(lián)規(guī)則挖掘研究.pdf
評論
0/150
提交評論