XML內(nèi)容路由關(guān)鍵技術(shù)研究.pdf_第1頁(yè)
已閱讀1頁(yè),還剩115頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、隨著信息高速公路的發(fā)展,互聯(lián)網(wǎng)上出現(xiàn)了大量采用事件-驅(qū)動(dòng)模式的應(yīng)用,如主動(dòng)服務(wù)中的發(fā)布訂閱系統(tǒng)、基于內(nèi)容的XML路由、XML文檔分發(fā)以及新聞傳遞等。這類(lèi)應(yīng)用中,信息以XML流的形式由一系列生產(chǎn)者經(jīng)過(guò)事件代理傳遞到另一些消費(fèi)者手中;消費(fèi)者通過(guò)過(guò)濾引擎進(jìn)行訂閱。由于僅與XML的內(nèi)容本身有關(guān),而與信息在何處發(fā)布無(wú)關(guān),這種路由方式常被稱(chēng)作內(nèi)容路由。然而,現(xiàn)有的內(nèi)容路由技術(shù)在高效匹配算法、對(duì)異構(gòu)事件處理等方面尚存一些問(wèn)題。 擴(kuò)展標(biāo)記語(yǔ)言X

2、ML作為一種數(shù)據(jù)表示和交換的標(biāo)準(zhǔn),具有自描述性、可擴(kuò)展性、利于異構(gòu)數(shù)據(jù)交換等諸多優(yōu)點(diǎn)。本文以XML為事件模型、XPath作為多用戶(hù)訂閱模型來(lái)研究?jī)?nèi)容路由的若干關(guān)鍵技術(shù)。 本文提出了一種基于hedge文法的HXFA機(jī)來(lái)處理XML發(fā)布流事件,并給出了HXFA機(jī)的過(guò)濾優(yōu)化算法及算法正確性分析。最后,將多個(gè)HXFA機(jī)合并作為系統(tǒng)的過(guò)濾引擎。從算法的效率和可擴(kuò)展性方面進(jìn)行實(shí)驗(yàn)分析,提出的方法優(yōu)于著名的內(nèi)容過(guò)濾引擎YFilter。

3、分析了現(xiàn)有XML相似性模型的優(yōu)缺點(diǎn),針對(duì)這些模型的不足,擴(kuò)展了向量空間模型,提出了基于語(yǔ)義和支持度的層次路徑模型,并給出其生成算法及復(fù)雜度分析。模型首先挖掘文檔集中頻繁出現(xiàn)的路徑,通過(guò)文檔中的語(yǔ)義信息來(lái)合并重復(fù)節(jié)點(diǎn)、路徑,同時(shí)對(duì)文檔特征向量進(jìn)行維數(shù)規(guī)約。最后給出基于語(yǔ)義和支持度的距離測(cè)度方法。該方法兼顧了XML文檔的結(jié)構(gòu)信息和語(yǔ)義信息兩個(gè)方面的相似性。與樹(shù)編輯距離模型相比,不但每個(gè)文檔具有“類(lèi)原型”描述,而且在時(shí)間開(kāi)銷(xiāo)上有較大優(yōu)勢(shì)。

4、 根據(jù) H path模型,提出一種基于改進(jìn)粒子群優(yōu)化的XML文檔聚類(lèi)方法。首先將文檔集映射到粒子群模型問(wèn)題空間,然后利用粒子群聚類(lèi)方法進(jìn)行聚類(lèi),最終權(quán)衡了時(shí)間和準(zhǔn)確性?xún)煞矫嬉蛩兀M(jìn)一步提出混合的粒子群聚類(lèi)方法,增強(qiáng)了聚類(lèi)收斂程度和準(zhǔn)確程度。 盡管提出的模型在提取時(shí)已進(jìn)行了數(shù)據(jù)歸約,然而對(duì)于冗余的、異構(gòu)的XML文檔而言,高維災(zāi)難問(wèn)題仍然存在。針對(duì)此問(wèn)題,提出一種獨(dú)立分量分析的預(yù)分類(lèi)方法。該方法首先對(duì)文檔矩陣進(jìn)行維數(shù)歸約,隨后在

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論