個性化技術及其在數(shù)字圖書館中應用的研究.pdf_第1頁
已閱讀1頁,還剩143頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、近年來,國內外多個大規(guī)模圖書數(shù)字化計劃進展順利,在大規(guī)模數(shù)字圖書館環(huán)境下的個性化技術研究已成為一個重要的研究方向。作者參與了“高等學校中英文圖書數(shù)字化國際合作計劃(CADAL)”的建設,主要負責研發(fā)CADAL百萬冊圖書服務平臺,為服務平臺實現(xiàn)了圖書推薦與搜索應用。
   本文工作圍繞個性化技術研究及其在百萬冊圖書上的應用而展開。針對推薦系統(tǒng),研究了針對單維度評分以及多維度評分的協(xié)同過濾技術;但是在百萬冊圖書服務平臺服務過程中,發(fā)

2、現(xiàn)讀者很少為圖書打分,導致基于評分的推薦系統(tǒng)不能夠正常工作;為此研發(fā)了基于圖書點擊日志挖掘的圖書實時推薦系統(tǒng),并在個人空間中提供了基于自定義多媒體規(guī)則的個性化推薦系統(tǒng)。針對圖書搜索,注重設計用戶友好的人機交互界面。研究成果如下:
   (1)提出了針對單維度評分推薦系統(tǒng)的吸收隨機行走模型:將單維度評分數(shù)據(jù)轉換成為二部圖,引入和每個用戶或物品節(jié)點相連接的空節(jié)點,在增強二部圖上運用高斯隨機場進行建模,將top-N推薦問題建模成基于圖

3、的半監(jiān)督分類問題,在考慮每個節(jié)點的度的情況下推導出一種有效的吸收隨機行走模型。在兩種真實數(shù)據(jù)集上的實驗結果證明了該吸收隨機行走模型的有效性。
   (2)提出了針對多維度評分推薦系統(tǒng)的兩種概率隱含語義分析模型:擴展了著名的單維度評分概率隱含語義分析模型(pLSA),在保留pLSA引入的隱含變量的情況下,采用了兩種不同的多元概率分布來建模每個用戶的多維度評分。在Yahoo!Movies真實評分數(shù)據(jù)上的實驗結果表明了兩種多維度評分概

4、率隱含語義分析模型在預測和推薦任務中的表現(xiàn)顯著好于單維度pLSA以及其它對比方法。
   (3)研發(fā)了基于可伸縮緊湊瀏覽模式樹的圖書實時推薦系統(tǒng):提出了紅黑頭節(jié)點樹索引的緊湊瀏覽模式樹,該數(shù)據(jù)結構使用前綴共享樹來增量式處理新日志,使用紅黑頭節(jié)點樹來顯著地提高系統(tǒng)可伸縮性;提出了可伸縮緊湊瀏覽模式樹的構建算法,以及基于該瀏覽模式樹的分治式實時推薦算法。在CADAL服務平臺的圖書點擊日志上的實驗結果表明了該方法的有效性和高可伸縮性。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論