

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、隨著網絡貿易的迅猛發(fā)展,為了增強顧客滿意度,分享顧客的購物經歷,網上商家讓顧客對已購商品表達意見或建議已成為一件很普遍的事情了。因此,購物網站用戶評論區(qū)域的評論數量迅速增加,一些暢銷產品在一些大的購物站點能達到數百之多的用戶評論。然而,大量的顧客評論讓產品制造商或潛在購買者很難跟蹤已購產品用戶對產品的意見和建議,這就給他們的決策造成了額外的困難。一個新的研究領域――以產品特征詞為基礎的顧客評論信息抽取研究就在這種背景下產生了。目前,越來
2、越多的研究者投身其中,M.Hu與B.Liu在2004年發(fā)表的顧客評論信息抽取是最早且最完整的文獻之一。本文首先介紹了以產品特征詞為基礎的顧客評論信息抽取的研究背景及國內外研究現狀,詳細闡述了研究目的及意義,對目前網絡貿易平臺功能模塊進行了詳細介紹,指出它的不足,提出將用戶評論信息抽取模塊應用到網絡貿易平臺中。并對本文用到的相關知識進行了研究。然后研究了M.Hu,B.Liu的用戶評論抽取算法,對基于支持度算法的產品特征詞抽取技術和利用Wo
3、rdNet識別輿論詞語義取向技術進行了詳細研究,分析了Hu,Liu的用戶評論抽取算法的局限性。在對已有算法的局限性進行分析之后,提出基于貝努利模型的算法對產品特征詞進行抽取,詳細闡述了利用概率統(tǒng)計知識對用戶評論涉及到的產品特征詞進行抽取的過程。并與基于支持度算法對產品特征詞抽取進行比較,實驗證明,該算法能夠讓終端用戶在搜尋產品時,感到簡短有效的特征詞列表對尋找產品真正起到了導航作用。此外,本文還提出使用松弛標記法對用戶評論的產品特征詞的
4、輿論短語進行語義標識,利用對潛在的輿論詞的標記進行識別輿論短語。在實驗中,使用召回率和精確率兩種評價指標對本文算法與利用WordNet識別輿論詞語義取向技術進行了評價,且進行了實驗結果分析。在輿論短語語義標識實驗中,由于本文的算法能夠處理敏感內容輿論詞,本文算法的精確度比利用WordNet識別輿論詞語義取向的算法高了0.03。但是由于本文算法不能識別WordNet上沒有出現的單詞,或對WordNet沒有足夠的單詞分類信息,本文算法的召回
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 評論挖掘中的語義信息抽取.pdf
- 評論挖掘中的語義信息抽取
- 基于最大熵方法的評論信息抽取研究.pdf
- 產品評論信息的意見抽取研究與應用.pdf
- Web頁面用戶評論信息抽取技術研究.pdf
- 基于頻繁子樹挖掘的網頁評論信息抽取.pdf
- 基于用戶評論信息的推薦算法研究.pdf
- 面向網絡評論的用戶觀點核心信息自動抽取技術.pdf
- 文本信息抽取模型及算法研究.pdf
- 基于包裝器模型的信息抽取算法研究.pdf
- 互聯網藥品信息抽取算法的研究.pdf
- 中文微博評論對象抽取研究.pdf
- 基于產品評論的意見抽取方法研究.pdf
- 基于Hadoop的Web評論自動抽取方法研究.pdf
- 中文評論短文本的評價對象抽取研究.pdf
- 基于分塊的新聞網頁信息抽取算法研究.pdf
- 基于包裝器模型的文本信息抽取算法研究.pdf
- 基于遺傳算法的Web信息抽取技術.pdf
- Web信息抽取規(guī)則及其學習算法.pdf
- 中文產品評論觀點抽取方法研究.pdf
評論
0/150
提交評論