

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、利用混合線性模型進(jìn)行遺傳數(shù)據(jù)分析對(duì)于統(tǒng)計(jì)學(xué)家和遺傳學(xué)家來(lái)說(shuō)都是一種挑戰(zhàn),因?yàn)闊o(wú)論是線性、二次性還是似然估計(jì)方法都會(huì)在很大程度上受到自變量或依變量中的異常數(shù)值的干擾。要了解異常值對(duì)分析結(jié)果的影響,唯一的方式是通過(guò)反復(fù)地?cái)?shù)據(jù)質(zhì)量鑒定和模型優(yōu)化?;谏鲜隹紤],本研究借助于MINQUE(最小二次范數(shù)無(wú)偏估計(jì))和AUP(調(diào)整的無(wú)偏預(yù)測(cè))方法(表示為:方法Ⅰ),提出了利用混合線性模型進(jìn)行遺傳數(shù)據(jù)分析的異常值檢測(cè)方法,并將該方法與基于EM算法和BLU
2、P(最佳線性無(wú)偏預(yù)測(cè))的方法(表示為:方法Ⅱ)進(jìn)行比較,然后通過(guò)兩個(gè)實(shí)例分析來(lái)驗(yàn)證方法。 本研究首先利用一個(gè)常用的遺傳模型(包括品種、年份和地點(diǎn))來(lái)演示該方法,并引入一組統(tǒng)計(jì)量來(lái)評(píng)價(jià)異常值對(duì)分析結(jié)果的影響程度,如:Cook距離(CD(β)),Andrews-Pregibon統(tǒng)計(jì)量(AP),Cook-Weisberg統(tǒng)計(jì)量(CW)和方差比例(VR)是用來(lái)評(píng)價(jià)某個(gè)數(shù)據(jù)點(diǎn)對(duì)混合線性模型種固定效應(yīng)的影響;而Cook距離(CD(e))是用
3、來(lái)評(píng)價(jià)某個(gè)數(shù)據(jù)點(diǎn)對(duì)隨機(jī)效應(yīng)的影響。采用C++編程語(yǔ)言編寫(xiě)了計(jì)算機(jī)模擬程序,通過(guò)蒙特卡羅模擬方法產(chǎn)生模擬數(shù)據(jù),隨機(jī)設(shè)定若干異常值,并運(yùn)用本研究提出的方法來(lái)檢測(cè)異常值,來(lái)檢驗(yàn)方法的有效性和可靠性。結(jié)果表明,利用上述的異常值評(píng)價(jià)指標(biāo),方法Ⅰ和方法Ⅱ都能夠檢測(cè)到模擬數(shù)據(jù)中人為設(shè)定的異常值,兩者具有相似的異常值檢測(cè)能力。 此外,本研究還運(yùn)用方法Ⅰ和方法Ⅱ?qū)Σ缓挟惓V档臄?shù)據(jù)進(jìn)行分析,來(lái)比較兩種方法的假陽(yáng)性率。結(jié)果表明,與方法Ⅱ相比,利用方
4、法Ⅰ所得到的異常值評(píng)價(jià)指標(biāo)更加平穩(wěn),因此,方法Ⅰ在異常值檢測(cè)方面更加穩(wěn)健。另外,在模擬數(shù)據(jù)中,針對(duì)特定品種、年份和地點(diǎn)的組合設(shè)定異常值。大多數(shù)情況下,方法Ⅰ和方法Ⅱ都能檢測(cè)到這類(lèi)異常值,對(duì)于有些例子,方法Ⅰ能夠具有更強(qiáng)的檢測(cè)能力,而對(duì)于另一下例子,方法Ⅱ則表現(xiàn)的更好。主要分析結(jié)果可總結(jié)如下: 1)本研究提出的方法可以較好地檢測(cè)出混合線性模型中的異常表型值。如果模型中只存在少量離散的異常觀察值,無(wú)論用方法Ⅰ還是用方法Ⅱ,都能檢測(cè)到
5、這些異常值。但如果一個(gè)品種在同一地點(diǎn)、同一年份存在多個(gè)異常值,則無(wú)法檢測(cè)到這些異常值,反正會(huì)將正確的觀察值判定為異常值。 2)基于上述方法,本研究采用C++編程語(yǔ)言編寫(xiě)了一套計(jì)算機(jī)程序,用于混合線性模型的遺傳數(shù)據(jù)分析,檢測(cè)異常觀測(cè)值,并根據(jù)統(tǒng)計(jì)檢驗(yàn)P值的大小來(lái)排列異常值。這套程序也可以提供模型中方差分量的估計(jì)值和隨機(jī)效應(yīng)的預(yù)測(cè)值。 3)在常用遺傳模型的分析結(jié)果中,有些值異常值會(huì)由于其他異常值的掩蓋而無(wú)法被檢測(cè)出來(lái),而有些
6、正常的觀察值則會(huì)由于其它多個(gè)異常值的影響而被誤認(rèn)為是異常值。 4)在常用遺傳模型的分析實(shí)例中,異常值的存在可能會(huì)嚴(yán)重影響固定效應(yīng)的估計(jì)和隨機(jī)效應(yīng)的預(yù)測(cè),而去掉這些異常值之后,則可能在很大程度上改進(jìn)模型的參數(shù)估計(jì)。對(duì)于QTL定位數(shù)據(jù),去除異常值之后,可以檢測(cè)到額外的QTL,并能改進(jìn)遺傳率的估計(jì)。兩個(gè)實(shí)例分析的結(jié)果都表明,去除異常值之后,都能改進(jìn)模型的參數(shù)估計(jì),當(dāng)然,我們并不能武斷地認(rèn)為這些去除異常值完全沒(méi)有生物學(xué)意義。 5
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 11283.基于時(shí)間序列分析的數(shù)據(jù)流異常值檢測(cè)方法研究
- 基于混合線性模型和條件變量分析的DNA微陣列數(shù)據(jù)分析方法研究.pdf
- 基于異常數(shù)據(jù)分析的入侵檢測(cè)研究.pdf
- 基于混合模型的多模態(tài)間歇過(guò)程測(cè)量數(shù)據(jù)異常檢測(cè)方法.pdf
- 風(fēng)電機(jī)組運(yùn)行數(shù)據(jù)中異常值的檢測(cè)方法.pdf
- 面板數(shù)據(jù)模型的異常值檢驗(yàn).pdf
- 基于大數(shù)據(jù)分析的輸變電設(shè)備異常檢測(cè).pdf
- 多維函數(shù)型數(shù)據(jù)中基于投影的異常值檢測(cè).pdf
- 什么是數(shù)據(jù)分析里面的異常檢測(cè)
- 觀測(cè)數(shù)據(jù)的異常值統(tǒng)計(jì)檢驗(yàn)方法研究.pdf
- 基于對(duì)稱(chēng)性檢測(cè)的數(shù)據(jù)分析方法研究.pdf
- 全球能源替代問(wèn)題研究——基于線性與非線性方法的面板數(shù)據(jù)分析.pdf
- 基于數(shù)據(jù)引力的分類(lèi)方法及網(wǎng)絡(luò)異常檢測(cè)模型的研究.pdf
- 傳遞函數(shù)模型中的異常值分析.pdf
- 混合屬性數(shù)據(jù)集異常檢測(cè)新方法.pdf
- 兩類(lèi)時(shí)間序列模型的異常值檢測(cè)研究.pdf
- 混合空間自回歸模型中多個(gè)異常值問(wèn)題的診斷研究.pdf
- 基于異常值處理的隨機(jī)森林和kNN模型在EEG數(shù)據(jù)中的應(yīng)用.pdf
- 基于時(shí)段基因的高維混合面板數(shù)據(jù)分析模型研究.pdf
- 混合屬性數(shù)據(jù)集異常檢測(cè)新方法
評(píng)論
0/150
提交評(píng)論