定量蛋白質(zhì)組算法研究與應(yīng)用.pdf_第1頁(yè)
已閱讀1頁(yè),還剩134頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、自Marc Wilkins于1994年提出首次“proteome”(蛋白質(zhì)組)以來,蛋白質(zhì)組學(xué)作為繼基因組學(xué)之后的一個(gè)研究熱點(diǎn)領(lǐng)域,已經(jīng)走過了二十個(gè)年頭。期間,隨著質(zhì)譜儀器的不斷更新,以及相應(yīng)實(shí)驗(yàn)技術(shù)的不斷完善,蛋白質(zhì)組學(xué)呈現(xiàn)出高速發(fā)展的趨勢(shì)。質(zhì)譜技術(shù)憑借其高通量、高靈敏性等優(yōu)點(diǎn)已經(jīng)成為了蛋白質(zhì)組研究的主流技術(shù)。質(zhì)譜數(shù)據(jù)解析也成為蛋白質(zhì)組信息學(xué)的主要研究?jī)?nèi)容之一。
  然而,早期的質(zhì)譜儀器精度較低,數(shù)據(jù)往往包含較多的噪聲,譜圖質(zhì)量

2、較差。因此研究人員首先要解決定性鑒定的相關(guān)問題,比如如何找到譜圖對(duì)應(yīng)的肽段序列、鑒定結(jié)果中的假陽(yáng)性如何過濾即質(zhì)量控制等多方面的問題。值得欣慰的是,經(jīng)過多年來科研人員的共同努力,一方面質(zhì)譜儀器的精度和分辨率得到了大幅度提升,質(zhì)譜數(shù)據(jù)質(zhì)量越來越高;另一方面,相應(yīng)的分析方法和工具也日趨完善,這些基本的鑒定問題已經(jīng)得到了較好的解決。近年來,蛋白質(zhì)組學(xué)的研究重點(diǎn)已經(jīng)逐漸從之前的定性研究轉(zhuǎn)移到了定量研究。定量蛋白質(zhì)組學(xué)已經(jīng)成為組學(xué)領(lǐng)域的研究熱點(diǎn)之一

3、,它既包含了相同蛋白質(zhì)在不同狀態(tài)中的豐度變化研究,又包含了不同蛋白質(zhì)在同一狀態(tài)中的絕對(duì)定量研究。它的發(fā)展對(duì)蛋白質(zhì)相互作用、疾病相關(guān)的生物標(biāo)志物以及蛋白質(zhì)豐度規(guī)律變化等多方面的研究都具有重大意義。
  目前,定量蛋白質(zhì)組按照是否研究蛋白質(zhì)的絕對(duì)豐度,又可以分為相對(duì)定量與絕對(duì)定量?jī)深悺T谙鄬?duì)定量研究中,按照是否需要穩(wěn)定同位素標(biāo)記又可以分為有標(biāo)定量與無標(biāo)定量。針對(duì)不同的類別,眾多的實(shí)驗(yàn)策略應(yīng)運(yùn)而生,但是相應(yīng)的計(jì)算方法研究卻稍顯滯后。一方

4、面,質(zhì)譜數(shù)據(jù)規(guī)模增長(zhǎng)迅速,數(shù)據(jù)復(fù)雜度不斷增加,對(duì)定量分析方法的準(zhǔn)確性、靈敏性以及分析效率的要求越來越高;另一方面,質(zhì)譜數(shù)據(jù)的精度也在逐漸提高,如何有效結(jié)合定量實(shí)驗(yàn)策略,充分挖掘高精度質(zhì)譜數(shù)據(jù)中的定量信息,這將是一個(gè)挑戰(zhàn)。
  針對(duì)上述問題,本研究主要關(guān)注于定量蛋白質(zhì)組學(xué)的定量算法研究以及定量軟件和工具的研發(fā)與應(yīng)用,為后續(xù)定量蛋白質(zhì)組學(xué)的發(fā)展提供方法學(xué)支撐。本文具體研究?jī)?nèi)容包括以下四個(gè)方面:
  (1)考慮了定量可靠性的蛋白質(zhì)

5、相對(duì)定量算法研究。在譜圖層面,我們提出了動(dòng)態(tài)選峰誤差算法,提高了定量結(jié)果的靈敏性。在肽段層面,我們首次提出了定量可靠性的概念,定義了三種定量可靠性過濾指標(biāo)以及兩種定量可靠性打分。定量可靠性過濾指標(biāo)能夠減少肽段定量結(jié)果中的假陽(yáng)性,保證了結(jié)果的準(zhǔn)確性。定量可靠性打分則可以為后續(xù)分析提供定量可靠性判別依據(jù)。在蛋白質(zhì)層面,我們實(shí)現(xiàn)了三種孤點(diǎn)肽段排除算法,有效提升了蛋白質(zhì)定量的準(zhǔn)確性。最后,采用上述定量算法,我們針對(duì)穩(wěn)定同位素標(biāo)記的數(shù)據(jù)設(shè)計(jì)并開發(fā)

6、了自動(dòng)化有標(biāo)定量工具SILVER,并在一組大規(guī)模復(fù)雜數(shù)據(jù)集以及兩組不同標(biāo)記比例的標(biāo)準(zhǔn)數(shù)據(jù)集上驗(yàn)證了SILVER的準(zhǔn)確性、靈敏性和高效性。
  (2)基于肽段定量效率指標(biāo)的蛋白質(zhì)絕對(duì)定量算法研究。首先,我們第一次提出并定義了肽段定量效率指標(biāo),即一個(gè)肽段能被質(zhì)譜檢測(cè)并定量的效率,用以表征肽段實(shí)際豐度值與肽段質(zhì)譜信號(hào)強(qiáng)度之間的關(guān)系。然后,我們收集和整理了587種肽段各方面的性質(zhì)特征,采用半監(jiān)督式學(xué)習(xí)的計(jì)算模型,構(gòu)建了樣本特異性的肽段定量

7、效率指標(biāo)。最后,我們將肽段定量效率指標(biāo)用于蛋白質(zhì)絕對(duì)定量中,并在三組不同復(fù)雜度的數(shù)據(jù)集上和幾種常用絕對(duì)定量方法進(jìn)行了比較,結(jié)果表明基于肽段定量效率的絕對(duì)定量算法能夠顯著降低一個(gè)蛋白質(zhì)對(duì)應(yīng)不同肽段的定量偏差以及重復(fù)實(shí)驗(yàn)中定量值的波動(dòng),在肽段和蛋白質(zhì)層面都具有更好的定量準(zhǔn)確性和定量可重復(fù)性,在高復(fù)雜度的樣本中效果更加明顯。
  (3)綜合性、并行化定量軟件包PANDA的設(shè)計(jì)與開發(fā)。在蛋白質(zhì)定量算法研究的基礎(chǔ)上,我們?cè)O(shè)計(jì)并開發(fā)了包含各類

8、常用定量方法的綜合性、并行化定量軟件包PANDA。其中,我們構(gòu)建了譜圖、肽段和蛋白質(zhì)三個(gè)層面的底層定量算法庫(kù),囊括了無標(biāo)定量、母離子標(biāo)記定量、子離子標(biāo)記定量以及絕對(duì)定量的分析流程。同時(shí),我們?cè)O(shè)計(jì)了多核多線程的并行化架構(gòu),實(shí)現(xiàn)了多種定量算法的并行化和優(yōu)化,能夠完成多個(gè)餾分之間以及單個(gè)餾分內(nèi)部的多重并行化計(jì)算,極大地提高了計(jì)算效率。除此之外,PANDA還具有結(jié)果展示與統(tǒng)計(jì)分析功能,能夠進(jìn)行定量結(jié)果的列表展示與各種圖形展示。最后,PANDA包

9、含了差異蛋白質(zhì)篩選的基本流程,具有缺失值插補(bǔ)、統(tǒng)計(jì)檢驗(yàn)以及層次聚類、主成分分析等多種功能。
  (4)建立大規(guī)模蛋白質(zhì)組定量數(shù)據(jù)分析流程并在實(shí)際分析中應(yīng)用。近年來,中國(guó)人類蛋白質(zhì)組計(jì)劃以及中國(guó)人類染色體蛋白質(zhì)組計(jì)劃陸續(xù)啟動(dòng),產(chǎn)出了大量來自于不同實(shí)驗(yàn)室和不同質(zhì)譜平臺(tái)的蛋白質(zhì)組數(shù)據(jù)。為了統(tǒng)一分析、整合這些不同來源的質(zhì)譜數(shù)據(jù),我們?cè)谇捌诙糠椒ㄑ芯亢凸ぞ唛_發(fā)的基礎(chǔ)上,建立了針對(duì)大規(guī)模蛋白質(zhì)組數(shù)據(jù)的定量分析與歸一化流程,克服了不同實(shí)驗(yàn)操作

10、、不同質(zhì)譜儀器的差別,連續(xù)兩年完成了中國(guó)人類染色體蛋白質(zhì)組計(jì)劃中全部實(shí)驗(yàn)室產(chǎn)出的蛋白質(zhì)組數(shù)據(jù)定量分析任務(wù),提供了準(zhǔn)確的定量結(jié)果,為后續(xù)分析奠定了基礎(chǔ)。
  綜上所述,本研究緊密結(jié)合最新的定量蛋白質(zhì)組學(xué)實(shí)驗(yàn)技術(shù)和儀器的發(fā)展,著眼于質(zhì)譜數(shù)據(jù)中定量信息的深度解析和挖掘,重點(diǎn)研究了定量算法,并針對(duì)不同的定量實(shí)驗(yàn)策略設(shè)計(jì)、開發(fā)了相應(yīng)的定量軟件和工具。這些研究成果能夠直接應(yīng)用于蛋白質(zhì)組學(xué)的定量研究中,目前已經(jīng)在中國(guó)人類染色體蛋白質(zhì)組計(jì)劃等多批

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論