生物信息學復習題_第1頁
已閱讀1頁,還剩26頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、名詞解釋名詞解釋1..生物信息學生物信息學:是研究生物信息的采集、處理、存儲、傳播,分析和解釋等各方面的學科,也是隨著生命科學和計算機科學的迅猛發(fā)展,生命科學和計算機科學相結合形成的一門新學科。2.2.二級數(shù)據(jù)庫二級數(shù)據(jù)庫:在一級數(shù)據(jù)庫、實驗數(shù)據(jù)和理論分析的基礎上針對特定目標衍生而來,是對生物學知識和信息的進一步的整理。3.FASTAFASTA序列格式序列格式:是將DNA或者蛋白質序列表示為一個帶有一些標記的核苷酸或者氨基酸字符串,大于

2、號()表示一個新文件的開始,其他無特殊要求。4.genbankgenbank序列格式序列格式:是GenBank數(shù)據(jù)庫的基本信息單位,是最為廣泛的生物信息學序列格式之一。該文件格式按域劃分為4個部分:第一部分包含整個記錄的信息(描述符);第二部分包含注釋;第三部分是引文區(qū),提供了這個記錄的科學依據(jù);第四部分是核苷酸序列本身,以“”結尾。5.EntrezEntrez檢索系統(tǒng)檢索系統(tǒng):是NCBI開發(fā)的核心檢索系統(tǒng),集成了NCBI的各種數(shù)據(jù)庫,

3、具有鏈接的數(shù)據(jù)庫多,使用方便,能夠進行交叉索引等特點。6.BLASTBLAST:基本局部比對搜索工具,用于相似性搜索的工具,對需要進行檢索的序列與數(shù)據(jù)庫中的每個序列做相似性比較。P947.查詢序列(查詢序列(queryquerysequencesequence):也稱被檢索序列,用來在數(shù)據(jù)庫中檢索并進行相似性比較的序列。P988.打分矩陣(打分矩陣(scingscingmatrixmatrix):在相似性檢索中對序列兩兩比對的質量評估方

4、法。包括基于理論(如考慮核酸和氨基酸之間的類似性)和實際進化距離(如PAM)兩類方法。P299.空位(空位(gapgap):在序列比對時,由于序列長度不同,需要插入一個或幾個位點以取得最佳比對結果,這樣在其中一序列上產生中斷現(xiàn)象,這些中斷的位點稱為空位。P2910.空位罰分空位罰分:空位罰分是為了補償插入和缺失對序列相似性的影響,序列中的空位的引入不代表真正的進化事件,所以要對其進行罰分,空位罰分的多少直接影響對比的結果。P3711.E

5、.E值:衡量序列之間相似性是否顯著的期望值。12.低復雜度區(qū)域低復雜度區(qū)域:BLAST搜索的過濾選項。指序列中包含的重復度高的區(qū)域,如poly(A)。13.點矩陣(點矩陣(dotdotmatrixmatrix):構建一個二維矩陣,其X軸是一條序列,Y軸是另一個序列,然后在2個序列相同堿基的對應位置(x,y)加點,如果兩條序列完全相同則會形成一條主對角線,如果兩條序列相似則會出現(xiàn)一條或者幾條直線;如果完全沒有相似性則不能連成直線。14.多

6、序列比對多序列比對:通過序列的相似性檢索得到許多相似性序列,將這些序列做一個總體的比對,以觀察它們在結構上的異同,來回答大量的生物學問題。15.分子鐘分子鐘:認為分子進化速率是恒定的或者幾乎恒定的假說,從而可以通過分子進化推斷出物種起源的時間。16.系統(tǒng)發(fā)育分析系統(tǒng)發(fā)育分析:通過一組相關的基因或者蛋白質的多序列比對或其他性狀,可以研究推斷不同物種或基因之間的進化關系。17.進化樹的二歧分叉結構進化樹的二歧分叉結構:指在進化樹上任何一個分

7、支節(jié)點,一個父分支都只能被分成兩個子分支。系統(tǒng)發(fā)育圖:用枝長表示進化時間的系統(tǒng)樹稱為系統(tǒng)發(fā)育圖,是引入時間概念的支序圖。18.直系同源直系同源:指由于物種形成事件來自一個共同祖先的不同物種中的同源序列,具有相似或不同的功能。(書:在缺乏任何基因復制證據(jù)的情況下,具有共同祖先和相同功能的同源39.PDB(ProteinDataBank):PDB中收錄了大量通過實驗(X射線晶體衍射,核磁共振NMR)測定的生物大分子的三維結構,記錄有原子坐標

8、、配基的化學結構和晶體結構的描述等。PDB數(shù)據(jù)庫的訪問號由一個數(shù)字和三個字母組成(如,4HHB),同時支持關鍵詞搜索,還可以FASTA程序進行搜索。40.GenPept:是由GenBank中的DNA序列翻譯得到的蛋白質序列。數(shù)據(jù)量很大,且隨核酸序列數(shù)據(jù)庫的更新而更新,但它們均是由核酸序列翻譯得到的序列,未經試驗證實,也沒有詳細的注釋。41.折疊子(折疊子(Fold):在兩個或更多的蛋白質中具有相似二級結構的大區(qū)域,這些大區(qū)域具有特定的空

9、間取向。42.TrEMBL:是與SWISSPROT相關的一個數(shù)據(jù)庫。包含從EMBL核酸數(shù)據(jù)庫中根據(jù)編碼序列(CDS)翻譯而得到的蛋白質序列,并且這些序列尚未集成到SWISSPROT數(shù)據(jù)庫中。43.MMDB(MolecularModelingDatabase):是(NCBI)所開發(fā)的生物信息數(shù)據(jù)庫集成系統(tǒng)Entrez的一個部分,數(shù)據(jù)庫的內容包括來自于實驗的生物大分子結構數(shù)據(jù)。與PDB相比,對于數(shù)據(jù)庫中的每一個生物大分子結構,MMDB具有許

10、多附加的信息,如分子的生物學功能、產生功能的機制、分子的進化歷史等,還提供生物大分子三維結構模型顯示、結構分析和結構比較工具。44.SCOP數(shù)據(jù)數(shù)據(jù)庫:提供關于已知結構的蛋白質之間結構和進化關系的詳細描述,包括蛋白質結構數(shù)據(jù)庫PDB中的所有條目。SCOP數(shù)據(jù)庫除了提供蛋白質結構和進化關系信息外,對于每一個蛋白質還包括下述信息:到PDB的連接,序列,參考文獻,結構的圖像等??梢园唇Y構和進化關系對蛋白質分類,分類結果是一個具有層次結構的樹,

11、其主要的層次依次是類(class)、折疊子(fold)、超家族(superfamily)、家族(family)、單個PDB蛋白結構記錄。45.PROSITE:是蛋白質家族和結構域數(shù)據(jù)庫,包含具有生物學意義的位點、模式、可幫助識別蛋白質家族的統(tǒng)計特征。PROSITE中涉及的序列模式包括酶的催化位點、配體結合位點、與金屬離子結合的殘基、二硫鍵的半胱氨酸、與小分子或其它蛋白質結合的區(qū)域等;PROSITE還包括根據(jù)多序列比對而構建的序列統(tǒng)計特征

12、,能更敏感地發(fā)現(xiàn)一個序列是否具有相應的特征。46.GeneOntology協(xié)會:編輯一組動態(tài)的、可控的基因產物不同方面性質的字匯的協(xié)會。從3個方面描述基因產物的性質,即,分子功能,生物過程,細胞區(qū)室。47.表譜(PSSM):指一張基于多序列比對的打分表,表示一個蛋白質家族,可以用來搜索序列數(shù)據(jù)庫。48.蛋白質組蛋白質組p179:是指一個基因組中各個基因編碼產生的蛋白質的總體,即一個基因組的全部蛋白產物及其表達情況。49.中心法則中心法則

13、是指遺傳信息從DNA傳遞給RNA,再從RNA傳遞給蛋白質,即完成遺傳信息的轉錄和翻譯的過程。也可以從DNA傳遞給DNA,即完成DNA的復制過程。這是所有有細胞結構的生物所遵循的法則。50.一級數(shù)據(jù)庫一級數(shù)據(jù)庫:數(shù)據(jù)庫中的數(shù)據(jù)直接來源于實驗獲得的原始數(shù)據(jù),只經過簡單的歸類整理和注釋51.基因芯片基因芯片(genechip),又稱DNA微陣列(microarray),是由大量cDNA或寡核苷酸探針密集排列所形成的探針陣列,其工作的基本原理是

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論