1,生物信息學:生物分子信息的獲取、存儲、分析和利用;基於數學,應用
計算機技術,研究生物數據的科學。
2.相似性:兩個序列(核酸、蛋白質)之間的相關性。
3.同源性:生物進化過程中起源於同壹祖先的分支之間的關系。
4.同壹性:沒有突變的兩個序列(核酸、蛋白質)之間的關系。
5.序列比對:確定兩個或多個序列之間的相似性甚至同源性。
並按照壹定的規則進行排列。
6、生物數據庫查詢(database query):序列、結構和各種兩種。
通過關鍵字匹配來搜索二級數據庫中的註釋信息。
7.數據庫搜索:通過特定的序列相似性比較算法找出核心。
酸或蛋白質序列數據庫中與待測序列有壹定相似度的序列。
二、簡答題:
1.分子生物學的三大核心數據庫是什麽?他們有什麽特點?
GenBank核酸序列數據庫;瑞士-PROT蛋白質序列數據庫;PDB生物大分子的結構數
根據圖書館;
2.簡述生物信息學的發生和發展。
20世紀50年代,生物信息學開始孕育。
20世紀60年代,生物分子信息在概念上將計算生物學與計算機科學聯系起來。
20世紀70年代,生物信息學的真正開始;
從20世紀70年代到80年代初,出現了壹系列著名的序列比較方法和生物信息學分析。
方法;
80年代以後,出現了壹批生物信息服務機構和生物信息數據庫。
20世紀90年代以後,HGP推動了生物信息學的快速發展。
3.生物信息學的主要方法和技術有哪些?
數理統計方法;動態規劃法;機器學習和模式識別技術;數據庫技術和數據
挖掘;人工神經網絡技術;專家系統;分子建模技術;量子力學和分子力學
計算;生物分子的計算機模擬;互聯網技術
4.常見的DNA測序方法有哪些?各有什麽技術特點和優缺點?
無極生組合-吉爾伯特DNA化學降解法:優點:可以測定完全未知的序列和富含CG的區域;缺點:操
使之繁瑣;
桑格雙脫氧鏈終止法:優點:簡單易測長片段;缺點:妳需要知道序列的壹部分或者
添加關節;
焦磷酸測序:優點:便宜且高通;缺點:壹個測序片段短。
5.分子生物學數據庫有哪些類型?各有什麽特點?
基因組數據庫:基因組測序
核酸序列數據庫:核酸序列測定
初級數據庫:蛋白質序列數據庫:蛋白質測序。生物大分子(蛋白質)的三維連接
數據庫建設:X射線衍射和核磁共振。
特點:數量少,容量大,更新快。
二級數據庫:在上述四類數據庫和文檔的基礎上構建。
特點:量大,容量小,更新慢。
6.簡述NCBI Entrez系統的功能。
高級檢索系統;尋找核酸,蛋白質,文件,結構,基因組序列,大分子的三維結構,
突變數據、探針序列、單核苷酸多態性和其他數據。
7.簡述NCBI爆破的作用和類型。
序列相似性比較工具;
對於核酸:普通blastn,兆blastn對於高度相似序列;
對於蛋白質:普通blastp,對於rpsblast;
對於人工翻譯序列:核酸翻譯序列為蛋白質序列blastx,蛋白質翻譯序列tblastn。
核酸翻譯序列對翻譯序列tblastx;
其他:基因組blast、基因表達序列搜索GEO blast、序列成對比對...
8.舉例說明生物信息學軟件的應用。
9.在生物芯片的制作和分析過程中,有哪些生物信息學軟件可以使用?
三、作文題:
1,什麽是生物信息學?生物信息學的主要應用領域有哪些?
生物分子信息的獲取、存儲、分析和利用;以數學為基礎,應用計算機技術,研究
研究生物數據的科學。
生物分子數據的收集和管理;數據庫搜索和序列比較;基因組序列分析;基因表
數據分析和處理;蛋白質結構預測。
2.生物信息學在醫學上有哪些應用?
輔助診斷(遺傳病、HLA分型);
研究藥物的作用機制,協助新藥的開發和生產。
3.人類基因組計劃主要使用哪些生物信息學方法?它們對人類基因組計劃意義重大
起到了什麽重要的作用?
單壹測序結果的解釋;重疊群和染色體剪接;鑒定基因區域及其調控區域;尋找基地
因為互動的時空關系;
4.描述蛋白質二級結構預測的主要策略和方法。
策略:
目的:判斷各段中心的殘基是否處於A螺旋、B折疊、B角之壹(或其他狀態)。
二級結構狀態,即三態。
壹種理論分析方法(從頭算方法):理論計算(分子力學、分子動力學等。).
結構預測。優點:不需要經驗數據,可以從壹級結構推斷出高級結構。
缺點:天然和未折疊蛋白質的能級差異很小(千卡/摩爾);蛋白質為可能的想法提供了巨大的空間。
蛋白質折疊的計算量是巨大的;計算模型中的力場參數不準確。
b、統計方法:對已知結構的蛋白質進行統計分析,建立從序列到結構的映射模型。
此外,根據映射模型,可以從氨基酸直接預測未知結構的蛋白質的結構。
經驗方法:根據壹定序列形成壹定結構的趨勢進行結構預測。通過研究已知的結構
蛋白質的統計分析表明,各種氨基酸往往形成不同的二級結構,從而形成壹個
關於二級結構預測的壹系列規律。
結構規律提取方法:從蛋白質結構數據庫中提取關於蛋白質結構形成的壹般性。
規律,指導未知結構蛋白質模型的建立。
同源建模法:通過同源序列分析或模式匹配,預測蛋白質的空間結構或結。
積木。
方法:
1,Chou-Fasman法;(基於單個氨基酸殘基統計的經驗參數方法,由Chou和
法斯曼是在20世紀70年代提出的。通過統計分析,得出每個殘基都出現在特定的次級結中。
構造構象的取向因子,然後用這些取向因子預測蛋白質的二級結構。)2、
GOR方法;(是壹種基於信息論和貝葉斯統計的方法。GOR把蛋白質序列看作壹個系列。
處理字符串的信息值;GOR方法不僅考慮了氨基酸殘基在預測位置本身的影響,而且
並考慮相鄰殘基類型對該位置構象的影響)3。基於氨基酸疏水性的方法;4、最
鄰近法;5.人工神經網絡方法;6.綜合法:7。利用進化信息預測蛋白質的