⑴從當前物理圖譜生成的克隆產生了完整的序列,覆蓋了基因組96%以上的常染色質區域。已經實現了1Gb左右的完成序列。其余的已經勾畫出來了,所有的克隆都有望達到8 ~ 10倍的覆蓋率,大約是2001年的中期(99.99%的準確率),使用既定的、日益自動化的協議。
⑵檢測另壹個庫以彌補缺口。使用FISH技術或其他方法分析沒有閉合的縫隙大小。這樣22,265,438+0條染色體。2003年完成。
⑶開發新的技術來填補很難填補的空白,大約有幾百個。
基因組序列工作底稿:通過對染色體位置清晰的BAC連續克隆測序,覆蓋4-5次(BAC克隆水平的覆蓋不應少於3次),獲得90%以上的基因組序列,錯誤率應小於65438±0%。工作框架圖可用於理解基因組結構、識別和分析基因、定位和克隆疾病基因、發現SNP等。
素描的作用
1,草圖,多種疾病相關基因被鑒定。
2.SNP(人與人之間的差異),草圖為理解遺傳基礎和人類特征的進化提供了壹個框架。
3.素描之後,研究人員有了研究調控區域和基因網絡的新工具。
4.比較其他基因組可以揭示相同的調控元件,其他物種共享的遺傳環境可以提供個體水平上的功能和調控信息。
5.草圖也是研究基因組向細胞核三維壓縮的壹個切入點。這種壓縮可能會影響基因調控。
6.在應用上,草圖信息可以開發新的技術,如DNA芯片和蛋白質芯片,作為傳統方法的補充。目前,這種芯片可以包含蛋白質家族的所有成員,這樣就可以找到那些在特定疾病組織中有活性的成員。
20065438+2月1日,美國Celera公司和人類基因組計劃分別在《科學》和《自然》上發表了人類基因組的詳細圖譜及其初步分析結果。其中,政府資助的人類基因組計劃采用基因圖譜戰略,而Celera公司采用“獵槍戰略”。到目前為止,兩個不同的組織通過使用不同的方法實現了他們的共同目標:完成人類全基因組測序;而且,結果驚人的相似。人類全基因組測序的基本完成開辟了人類生命科學的新時代,對生命本質、人類進化、生物遺傳、個體差異、發病機理、疾病預防、新藥開發、健康長壽以及整個生物學等領域產生了深遠的影響和重大意義,標誌著人類生命科學新時代的到來。
無數的發現
1.分析表明,人類全基因組約為2.91Gbp,約有39000個基因;平均基因大小為27kbp;其中G+C的含量較低,僅占38%,而2號染色體的G+C含量最高。到目前為止,還有9%的堿基對序列沒有確定。染色體19包含的基因最多,而染色體13包含的基因最少,等等。(詳見cmbi特別報道:生命科學重大進展)。
2.目前已經發現並定位了26000多個功能基因,其中42%的基因是未知的。已知基因中,酶占10.28%,核酸酶占7.5%,信號轉導占12.2%,轉錄因子占6.0%,信號分子占1.2%,受體分子占5%。發現和了解這些功能基因的功能對於基因功能和新藥篩選具有重要意義。
3.基因數量少得驚人:有研究人員曾預測人類大約有654.38+0.4萬個基因,但Celera公司將人類基因總數定在2638.3萬到391.1.4萬之間,不超過4萬個,僅是線蟲或果蠅基因數量的兩倍。人類只有300個基因,但老鼠沒有。這麽少的基因就能產生這麽復雜的功能,說明基因組的大小和基因的數量在生命進化中可能意義不大。這也說明人類的基因比其他生物更‘有效’,壹些人類基因的功能和控制蛋白質產生的能力與其他生物不同。這將對我們目前的許多概念提出巨大挑戰,並將為後基因組時代生物醫學的發展提供新的非凡機遇。但由於基因剪切、EST數據庫重復以及壹些技術和方法上的錯誤,未來人類基因的數量可能會超過4萬個。
4.人類單核苷酸多態性比例約為65,438+0/65,438+0,250 bp。不同人群只有1.4萬個核苷酸的差異,人與人之間99.99%的基因編碼是相同的。人們還發現,不同種族的人在基因上比同壹種族的人更相似。在整個基因組序列中,人與人之間的變異只有萬分之壹,這說明人類不同物種之間並沒有本質的區別。
5.人類基因組中存在“熱點”和大片沙漠。在染色體上,有基因聚集、密集分布的區域,也有只有“無用DNA”——不含或含極少基因的成分的大面積區域。基因組中大約有1/4個區域沒有基因片段。在所有的DNA中,只有1%-1.5%可以編碼蛋白質。在人類基因組中,98%以上的序列是所謂的“無用DNA”,有300多萬個長片段重復序列。這些重復的“無用”序列絕不是無用的。它們必須包含人類基因的新功能和奧秘以及關於人類進化和差異的信息。經典分子生物學認為,壹個基因只能表達壹種蛋白質,但人體內有許多復雜的蛋白質,提示壹個基因可以編碼多種蛋白質,蛋白質比基因更重要。
6.男性的基因突變率是女性的兩倍,人類大多數遺傳病都是在Y染色體上進行的。所以男性可能在人類遺傳中扮演更重要的角色。
7.人類基因組中約有200個基因來自插入人類祖先基因組中的細菌基因。這種插入基因在無脊椎動物中很少見,這意味著它是在人類進化後期插入到我們的基因組中的。可能是在我們人類免疫防禦系統建立之前,寄生在體內的細菌在出生過程中與人類基因組進行了基因交換。
8.發現並準確定位了約140萬個單核苷酸多態性,初步鑒定了30多個致病基因。隨著進壹步的分析,不僅可以確定危害人類生命健康的最嚴重疾病的致病基因,如遺傳病、腫瘤、心血管疾病、糖尿病等。,還能找到個體化的防治藥物和方法,同時對進壹步了解人類進化有重要作用。
9.人類基因組編碼的全套蛋白質(蛋白質組)比無脊椎動物編碼的蛋白質組更復雜。人類和其他脊椎動物重新排列了蛋白質的結構域,形成了新的結構。也就是說,人類的進化和特征不僅取決於產生壹種全新的蛋白質,還取決於對現有蛋白質的重新排列和擴展,從而實現蛋白質的種類和功能多樣性。有人推測,壹個基因平均可以編碼2-10種蛋白質,以適應人類復雜的功能。
模式生物:酵母、大腸桿菌、黑腹果蠅、秀麗隱桿線蟲、小鼠、擬南芥、水稻、玉米等模式生物的基因組計劃也已完成或進展順利。
目前,基因組學的研究出現了幾個轉變:壹個是將已知基因的序列和功能聯系起來的功能基因組學研究;二是基於作圖的基因分離轉向了基於序列的基因分離;第三,從研究病因到探索發病機制;第四,從疾病診斷到疾病易感性研究。
在後基因組時代,如果對已完成基因組測序的整個物種進行對比分析,我們希望在全基因組尺度上了解基因組和蛋白質組的功能意義,包括基因組的表達和調控,基因組的多樣化和進化,以及基因及其產物在生物體生長、發育、分化、行為、衰老和治療過程中的作用機制,因此必須開發新的算法,充分利用超級計算機的超級計算能力。
2006年5月8日,美國和英國科學家在《自然》網絡版上發表了人類最後壹條染色體1。
在人體所有22對常染色體中,染色體1包含的基因數量最多,達到3141,是平均水平的兩倍。* *擁有超過2.23億個堿基對,也是最難破譯的。壹支由150名英美科學家組成的團隊花了10年才完成了1號染色體的測序。
科學家不止壹次宣布人類基因組計劃完成,但都沒有全文發表。這壹次,生命之書更加準確,覆蓋了人類基因組的99.99%。解讀人類遺傳密碼的“生命之書”宣告完成,歷時16年的人類基因組計劃的最後壹章書寫完畢。人類基因組計劃還包括幾個模式生物基因組計劃,中國支持的水稻基因組研究計劃也可以歸入這壹類。模式生物壹直是生命科學領域的基本模式。此外,與人類相比,它們的基因組結構簡單,單位DNA長度的基因密度高,基因識別容易。而且從低到高的每個模式生物都是研究基因分子進化的絕佳材料。模式生物之間的比較研究將有助於闡明人類基因的結構和功能。模式生物在整體水平上研究基因的功能具有不可替代的作用。
我國基因組研究起步晚,底子薄,底子薄,經費少。與HGP近年來在世界上的驚人速度相比,中國與還有很大差距,而且這種差距有可能進壹步加大。中國生命科學界應在以下幾個方面共同努力:
1.盡快收集和利用我國寶貴的多民族基因組資源和遺傳病家系資料,防止這些資源盲目流向國外。
只有集中人力、物力、財力,建立集分子遺傳學、自動化技術、信息技術於壹體的互補中心,才能有效開展工作。
3.根據我國國情和原有工作基礎,有所為有所不為,走“短、平、快”之路,出奇制勝,直接楔入基因組研究最關鍵的部分——基因識別,如走“cDNA計劃”之路,盡可能克隆出大量新基因,在8萬~ 654.38+萬人類基因中占有壹定份額。同時,由於基因組DNA測序是壹項勞動密集型和技能密集型的工作,如果能夠引進技術,培養壹支高水平的技術隊伍,完全有可能吸引壹部分人類基因組測序到中國來。
充分利用國際基因數據庫中的現有信息,建立生物信息學技術,推進我國的基因組研究,在基因組轉錄順序的理解和基因功能推測方面多做工作。
5.多渠道籌集資金,在維護知識產權的前提下開展國際合作。
歷史將中國當代科學家推上了國際合作與競爭的舞臺。他們有責任支持他們的國家和人民,支持265,438+0世紀中國的科學、技術和工業。只有他們高瞻遠矚,審時度勢,孜孜不倦,不計得失,才能在國際人類基因組計劃中占有壹席之地,才有資本交換和共享數據,共同享用人類基因組。
HGP於1994年在中國啟動,現已建立了南北兩個漢族群體和西南、東北地區12個少數民族的733個永生化細胞系,保存了寶貴的中國基因資源,在多民族基因組多樣性研究方面取得了成果,在致病基因研究方面也有所發現。名為“中國基因組結構與功能研究”的HGP項目是“九五”計劃(700萬元)最大的資助項目之壹,它為中國在下世紀新壹輪國際HGP科學競賽中占據有利地位奠定了良好的基礎。