生物信息學(Bioinformatics)是研究生物信息的采集、處理、存儲、傳播,分析和解釋等各方面的學科,也是隨著生命科學和計算機科學的迅猛發展,生命科學和計算機科學相結合形成的壹門新學科。
它通過綜合利用生物學,計算機科學和信息技術而揭示大量而復雜的生物數據所賦有的生物學奧秘。
生物信息學將生物與數學、計算機進行了有效結合,主要通過綜合運用數學和信息科學等多領域的方法和工具對生物信息進行獲取、加工、存儲、分析和解釋,來闡明大量生物數據所包含的生物學意義,研究重點主要體現在基因組學和蛋白質組學兩方面。
技術方法
生物信息學不僅僅是生物學知識的簡單整理和數學、物理學、信息科學等學科知識的簡單應用。海量數據和復雜的背景導致機器學習、統計數據分析和系統描述等方法需要在生物信息學所面臨的背景之中迅速發展。
巨大的計算量、復雜的噪聲模式、海量的時變數據給傳統的統計分析帶來了巨大的困難, 需要像非參數統計(BMC Bioinformatics,2007,339)、聚類分析(Qual Life Res,2007,1655-63)等更加靈活的數據分析技術。
高維數據的分析需要偏最小二乘(partial least squares,PLS)等特征空間的壓縮技術。在計算機算法的開發中,需要充分考慮算法的時間和空間復雜度,使用並行計算、網格計算等技術來拓展算法的 可實現性。