生物信息學中kog數據庫是什麽意思
根據需要從壹級數據庫中搜集對象的相關數據集合而成的就是二級數據庫.
像genebank,EMBL這種都是不加選擇的壹級數據庫,只要是實驗獲得的,不管什麽東西的序列,哪怕是不完整的序列都能上傳,而且它們的數據也有可能有重復.如果有某個人專門研究細菌的鑒定,需要用到正式被認可的16srDNA序列,為了研究方便,把這些壹級數據庫的各個種類細菌的公認標準16srDNA序列的數據進行整理,重新構建了壹個數據庫,這就是所謂的二級數據庫.如果不構建,直接用壹級數據庫做blast,就會得出很多未被承認甚至不完整的序列,還要人工壹個個看過去,找出公認的標準序列,這樣就很麻煩.我舉得例子在現實中就是韓國的EzTaxon.