歐洲生物信息學研究所(European Bioinformatics Institute, EBI)創建的壹個核酸序列數據庫。EMBL的數據來源主要有兩部分,壹部分由科研人員或某些基因組測序機構通過計算機網絡直接提交,另壹部分則來自科技文獻或專利(Stoesser等, 1998)。EMBL與DDBJ、GenBank建有合作關系,他們分別在全世界範圍內收集核酸序列信息,每天都將新發現或更新過的數據相互交換。
DNA數據庫的規模正在以指數方式增長,平均不到9個月就增加壹倍。1998年1月,EMBL中收錄的序列數已超過壹百萬,包括15,500個物種,其中模式生物的序列占50%以上,它們包括人類(Homo sapiens), 線蟲(Caenorhabditis elegans),啤酒酵母(Saccharomyces cerevisiae),小鼠(Mus musculus)和擬南芥(Arabidopsis thalania)。
可以利用序列查詢系統 SRS(Sequence Retrieval System)從EMBL數據庫中提取有關信息(Etzold等,1996年)。SRS序列查詢系統通過超文本鏈接將DNA序列數據庫和蛋白質序列、功能位點、結構、基因圖譜以及文獻摘要MEDLINE等各種數據庫聯系在壹起。利用EBI網站提供的BLAST或FastA程序,可以對EMBL數據庫進行未知序列同源性搜索。