數據庫是以壹定方式合理組織並存儲在計算機存儲設備上的相互關聯的數據的集合。它是計算機技術和信息檢索技術相結合的產物,是電子信息資源的主體,是信息檢索系統的核心部分之壹。根據提供的信息,數據庫主要可以分為參考數據庫和源數據庫。
1.參考數據庫
壹種主要存儲壹系列描述性信息內容並引導用戶到另壹信息源獲取完整原始信息的數據庫,主要包括書目數據庫和指南數據庫。
(1)書目數據庫是存儲目錄、標題、摘要等書目線索的數據庫。,又稱二次文獻信息數據庫。如各種圖書館目錄數據庫、書目數據庫、文摘數據庫等都屬於這壹類,其作用是為用戶指明獲取原始信息的線索。
圖書館目錄數據庫又稱機讀目錄,數據內容詳實,不僅描述了書名、作者、出版項目等書目信息,還提供了館藏信息供用戶索取原始信息。標題和摘要數據庫描述的數據內容與印刷的標題和摘要相似,提供了壹定的信息源如論文信息或專利信息供用戶檢索。
(2)指南數據庫存儲描述關於機構、人、產品、活動等的對象的數據庫。與其他數據庫相比,指南數據庫不僅為用戶提供相關信息,還包括各種類型的實體,並且大多數使用名稱進行檢索。例如,存儲有關生產和業務活動信息的機構目錄數據庫、存儲有關人員信息的傳記數據庫、存儲有關產品或商品信息的產品指南數據庫和存儲有關基金信息的基金數據庫都屬於這壹類,其功能是引導用戶從其他相關信息源獲取更詳細的信息。
2.源數據庫
主要存儲全文、數值、結構式等信息。,並且可以直接提供原始信息或特定數據,因此用戶不需要參考其他信息源的數據庫。主要包括全文數據庫和數值數據庫。
(1)全文數據庫存儲原始信息的全文或主要部分的源數據庫。如期刊全文數據庫、專利全文數據庫、百科全文數據庫等,用戶可以直接檢索到包含某個詞或短語原文信息的全文。
(2)數值型數據庫存儲壹個主要表示數值信息的源數據庫,還有壹個與之類似的文本-數值型數據庫。與書目數據庫相比,數字數據庫是信息深度加工的產物,可以直接提供所需的數據信息。如各種統計數據庫、科技數據庫等。除了壹般的檢索功能外,數值數據庫還具有精確的數據運算、數據分析、圖形處理以及對檢索到的數據進行整理和重組的功能。
數據庫結構
1.書目數據庫的結構
書目數據庫是以文檔形式組織的壹系列數據,這些數據稱為記錄,壹個記錄包含幾個字段。
(1)記錄和字段記錄是作為壹個單元處理的相關數據的集合,是組成文檔的基本數據單元。記錄中包含的幾個字段是構成記錄的基本數據單元。在書目數據庫中,壹條記錄相當於壹個標題或摘要,所以壹條記錄通常由標題字段、作者字段、來源字段、摘要字段、主題字段、分類號字段、語種字段等組成。在某些字段中,有幾個子字段,子字段是字段的較低數據單元。例如,“主題”字段包含多個主題詞。根據字段所代表的記錄的性質,字段通常分為兩類:基本字段和輔助字段。常見字段名和代碼見表4-1。
表4-1字段名稱和代碼
基本字段
輔助場
字段名
域代碼
字段名
域代碼
標題
全音階的第七音
記錄號
(同down)向下的
摘要
AB型血
作者
埃
描述符
特拉華州
作者單位
特許測量員
識別字
身份證明
日誌名稱
john 約翰
出版年份
巴拉圭
出版國
指揮官(commanding officer)
語言種類
大音階第六音
(2)按壹定結構組織起來的相關記錄的集合。文獻是書目數據庫中數據組織的基本形式,文獻組織方式與檢索系統的軟硬件功能密切相關。在書目數據庫中,文獻結構主要分為直列文獻和逆向文獻。
1)內聯文檔記錄按順序存儲,記錄之間的邏輯順序與物理順序壹致,相當於打印工具中摘要的排列順序,是線性文檔。內聯文檔是數據庫的主要部分,但對其主題詞和其他特征的識別是無序的。直接搜索時,需要從頭到尾搜索完整的記錄,耗時較長,不實用。
2)逆向文檔提取了具有主題性質的字段(如主題字段、標題字段、描述字段等。)和沒有學科性質的字段(如作者字段、機構字段、來源字段等。)中的每壹條記錄,並按壹定的順序重新組織它們以獲得壹個文檔。具有主題性質的倒檔稱為基本索引文件,沒有主題性質的倒檔稱為輔助索引文件。
綜上所述,前向移位和後向移位的主要區別在於,前向移位是以完整記錄為處理和檢索單位的主文檔,後向移位是以記錄中的字段為處理和檢索單位的索引文檔。電腦搜索時,先進入倒檔查找相關信息的查閱號,再進入前進檔根據查閱號查找記錄。
2.全文數據庫的結構
壹般全文數據庫的結構類似於書目數據庫。全文數據庫的壹條記錄是全文文本,該記錄分為幾個字段。它的主文檔是以正向行的形式組織的文本文檔,反向文檔是與記錄的可檢測字段相對應的索引文檔。
3.數值數據庫的結構
數值數據庫的結構應綜合考慮數據庫的內容和檢索目的,即在內容上,數值數據庫的主要內容是數值信息,但不排除必要的描述性文本信息。在檢索上,既便於單項檢索,又便於綜合檢索,還能對檢索到的數據進行精確的數據運算、數據分析、圖形處理和排序重組。數字數據庫的數據結構可以是單元或列表的形式。前者是原始數據的模擬,後者是統計表格的機讀模擬。壹個數字數據庫通常有各種各樣的文檔,如內嵌文件、內聯文件、索引文件等。前移由數值數據組成,是主文檔和對應的索引文檔。為了方便訪問,索引文件是以基本的直接訪問結構的形式組織的。倒擋也有相應的索引文檔,是分層組織的。數值數據庫的文檔結構使得所有的文檔都可供檢索,所有的數據都可供計算,這就構成了數值數據庫的特點。
4.指南數據庫的結構
指南數據庫的結構具有書目數據庫、全文數據庫和數字數據庫的特點,包括正向文件、反向文件、索引文件和數據字典。壹般來說,對於學科領域多、內容全面的大型指南數據庫,主文檔可以采用多個子文檔的結構,而對於單壹學科領域和專門內容,則宜采用單壹主文檔和可變長度多字段的記錄格式。