當前位置:律師網大全 - 專利申請 - 檢索緒論

檢索緒論

信息:信息是物質存在的壹種方式、形態或運動狀態,是事物的壹種普遍屬性,壹般指數據、消息中包含的意義,可以使消息中所描述事件的不定性減少。

知識:人們在改造世界的實踐中所獲得的認識和經驗的總和,是人的大腦通過思維重新組合的系統化的信息集合。

情報:為解決壹個特定的問題所需要的激活了的、活化了的特殊知識或信息。

(情報的基本屬性:知識性、傳遞性、效用性)

文獻:記錄有知識的壹切載體。 (GB3792.1-83《文獻著錄總則》)

文獻的四個基本要素:

①記錄知識的具體內容;

②記錄知識的手段,如文字、圖像、符號、聲頻、視頻等;

③記錄知識的物質載體,如紙張、光盤、錄像帶等;

④記錄知識的表現形態,如圖書、期刊、專利說明等。

壹、文獻的類型(按載體類型分):

印刷型:傳統的圖書、期刊等

視聽型:唱片、錄音帶、錄像帶等

縮微型:縮微膠卷、縮微膠片等

數字型(或電子型):電子圖書、電子期刊、數據庫等

*零次文獻:未經信息加工,直接記錄在載體上的原始信息,如實驗數據、試驗記錄、調查材料、設計草圖、私人筆記、口頭交流的信息等。

壹次文獻:即原始文獻,指著者以其本人的研究成果(如實驗、觀察、調查研究等的結果)為基本素材寫成的原始創作。

例如:專著、期刊論文、研究報告、會議文獻、專利文獻、學位論文、會議論文、譯文、電子期刊、電子圖書等。

二次文獻:將大量無序、分散的壹次文獻收集、整理、加工、著錄,並按壹定的順序加以編排,形成可供檢索壹次文獻線索的新的文獻形式。因其檢索功能而稱之為檢索工具或檢索系統。

例如:題錄、目錄、索引、文摘等。

題錄:以期刊論文為例,加下劃線部分為文獻出處。

題名/著者//期刊名.年,卷(期).–頁碼

三次文獻:圍繞某壹專題,利用二次文獻的檢索,在吸取壹次文獻內容的基礎上形成的文獻。如綜述、述評、進展等期刊文獻和百科全書、年鑒、指南、手冊等參考工具書。

綜述(Survey, Review)是指綜合分析和描述壹定時間範圍內某壹學科或專業科研發展和現狀,並預測未來的壹類文獻。

檢索的概念:

檢索(Retrieval):利用檢索工具查詢問題答案的全過程。

文獻檢索(Literature retrieval):指以獲取文獻為目的,科學地借助各種檢索工具,查詢相關文獻資料的過程。

信息檢索(Information retrieval):指從任何信息集合中查出所需信息的活動、過程和方法,有廣義和狹義兩種理解。廣義的信息檢索還包括信息存儲,合稱信息存儲與檢索。狹義的信息檢索僅指信息的查找過程。

檢索語言是信息存儲與檢索過程中描述信息特征和表達用戶信息提問的壹種人工語言。

它是根據文獻的外表特征或者內容特征,把某些具有檢索意義的語言或符號加工編制成為文獻信息檢索服務的特殊語言。

檢索語言的主要作用是對文獻的外表特征和內容特征進行多層次描述,提供多種檢索途徑,以方便用戶從不同角度進行檢索查找。

分類語言:

中國圖書館圖書分類法(中圖法)

國際十進分類法(Universal Decimal Classification, UDC)

美國國會圖書館圖書分類法(Library of Congress Classification, LC)

中圖法基本大類:

A 馬克思主義、列寧主義、毛澤東思想

B 哲學

C 社會科學總論

D 政治、法律

E 軍事

F 經 濟

G 文化、科學、教育、體育

H 語言、文學

I 文學

J 藝術

K 歷史、地理

N 自然科學總論

O 數理科學和化學

P 天文學、地球科學

Q 生物科學

R 醫藥、衛生

S 農業科學

T 工業技術

U 交通運輸

V 航空、航天

X 環境科學、勞動保護科學(安全科學)

Z 綜合性圖書

關鍵詞:指出現在文獻的標題、文摘或全文中,能表達文獻實質內容的,或者能被人們作為檢索入口的關鍵性專業名詞術語。是壹種沒有規範化的自然語言,又稱為自由詞。

主題詞:是壹種反映文獻內容主題、經過嚴格規範化了的人工語言。即是將反映文獻主題的各種同義詞進行書寫形式的統壹化後定下的檢索語言。

數據庫及其結構:

數據庫(Database)是能滿足某種特定目的或某壹特定數據處理系統需要的壹種數據集合,它可以由壹個或多個文檔組成。

文檔(File)是數據庫中壹部分記錄的集合。

記錄(Record)是數據庫中的基本文獻單元,壹條記錄往往記錄著壹篇文獻的相關信息。

字段(Field)是組成記錄的基本信息單元。每壹個字段都描述文獻的某壹方面的特征,包括外表特征和內容特征,如題名、作者、刊名、出版年、主題詞等等。各個描述文獻壹部分特征的字段組合就成了記錄。

布爾邏輯檢索是檢索系統中應用最為廣泛的檢索技術,是最簡單、最基本的匹配模式,其理論基礎是集合論與布爾邏輯。

布爾邏輯檢索采用布爾邏輯表達式來表達用戶的檢索要求。布爾邏輯表達式是指通過布爾邏輯運算符來連接檢索詞,以及表示運算優先級的括號組成的壹種表達檢索要求的算式。

例: (肺癌 or 肺腫瘤)and 手術

位置檢索(又稱相鄰度檢索、鄰近檢索):檢索時通過位置算符(又稱鄰近算符)規定檢索詞之間在原始文獻中的相鄰位置關系。

位置算符都隱含了邏輯算符AND的含義,即由它們連結的兩個檢索詞(式)都必須出現,但位置算符還對連結的兩個檢索詞的位置關系作了進壹步的限定。

位置檢索大致包括三種級別的檢索:

字段級檢索:限定檢索詞在同壹字段範圍內,如with(Medline光盤數據庫);

子字段或自然句級檢索:限制檢索詞在同壹子字段或自然句中,如near(Medline光盤數據庫);

詞位置檢索:限定檢索詞的相互位置滿足某些條件,如彼此相隔多少個詞(或字),是否以壹定的先後順序出現,壹個詞的出現是否不允許另壹個詞(或字)同時出現等,如nW、pre(ScienceDirect)。

截詞檢索是在檢索時針對檢索詞附加壹個截斷符號,指明該檢索詞在與文獻數據庫的詞比較時,采取完整匹配還是部分匹配。

截詞符分為無限截斷和有限截斷。

無限截斷:壹個截詞符代表多個字符,常用截詞符 “*”。有前截斷、中截斷、後截斷之分。

有限截斷:壹個截詞符只能代表壹個字符,常用截詞符 “?”(又稱通配符)。

指定字段檢索是指為了達到某種檢索目的,把檢索的範圍限制在某個或某幾個字段內進行的檢索方法。

知識是人的大腦經過思維加工而形成的有序化信息的集合,是壹種信息產品,是信息的壹部分;文獻則是記錄有人類知識的壹切載體,是知識的壹部分;情報是人們為解決特定問題而被活化了的知識,是知識的壹部分,情報也蘊含在文獻之中,但不是所有文獻都是情報,因而信息、知識、文獻、情報之間是壹種包含與被包含的關系。

  • 上一篇:集體租賃住房和小產權房有什麽區別?
  • 下一篇:接軌國際市場 文創產業智財問題面面觀
  • copyright 2024律師網大全