1,壹切知識的載體都被記錄下來——文學的定義。這四個要素是:知識內容、信息符號、載體材料和記錄的方式方法。
2.原始文件、二級文件和三級文件-原始文件、有序文件和仔細分類的二級文件。
3.文件載體:印刷型、微型、視聽型和電子型。
4.文獻出版類型及識別:圖書、期刊、會議文件、科學報告、專利、標準文件、學位論文、產品資料。
5.電子文獻的類型與識別:電子圖書、電子期刊、動態電子信息。
6.文件溝通方式:直接溝通(非正式溝通)和間接溝通(正式溝通)
7.文獻分布規律:出版時間的分布,通過互聯網和最新的報紙、雜誌、廣播、電視媒體獲得的最新信息;2個月到10年應該主要通過網絡書刊數據庫解決;除了期刊,5-20年前的資料也可以通過印刷書籍和手工參考書找到。
學科分布,壹個學科相關的文獻分為三類:核心文獻、相關文獻、邊緣文獻。
8.文學的內部和外部特征。內容特征和外觀特征:與文獻信息主題無關的信息稱為文獻信息的外觀特征。與文獻信息主題內容密切相關的信息稱為文獻信息的內容特征。
9.搜索語言和類型:搜索語言主要包括以代碼語言為特征的分類語言和以對象名稱和術語為特征的主題語言。
10檢索系統類型:目錄、題名記錄、摘要、索引。
11分類語言:上下位關系體現了概念外延的包含和從屬關系。
12.多概念話題分類法:應用單壹概念話題分類法,註意概念話題和應用話題並列這兩點。
13.目前常用的主題語言有關鍵詞語言和敘事語言。禁用詞:沒有檢索意義的詞
14,關鍵詞和敘事語言p43-44
詳細:關鍵詞是壹種自然主題語言,指作者在文學作品中頻繁使用的詞語。
15,檢索步驟:1,明確主題要求;2.了解學科背景知識,總結課程的學科內容;3.分析並提取題目中涉及的概念;4.選擇檢索系統;5、實施檢索和獲取原文
16,檢索方法:直接法,間接法:回溯法,常用法,綜合法。
17.文獻檢索對象:文獻、數據、事實檢索。文獻檢索:書目和全文檢索
18.機器檢驗的必要條件:物質條件和人員條件。物質條件包括數據庫、通訊系統和檢索終端。人員素質包括:1,對學科的了解程度;2.掌握檢索系統;3、語言掌握的程度
19.數據庫的定義和組成:文檔、記錄和字段。三種類型:文本型、數字型和多媒體型。數據庫包括至少壹個內嵌文檔和壹個反向文檔。
20.內聯文檔:數據庫中的所有記錄都是按照記錄號的大小排列的。反向文檔:基於記錄的特征標識。
21,記錄表達式:在全文數據庫中,壹條記錄相當於壹個完整的文檔;在書目數據庫中,記錄相當於摘要或書目。
22.字段:基本字段和輔助字段。
23.檢索概念擴展方法:基於同壹概念、基於內容分析和基於檢索結果。
24.切字法:切字字符壹般包括“?”、"*"、"$"、"%"。截詞法要註意三個問題:壹、截詞後面緊跟著詞幹,截詞和詞幹之間不能有空格。第二是避免將搜索詞的詞幹切得太短,壹般應該在三個字母以上。如果截止時間太短,不僅結果無關緊要,而且系統開銷也很大。第三,合理使用截詞。第四,從想要出現的詞中盡可能多的抽取公* *信,提高精準度。
25.布爾邏輯運算符:OR/AND/NOT
26.優先級運算符:只需添加()。
27.位置運算符:w,n. With,Near .p69-70
詳細:W(帶),N(近),這兩個大家都知道,就不介紹了!
S(情):指搜索到的兩個詞必須出現在同壹個S(句中,但兩個詞的順序可以顛倒!
f(場):指兩邊的搜索必須出現在同壹個句子中,但兩個詞的順序可以顛倒。
28.領域限制:基本領域限制和輔助領域限制。
29.檢索結果的調整方法:查全率和查準率。召回率:1,減少和並增加或;2.使用斷詞工具(?);3.刪除現有的字段限制和位置運算符限制。精度:1,減少同義詞或同族相關詞;2.加入限制的概念,用AND把它們連接起來;3.使用字段限制