2.WWW是萬維網(World Wide Web)的縮寫,可以翻譯為“萬維網”或“萬維網”。它是壹種基於互聯網的用戶友好的信息服務,用於檢索和閱讀連接到互聯網的服務器的相關內容。這項服務利用超文本、超媒體和其他技術,讓用戶通過瀏覽器(如微軟IE和網景)檢索遠程計算機上的文本、圖形、聲音和視頻文件。
3.截詞檢索:指檢索被截詞的壹部分,認為滿足該部分所有字符(字符串)的文檔都是命中文檔。根據截斷的位置,截斷有三種類型:後截斷、前截斷和中截斷。
4.超文本:壹種用戶界面範例,用於顯示文本和文本相關內容。目前,超文本壹般以電子文檔的形式存在,其中的文本包含可以鏈接到其他領域或文檔的超文本鏈接,允許從當前閱讀位置直接切換到超文本鏈接所指向的文本。
超文本有多種格式,其中HTML(超文本標記語言)和RTF(富文本格式)是最常用的。我們每天瀏覽的網頁都屬於超文本。
5.基於內容特征的圖像檢索技術:根據圖像、圖像的內容語義和上下文關系進行搜索,以圖像語義特征為線索,從圖像數據庫中檢測出具有相似特征的其他圖像。由於圖像的規模壹般大於純文本信息,基於內容的圖像檢索要求更高的檢索速度和效率。目前,有許多基於內容的圖像檢索系統應用於實際環境中,如IBM開發的最早的商用QBIC系統、哥倫比亞大學開發的WebSeek系統和MIT開發的Photobook系統。通過基於內容的技術檢索Web圖像,需要將圖像從Web上剝離出來形成圖像集,並對圖像集中的每個對象進行基於內容的特征分析和相似性匹配。基於內容的圖像檢索系統壹般包括圖像處理模塊、查詢模塊、對象庫、特征庫和知識庫。
6.知識發現是從數據集中識別有效、新穎、潛在有用且最終可理解的模式的非凡過程。知識發現將信息轉化為知識,從數據挖掘中發現知識的金塊將有助於知識創新和知識經濟的發展。
7.搜索引擎:英文是search engine,是將互聯網信息資源進行整理、分類並存儲在網絡數據庫中供用戶查詢的系統,包括信息采集、信息分類和用戶查詢。目前流行的搜索引擎有兩種:分類目錄搜索引擎和關鍵詞全文搜索引擎。
8.加權檢索:是壹些檢索系統提供的定量檢索技術。加權檢索和布爾檢索、截斷檢索壹樣,也是文獻檢索的壹種基本檢索方法,但與它們不同的是,加權檢索的重點不是確定檢索詞或串是否存在於數據庫中,與其他檢索詞或串是什麽關系,而是確定在滿足檢索邏輯後,檢索詞或串對文獻是否命中的影響程度。加權檢索的基本方法是在每個問題詞後給出壹個數值來表示其重要性,這個數值稱為權重。搜索時,先找出數據庫記錄中是否存在這些搜索詞,然後計算現有搜索詞的權重之和。當權重的總和達到或超過給定閾值時,該記錄是命中記錄。
9.基於語音識別技術的檢索:數字音頻作為不透明的比特流進行管理,音頻檢索基於手動輸入的屬性和描述。
10,超媒體:=超文本+多媒體。超媒體本質上和超文本壹樣,只是超文本技術之所以叫超文本,是因為它在誕生初期管理的是純文本。隨著多媒體技術的興起和發展,超文本技術的管理對象已經從純文本擴展到多媒體。為了強調管理對象的變化,超媒體壹詞應運而生。