查全率的局限性:查全率的局限性主要在於它是檢索到的相關信息與檢索系統中存儲的所有相關信息的比值,但系統中有多少相關信息壹般是未知的,只能估計。
此外,召回率或多或少受到“假設”的限制,即檢索到的相關信息對用戶具有相同的價值,但事實並非如此。對於用戶來說,信息的相關性在某種意義上比它的數量重要得多。
召回率的評估至少包括:
(1)在初步調查結束時。初次檢索完成後,必須對專利文獻數據庫初次檢索的查全率進行評估,這是表明檢索能否完成的依據。如果此時召回率不理想(比如低於50%),就需要繼續召回工作,否則,如果達到預期召回率,就可以結束召回工作。
(2)在去噪過程結束時。去噪過程也稱“精確”過程,是將與分析主題無關的專利文獻從搜索數據庫中剔除的過程。在這個過程中,生效的單據不可避免地會被誤刪。為了檢查去噪過程中是否誤刪了過多的有效文檔,必須在工作結束時對去噪後的專利文檔召回率進行評估。