本科《信息檢索與利用》教材配套PPT課件
本科《信息檢索與利用》教材配套PPT課件,信息檢索與利用,本科,信息,檢索,利用,教材,配套,PPT,課件
信息檢索與利用信息檢索與利用第2章 信息檢索的基本原理與方法2.12.22.3信息檢索語言信息檢索原理和手段信息檢索研究范圍與對象2.4信息檢索方法、程序、策略及效果評價學習目標了解信息檢索語言。掌握信息檢索的原理和手段。了解信息檢索的研究對象和范圍。了解信息檢索程序、策略和效果評價。第2章 信息檢索的基本原理與方法2.1 信息檢索語言 檢索語言在信息檢索中的作用2.1.1 檢索語言是根據(jù)檢索的需要而發(fā)明的一種專門的人工語言,是在文獻檢索領域中用來描述文獻特征和表達信息檢索提問的一種專用語言。檢索語言與檢索效果之間有著密切的關系,它在檢索過程中起著極其重要的作用。信息檢索的全過程包括信息的存儲過程和檢索過程。當存儲信息時,文獻標引人員首先要對各種文獻進行主題分析,通過分析選出若干能代表文獻主題的概念,并用信息檢索語言把這些概念標引出來,然后納入信息檢索系統(tǒng)中。當檢索信息時,信息檢索人員也首先要對檢索課題進行分析,并且通過分析明確其檢索范圍,選出若干能代表信息需要的概念,并把這些概念轉換成信息檢索語言,然后從信息檢索系統(tǒng)中查找用該檢索語言標引的文獻,從而找到用戶所需的信息。信息檢索語言的組成、特點和功能2.1.2信息檢索語言的組成信息檢索語言的組成1)實質(zhì)上信息檢索語言是表達、概括文獻信息內(nèi)容的概念及相互關系的概念標識系統(tǒng)。信息檢索語言是由詞匯和語法組成的。在這里詞匯指的是登錄在分類表、詞表中的全部標識,一個標識(分類號、檢索詞、代碼)就是它的一個語詞,而分類表及詞表則是它的詞典;語法是指如何創(chuàng)造和運用那些標識(單個標識或幾個標識的組合)來正確表達文獻內(nèi)容和信息需要,以有效地實現(xiàn)信息檢索的一整套規(guī)則。2.1 信息檢索語言信息檢索語言的特點信息檢索語言的特點2)檢索語言不同于自然語言,它所表述的概念只有一種解釋,不允許一詞多義、多詞一義,而使概念的表述模棱兩可。檢索語言的這種單一性保證了表述概念的唯一性和標引與檢索的一致性,從而使信息檢索人員全面、準確、快速地檢索到含有所需信息的文獻。2.1 信息檢索語言信息檢索語言的功能信息檢索語言的功能3)通過檢索語言標引文獻的主題概念,不僅能簡明地提示文獻包含的信息內(nèi)容及其外表特征,而且還能將同一主題概念的文獻集中在一起,使文獻的存儲集中化、系統(tǒng)化、組織化,便于進行有規(guī)律的檢索。2.1 信息檢索語言 檢索語言的分類2.1.3 體系分類語言體系分類語言1)(1)(1)體系分類語言的定義體系分類語言的定義 體系分類語言是一種直接體現(xiàn)知識分類的等級結構的標識系統(tǒng)。它根據(jù)一定的觀點,以科學分類為基礎,以文獻內(nèi)容的科學性質(zhì)為對象,運用概念劃分與概括的方法,按照知識門類的邏輯次序,從一般到具體,從簡單到復雜,進行層層劃分,每劃分一次就產(chǎn)生許多類目,逐級劃分就產(chǎn)生許多不同級別的類目。2.1 信息檢索語言(2)(2)體系分類語言的特點體系分類語言的特點 體系分類法具有按學科或?qū)I(yè)集中地、系統(tǒng)地提示文獻信息內(nèi)容的功能,有利于從學科或?qū)I(yè)角度進行全面的檢索。體系分類法按結構逐級劃分,具有等級結構,便于擴檢和縮檢。體系分類法用分類號作為檢索標識,不能直接表達概念;檢索時,首先要將檢索的主題內(nèi)容轉換為分類號,然后進行檢索。2.1 信息檢索語言 分類法不宜經(jīng)常修訂,列舉在分類表中的類目不能隨時改變,因而分類法不能及時反映新的科學技術。分類法是按直線或序列編制類目,遇到跨學科的課題時,與課題相關的文獻只能標引在一門學科的類目之下,因此檢索時可能漏檢。體系分類語言是一種先組式檢索語言,因此,不能按檢索課題的需要進行組配檢索。2.1 信息檢索語言 標題詞語言標題詞語言2)(1)(1)標題詞語言的定義標題詞語言的定義 標題詞語言是規(guī)范化了的自然語言。它以經(jīng)過標準化處理的名詞術語作為標識,來直接表達文獻所論及或涉及的事物之間的相互關系(這種關系是借助于參照系統(tǒng)來間接顯示的)。2.1 信息檢索語言(2)(2)標題詞語言的結構及類型標題詞語言的結構及類型副標題。說明語。主標題。標題詞語言結構2.1 信息檢索語言混合標題單級標題帶說明語的單級標題多級標題倒置標題帶限定詞的標題標題詞語言類型2.1 信息檢索語言(3)(3)標題詞的書寫格式標題詞的書寫格式正序式。倒序式。并列式。2.1 信息檢索語言(4)(4)標題詞表標題詞表 標題詞表是把標題詞按一定方式組織與展示的詞匯表。它由編制說明、主表、副表3部分組成。2.1 信息檢索語言(5)(5)標題詞語言的特點標題詞語言的特點標題詞在詞表中按字順排列,無字級性。標題詞語言標引文獻,是以事物為中心,從有關該事物出發(fā)便于進行特性檢索。標題詞語言只能通過參照系統(tǒng)進行擴檢和縮檢,因此,查全率較低。2.1 信息檢索語言關鍵詞語言關鍵詞語言3)(1)(1)關鍵詞語言的定義關鍵詞語言的定義 關鍵詞語言是為適應主題目錄、主題索引編制自動化的需要而產(chǎn)生的一種主題語言型檢索語言,是文獻量迅猛增長、信息傳播速度加快的必然產(chǎn)物。關鍵詞是指在文獻的標題、摘要或正文中出現(xiàn)的,對表達文獻內(nèi)容具有實質(zhì)意義,能作為檢索入口的,起關鍵性描述作用的詞匯。關鍵詞語言,就是針對文獻中的關鍵詞選定或抽出,不做或極少做詞匯控制,按字順排列,從而提供檢索途徑的一種檢索語言。2.1 信息檢索語言(2)(2)關鍵詞語言的特點關鍵詞語言的特點 關鍵詞語言可實現(xiàn)檢索工具編制過程的計算機化,因而降低對編目人員知識和業(yè)務水平的要求,降低標引難度,節(jié)約人力。利用計算機自動標引文獻,編制關鍵詞索引非常迅速,從而大大縮短檢索刊物的報道時差。由于這些優(yōu)點,關鍵詞語言在國外被普遍應用。關鍵詞語言直接使用自然語言,因此用它作為信息檢索語言,質(zhì)量較差。2.1 信息檢索語言單元詞語言單元詞語言4)單元詞又稱為元詞,它是從文獻中抽取出來并經(jīng)過控制處理的,能表達文獻主題的最小、最基本的詞匯單位。它可以是一個單純詞,也可以是一個合成詞。這些詞具有一個共同的特點:它們在概念上不能再進一步分解,如再分解,就再也不能表達原來所代表的特定概念,從而失去檢索本意。單元詞語言就是經(jīng)過詞匯控制的,能表達文獻主題的元詞集合。元詞的靈活組配性使它處理文獻的能力很強,但在檢索中也產(chǎn)生了相當?shù)恼`檢,因此,這種語言現(xiàn)在很少用,它被敘詞語言所代替。2.1 信息檢索語言敘詞語言敘詞語言5)敘詞是經(jīng)過詞匯控制的,在標引中用來顯示文獻主題,在檢索中用來構成提問式的一種檢索詞匯。敘詞語言采用科技術語作為標識文獻主題概念的標目。敘詞語言可謂是博采各種信息檢索語言之長,吸取了多種信息檢索語言的原理和方法。敘詞語言是一種采用規(guī)范化的單詞或詞組,由標引人員或讀者自行組配,來表達文獻(或課題)主題概念的一種后組式索引語言,或者叫做后組式的檢索語言。(1)(1)敘詞語言的定義敘詞語言的定義2.1 信息檢索語言(2)(2)敘詞的組配原則敘詞的組配原則概念相交概念相交概念并列概念并列概念限定概念限定2.1 信息檢索語言圖圖2-2 2-2 概念組配示意圖概念組配示意圖2.1 信息檢索語言(3)(3)敘詞表敘詞表 主表。主表即敘詞字順表,包括全部的敘詞和非敘詞;敘詞條目下列有與該詞有關的所有上位詞、下位詞、被代替詞和相關詞,從而可以詳細了解到這類詞的組成情況,同時也可以得到相關文獻的“參見”項,以便擴大檢索,提高查全率。輔表。輔表包括敘詞等級索引、敘詞分類索引、敘詞輪排索引。敘詞等級索引按概念的等級關系排列,即將有上下從屬關系的詞按等級集中在一起,這樣的一組詞稱為詞族,最上位的一級詞稱為族首詞,全部款目按族首詞的字順排列。2.1 信息檢索語言(4)(4)敘詞語言的特點敘詞語言的特點 敘詞語言有一套較完整的參照系統(tǒng),能顯示敘詞之間的相互關系,可供擴檢或縮檢用。利用敘詞的詞族索引和范疇索引,還可以按學科分類進行族性檢索。敘詞語言直接用敘詞作為檢索標識,不必轉換,具有語言的直接性。敘詞語言是后組式檢索語言 敘詞表的等級結構,便于增刪、修訂敘詞??茖W技術有了新的進展,增添相應的敘詞后,就能標引和檢索這些新科技的文獻。2.1 信息檢索語言2.2 信息檢索原理和手段 信息檢索原理與類型2.2.1信息檢索原理信息檢索原理1)人類的信息檢索行為總是從特定的信息需求開始,并在特定環(huán)境和信息檢索系統(tǒng)中完成,這里所說的環(huán)境包括產(chǎn)生需求的環(huán)境、信息檢索系統(tǒng)的運行環(huán)境和其他制約因素。廣義的信息檢索包括信息的存儲和檢索兩個過程。信息的存儲就是將搜索到的一次信息,經(jīng)過著錄其特征(如題名、著者、主題詞、分類號等)而形成款目,并將這些款目組織起來成為二次信息的過程。信息的檢索是針對已存儲好的二次信息庫進行的,是存儲的逆過程。存儲是為了檢索,而為了快速而有效的檢索,就必須存儲。沒有存儲,檢索就無從談起。這是存儲與檢索相輔相成、相互依存的辯證關系。信息檢索類型信息檢索類型2)(1)(1)依檢索內(nèi)容劃分依檢索內(nèi)容劃分數(shù)據(jù)信息檢索事實信息檢索文獻信息檢索2.2 信息檢索原理和手段(2)(2)按照信息存儲和檢索的方式和技術劃分按照信息存儲和檢索的方式和技術劃分 手工檢索。手工檢索是指人們通過手工的方式來存儲和檢索信息。計算機檢索。計算機檢索是指人們利用數(shù)據(jù)庫、計算機軟件技術、計算機網(wǎng)絡以及通信系統(tǒng)進行的信息存儲和檢索,其檢索過程是在人機協(xié)同作用下完成的。2.2 信息檢索原理和手段 信息檢索手段2.2.2 傳統(tǒng)信息檢索傳統(tǒng)信息檢索1)優(yōu)點可以參閱檢索工具中的附圖??蓪Σ煌臋z索工具同時進行對比,從而提高檢索質(zhì)量。在檢索過程中可以隨時獲取反饋信息,及時調(diào)整檢索策略。檢索條件簡單,成本低。2.2 信息檢索原理和手段缺點手工檢索工具提供的檢索點有限,很難進行多元檢索。速度慢、效率低,檢出的文獻款目必須抄錄。難以找到涉及幾個概念組合的多主題的文獻。2.2 信息檢索原理和手段現(xiàn)代信息檢索現(xiàn)代信息檢索2)(1)單機檢索。單機檢索是計算機檢索的最初形式,隨著計算機存儲介質(zhì)的發(fā)展變化,也在不斷發(fā)生變化。目前主要有計算機磁盤檢索、計算機磁帶檢索和計算機光盤檢索3種形式。(2)網(wǎng)絡檢索。網(wǎng)絡檢索是近十幾年發(fā)展起來的,它目前主要有圖書館局域網(wǎng)的檢索、聯(lián)機檢索及Internet信息檢索3種形式。2.2 信息檢索原理和手段傳統(tǒng)信息檢索與現(xiàn)代信息檢索的比較傳統(tǒng)信息檢索與現(xiàn)代信息檢索的比較3)(1)檢索語言方面(2)概念的組配方面(3)檢索入口方面 (4)檢索 結果方面2.2 信息檢索原理和手段2.3 信息檢索研究范圍與對象 信息檢索的研究范圍2.3.1 信息檢索的研究范圍包括一切與信息存儲與檢索有關的系統(tǒng)、過程、理論和方法。一切可供存儲和檢索利用的信息類型,如文獻、數(shù)據(jù)、事實、知識、聲音、圖形等;各種信息檢索系統(tǒng)及其運行過程,如信息采集、標引、組織、存儲、處理、匹配、傳送等各種過程中使用的方法;以及在信息檢索實踐和研究的基礎上形成的各種理論和假設,均包括在這個范圍內(nèi)。信息類型側重于文獻,其次是數(shù)據(jù)和事實。信息檢索的研究對象2.3.2(1)(1)信息檢索理論信息檢索理論 它主要包括檢索語言與標引理論、信息檢索的數(shù)學模型、知識表示理論、相關性理論,以及有關的哲學問題。2.3 信息檢索研究范圍與對象(2)(2)信息檢索系統(tǒng)信息檢索系統(tǒng) 它是實現(xiàn)信息檢索的物質(zhì)基礎,是現(xiàn)實的研究對象,主要研究其結構、功能、演變,其設計開發(fā)技術、管理維護技術和評價技術,還研究它與其他信息系統(tǒng)乃至整個外部世界的關系。其中,數(shù)據(jù)庫是信息檢索系統(tǒng)的核心部分之一。數(shù)據(jù)庫的建造和維護是非常重要的信息技術。數(shù)據(jù)庫的質(zhì)量直接影響信息檢索系統(tǒng)的功能和效率。2.3 信息檢索研究范圍與對象(3)(3)計算機信息檢索計算機信息檢索 它涉及許多計算機設備、軟件技術、存儲技術革新、檢索技術、系統(tǒng)管理和經(jīng)營知識、市場營銷技術等,是一門綜合性很強的技術。2.3 信息檢索研究范圍與對象(4)(4)檢索策略與方法檢索策略與方法 它是用戶從信息檢索系統(tǒng)中獲取有關信息所必需的。好的檢索策略是檢索成功的必要前提,計算機的應用為檢索策略和方法的發(fā)展提供了有力的支持。近30年來,涌現(xiàn)了許多新穎而有效的檢索技術和方法,如布爾檢索、位置檢索、截詞檢索、加權檢索、聚類檢索等,人們利用、研究、評價和完善現(xiàn)有的各種檢索策略和方法,研究開發(fā)新的更有效的策略和方法。2.3 信息檢索研究范圍與對象(5)(5)用戶研究與培訓用戶研究與培訓 用戶是信息檢索系統(tǒng)的生命,無論是系統(tǒng)的研制開發(fā)、管理維護、功能和服務的擴展,還是系統(tǒng)評價,都離不開用戶研究工作。用戶培訓是用戶研究的繼續(xù),是與用戶建立緊密聯(lián)系和發(fā)展新用戶的一種非常有效的措施。此外,還有自動標引、自動分類和自動摘錄,以及相關設備等研究領域。2.3 信息檢索研究范圍與對象2.4 信息檢索方法、程序、策略及效果評價 信息檢索方法2.4.1 追溯法是指在沒有檢索工具的情況下,人們利用書、刊之后的引用或參考文獻查找資料的方法追溯法追溯法1)常用法這是指利用各種類型檢索工具,通過技巧查找資料的方法。常用法又可分為順查和倒查兩種。順查法:即由遠而近的查找方法。如已知某研究課題的起始年代,需要了解它的全面發(fā)展情況時,可從最初研究的年代開始,由遠及近地進行查找。倒查法:也稱為叫逆查法。和順查法相反,倒查法是由近及遠的查找方法,這種方法常用于正在研究課題的過程中。常用法常用法2)2.4 信息檢索方法、程序、策略及效果評價循環(huán)法循環(huán)法3)循環(huán)法又稱為分段法,這是前兩種方法的結合,即首先利用檢索工具查找一部分資料以后,為了了解其前因后果,再利用這部分資料的引用文繼續(xù)追查的方法,利用這種方法能夠保證所查的資料較全面、系統(tǒng)。2.4 信息檢索方法、程序、策略及效果評價 信息檢索程序2.4.2 信息檢索之際,首先要對課題進行充分的了解,掌握課題有關的基本知識,詳細摸清課題所需資料范圍及要求,以及弄清課題有關的名詞、術語等。分析課題分析課題1)2.4 信息檢索方法、程序、策略及效果評價 根據(jù)檢索人員已掌握的資料情況,確定采用何種檢索方法。如果是新立的課題,一般采用順查法和追溯法結合查找,正在進行中的課題一般用倒查法。選擇檢索方法選擇檢索方法2)2.4 信息檢索方法、程序、策略及效果評價 在檢索過程中,根據(jù)所掌握的有關課題的資料,確定檢索途徑。一般情況下,所研究的課題較專深、單一時,常用主題途徑;課題所涉及的內(nèi)容較復雜時,常用分類法。確定檢索途徑確定檢索途徑3)2.4 信息檢索方法、程序、策略及效果評價 在確定檢索途徑之后,根據(jù)檢索標識,通過有關索引進行信息檢索,查找信息線索。查找信息線索查找信息線索4)2.4 信息檢索方法、程序、策略及效果評價 通過檢索獲得信息線索后,確認有一定的參考價值,需要詳細查閱信息的全文時,即可根據(jù)文摘指出的信息出處,向有關部門索取原始信息。索取原始信息索取原始信息5)2.4 信息檢索方法、程序、策略及效果評價 檢索策略2.4.3 首先利用國內(nèi)檢索工具或用中文編輯的報道外文的檢索工具入手檢索。這樣,檢索者從自己熟悉的文字可以很容易地掌握課題的概況,并可以從中選擇出切題的關鍵詞、主題詞,為進一步查找外文檢索工具提供方便。先國內(nèi)后國外先國內(nèi)后國外1)2.4 信息檢索方法、程序、策略及效果評價 信息語言復雜多變,作者使用的語詞不盡相同,為了避免漏檢,檢索時盡量多選幾個同義詞、近義詞作為檢索詞。檢索時多選幾個同義詞、近義詞檢索時多選幾個同義詞、近義詞2)2.4 信息檢索方法、程序、策略及效果評價 當要求查全率高而不計查準率時,可利用上、下位詞進行檢索。巧妙地利用上、下位詞的關系巧妙地利用上、下位詞的關系3)2.4 信息檢索方法、程序、策略及效果評價 在檢索時,盡量從內(nèi)容上選詞,以避免有關問題因選詞不當被漏檢。盡量避免從字面出發(fā)選擇檢索詞盡量避免從字面出發(fā)選擇檢索詞4)2.4 信息檢索方法、程序、策略及效果評價 某些課題,在檢索中反復查找而沒有結論時,應考慮倒置詞序的可能。檢索詞序的準確與否是檢索成敗的關鍵。變換檢索詞的詞序變換檢索詞的詞序5)2.4 信息檢索方法、程序、策略及效果評價 檢索工具中的參見(see also)項,把內(nèi)容有關的主題聯(lián)為一體,以便族性檢索。例如,CA中每一大類末尾均列有與該類有關的全部相關大類和具體相關文摘。絕大多數(shù)檢索工具中的主題詞表、主題索引或文摘部分中均沒有參見項,檢索時分別查找各有關的標題,以獲取某一課題的全部信息。利用參見系統(tǒng),擴大檢索范圍利用參見系統(tǒng),擴大檢索范圍6)2.4 信息檢索方法、程序、策略及效果評價 要想把各種索引配合使用,首先熟悉各種索引的結構、特點、款目內(nèi)容及其功能。例如,CA中的化學物質(zhì)索引與分子式索引、登記號索引、環(huán)系索引、雜原子索引關系十分密切。如果從化合物登記號索引入手檢索,只能獲得化合物的名稱與分子式而查不出文摘號,必須轉查化學物質(zhì)索引才能獲得信息線索。又例如,對商品名稱與俗稱,必須首先查索引指南。類似的情況在檢索時常常遇到,只有熟練掌握各種檢索工具的結構體例、編排特征、各索引款目結構及其相互關系,檢索起來才能得心應手,取得滿意的效果。各種索引配合使用各種索引配合使用7)2.4 信息檢索方法、程序、策略及效果評價 檢索結果的評價方法2.4.4查全率是對所需信息被檢出程度的量度。查全率查全率1)2.4 信息檢索方法、程序、策略及效果評價 查準率是衡量檢索系統(tǒng)拒絕非相關信息的能力。查全率和查準率均可以用公式來表示:查全率(R)=aa+c100%查準率(P)=aa+b100%式中,a表示被檢出的相關信息,b表示被檢出的非相關信息,c表示未檢出的相關信息。除此之外,c/(a+c)100%為漏檢率,是查全率的補數(shù);b/(a+b)100%為誤檢率,是查準率的補數(shù)。一般來說,查準率與查全率之間存在反變關系。當某一課題的查全率與查準率處于某一比例關系時,繼續(xù)提高查全率,查準率會降低。查準率查準率2)2.4 信息檢索方法、程序、策略及效果評價 相關性是用戶判斷信息與信息需求之間關系的標準。信息系統(tǒng)回答的不是用戶提問本身,而是檢索式表達的信息提問。因此,檢出的是與信息提問相關的信息,但不一定是對用戶切題的信息。相關性相關性3)2.4 信息檢索方法、程序、策略及效果評價謝謝觀看!
收藏
編號:65494732
類型:共享資源
大小:11.41MB
格式:ZIP
上傳時間:2022-03-24
35
積分
- 關 鍵 詞:
-
信息檢索與利用
本科
信息
檢索
利用
教材
配套
PPT
課件
- 資源描述:
-
本科《信息檢索與利用》教材配套PPT課件,信息檢索與利用,本科,信息,檢索,利用,教材,配套,PPT,課件
展開閱讀全文
- 溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
裝配圖網(wǎng)所有資源均是用戶自行上傳分享,僅供網(wǎng)友學習交流,未經(jīng)上傳用戶書面授權,請勿作他用。