Internet信息資源及其檢索.ppt
《Internet信息資源及其檢索.ppt》由會員分享,可在線閱讀,更多相關《Internet信息資源及其檢索.ppt(69頁珍藏版)》請在裝配圖網上搜索。
第三章Internet信息資源及其檢索,,第一節(jié)Internet信息資源檢索,一、Internet信息資源信息源豐富信息內容多樣性信息表現(xiàn)形式多樣化信息時效性信息交互性信息關聯(lián)性信息開放性免費信息資源豐富信息組織的局部有序性與整體無序性,二、Internet信息資源種類1、按信息來源劃分政府信息資源,公眾信息資源,商用信息資源2、按信息時效劃分電子郵件型信息資源,圖書館目錄資源,書目與索引資源,全文資料及電子出版物資源,數(shù)據庫信息資源,3、按所采用的網絡傳輸協(xié)議可分為:,WWW網絡資源:因特網信息資源的主流,它使用http協(xié)議,使用簡單,功能強大,能方便迅速的瀏覽和傳遞分布于網絡各處的文字、圖象、聲音和多媒體超文本信息。FTP信息資源:它使用ftp協(xié)議,該協(xié)議主要用于連網計算機之間傳輸文件。FTP相當于在網絡上兩個主機之間復制文件。目前仍是發(fā)布、傳遞軟件和文件的主要方法。TELNET信息資源:telnet是遠程登陸協(xié)議。telnet信息資源包括硬件資源和軟件資源。許多機構都提供遠程登錄的信息系統(tǒng),如圖書館的公共目錄系統(tǒng),信息服務機構的綜合信息系統(tǒng)等。用戶服務組資源:包括新聞組,電子郵件組等。這些電子通信組形式所傳遞和交流的信息資源是網絡上最自由、最具有開放性的資源。news,第二節(jié)搜索引擎及其使用,搜索引擎(searchengines)是www環(huán)境下一種信息檢索的工具。它利用某種軟件(如網絡“蜘蛛”spiders)對互聯(lián)網上的信息進行自動跟蹤和發(fā)掘,把收集到的所有網頁進行分類存儲和標引,并向用戶提供查詢入口。用戶通過這個查詢入口在浩如煙海的信息海洋中找到自己所需的信息。,搜索引擎主要任務,?信息搜集?信息處理?信息查詢,搜索引擎分類,1、目錄式搜索引擎2、搜索式搜索引擎(1)綜合搜索引擎(2)專業(yè)搜索引擎3、元搜索引擎,目錄式,目錄式搜索引擎是指把因特網中的資源服務器的地址收集起來,由其提供的資源的類型不同而分成不同的目錄,再一層層地進行分類,形成可供瀏覽的樹狀結構,類似圖書館的分類主題目錄,用戶可以不進行關鍵詞查詢,通過層層點擊瀏覽也可以找到所需要的信息。目錄索引類搜索引擎以Yahoo雅虎為代表,國內還有搜狐、新浪、網易等,國外有OpenDirectoryProject(DMOZ)、LookSmart、About等。其特點是由于加入了人的智能,所以信息準確、查準率高,但是搜索范圍較小,查全率低,在檢索學科專業(yè)屬性特征明顯的信息時利用這種方式極為方便,但搜索引擎信息歸類的質量和用戶對信息類別了解程度將直接影響到查詢結果。,,搜索(網頁)型,搜索(網頁)型搜索引擎是最常見的。指能夠對各網站的每個網頁中的每個詞進行搜索的引擎,使用關鍵詞(Keywords)匹配方式檢索。用戶使用關鍵詞對網頁進行搜索時,系統(tǒng)通過蜘蛛機器人自動在選定范圍內進行檢索,并將所檢索到的信息自動標引導入索引數(shù)據庫中,匹配所檢索中的網頁,并輸出匹配結果。有代表性的如Google、百度、AltaVista、AllTheWeb等。,搜索引擎:水平門戶_綜合搜索引擎[中文],中文常用搜索引擎百度中文搜索引擎:,搜索引擎:水平門戶_綜合搜索引擎[英文],國外英文常用搜索引擎Google—以搜索精度高、速度快成為最受歡迎的搜索引擎,是目前搜索界的領軍人物。Fast/AllTheWeb—總部位于挪威的搜索引擎后起之秀,風頭直逼google。AltaVista—曾經的搜索引擎巨人,目前仍被認為是最好的搜索引擎之一。Overture—最著名的搜索引擎廣告商,競價排名的始作俑者,也是全文搜索引擎。Lycos—發(fā)源于西班牙的搜索引擎,網絡遍布世界各地。HotBot—隸屬于LycosNetworks,搜索結果來自其他搜索引擎及目錄索引。,搜索引擎:垂直搜索引擎——專業(yè)搜索引擎,垂直搜索引擎:即專業(yè)或專用搜索引擎,它專門用來檢索某一主題范圍或某一類型信息,追求專業(yè)性與服務深度是它的特點。垂直搜索引擎不但可保證此領域信息的收錄齊全與更新及時,而且檢索深度和分類細化遠遠優(yōu)于綜合搜索引擎。垂直搜索引擎的檢出結果雖可能較綜合搜索引擎少,但檢出結果重復率低、相關性強、查準率高,適合于滿足較具體的、針對性強的檢索要求。目前已經涉及到購物,旅游,汽車,工作,房產,交友等行業(yè)。,垂直搜索引擎舉例:1,找工作的搜索引擎:google學術搜索:google圖書搜索:比價購物搜索引擎:博客與RSS搜索引擎:人脈搜索引擎:論壇搜索引擎:,垂直搜索引擎舉例:2,TheMusicFinderhttp://www.music-Singingfish(只能搜尋聲音和錄像)旅行TripAdvisor圖像搜索引擎:Business生意定向搜索引擎。DailyStocks可以了解被查詢公司存貨的信息已經相關的新聞報導,研究,引述和其他數(shù)據。FMLX英國定向的關于公司,存貨數(shù)據,分析和研究的搜索引擎。eBizSearchhttp://www.ebizsearch.org關于電子商務的文章和報告。,RSS源[RSSfeed]搜索引擎,單個站點:新華網:八方搜索引擎博客中國看天下看天下搜索引擎:RSSSearchEngine周博通RSS導航,綜合搜索引擎的專門化趨勢:,GOOGLE學術搜索:AllTheWeb[能專門對圖像、多媒體信息。]搜狗(Sogou)[人物、音樂、購物、圖片、地圖],FTP資源搜索引擎,天網星空搜索,郵件列表搜索引擎,萬維網聯(lián)盟郵件列表檢索服務http://www.w3.org/search/mail/publicCatalist,BT搜索引擎,BT特工,元搜索引擎(MetaSearchEngine),這類搜索引擎沒有自己的索引數(shù)據,它將用戶的查詢請求同時向多個搜索引擎遞交,將返回的結果進行重復排除、重新排序等處理后,作為自己的結果返回給用戶。如萬緯搜索、Search、Dogpile等優(yōu)點:能同時搜索多個搜索引擎,能在一定程度上提高查詢的廣度。缺點:因為有時候并不能對一個搜索引擎全部查完,有時后也會漏掉一些重要信息。,早期的中文元搜索引擎1、metaFisher中文元搜索引擎2、萬緯搜索3、多元搜索1、一家搜2、bbmao是國內唯一具有自動聚類功能的元搜索引擎,技術和功能上都比較強3、狠搜,更多元搜索引擎(英文),MetaCrawler()Profusion()Mamma()Dogpile()Vivisimo()Search(,,,,常用的一些搜索引擎網址(一),雅虎是中國最著名的目錄索引,是搜索引擎開山鼻祖之一。它收錄了全球資訊網上數(shù)以萬計的中文網站,不論你要找的網站是用國標碼簡體字、大五碼繁體字還是圖形中文,都可以在這里找到。1999年9月,?檢索途徑通過分類目錄、關鍵詞檢索?檢索方法與技巧支持布爾邏輯檢索(不支持“OR”)、可以使用引號,強調“+”、“-”、指定關鍵字出現(xiàn)的段落(加t:、加u:),?檢索結果根據關聯(lián)程度排序同時列出“相關。。?!?其它與Google合作,常用的一些搜索引擎網址(二),1998年創(chuàng)立,搜狐“分類與搜索”已收錄網站四十多萬,已形成龐大的中文網站數(shù)據庫。搜狐的目錄導航式搜索引擎完全是由人工加工而成,相比機器人加工的搜索引擎來講具有很高的精確性、系統(tǒng)性和科學性。,?檢索途徑通過分類目錄、關鍵詞檢索?檢索方法與技巧支持布爾邏輯檢索、“-”、“&”、“/”、“()”、空格,?檢索結果根據關聯(lián)程度排序返回五種分類結果?其它直通車搜狐黃頁,常用的一些搜索引擎網址(三),1997年,(簡體中文)提供有類目檢索和網站檢索兩種方式。支持AND和“-”等條件查詢。以搜索精度高、速度快成為最受歡迎的搜索引索,是目前搜索的領軍人物。,?檢索方法與技巧模塊分類、關鍵詞檢索支持布爾邏輯檢索(自動添加AND),“OR”,“-”,?檢索特色網頁快照、手氣不錯相似網頁、查詢電話號碼、查找PDF文件、股票報價、查找字典釋意、用Google查找地圖、工具條服務、網頁翻譯、單詞糾錯、繁簡轉換使用偏好,Google搜索高級語法,基本:Booleanoperator(AND、OR、NOT)高級:“…”define:site:filetype:inurl:intitle:fy罕用:info:link:related:cache:,Booleanoperator,AANDB:,Booleanoperator,AORB:,,,Booleanoperator,ANOTB:,語法“…”全文搜索,,,語法define:——定義,語法filetype:——查特定文件類型,.ppt.pdf.ps.doc.txt.xls,.swf.rtf.lwp.mw.wri.ans.wdb,,,語法site:(指定網域查找),.org,.aero.biz.coop.info.museum.name.pro,,,語法fy——中英文詞典翻譯,語法“l(fā)ink:”(友情鏈接),語法inurl:intitle:,網址中搜索網頁標題中搜索,語法Info:(查詢與某鏈接相關信息),語法“cache:”——查緩存頁面,用來搜索google服務器上某頁面的緩存,通常用于查找某些已經被刪除的死鏈接網頁,相當于使用普通搜索結果頁面中的“網頁快照”功能。示例:查找google緩存的中文yahoo首頁搜索:“cache:”,?檢索方法與技巧模塊分類、關鍵詞檢索要求“一字不差”,支持布爾邏輯檢索(可以用空格代替AND/+)可以使用檢索語法,?檢索特色百度快照、自動糾錯、百度搜霸使用偏好,百度與google比較,搜索英文不必說用google,搜索中文呢?很多人并不了解它們更新的情況,google發(fā)展早,因而它貯存了大量舊的信息,百度發(fā)展遲,信息較新。更新速度:對中文google一般半月至一月一更新,而且僅搜索到三級鏈接,三級以下便不在搜索,那么我如何看到最新的google搜索的結果呢?這個站點:,百度和google語法的應用,找特定文件名的文件,尤其是PDF、ZIP、swf、DOC、TXT、RAR、EXE、RM、Mp3,MOV,PPT這些文件名都是網友想找的重點,至于各是什么類型文件,請上網查一下便知道了,這里不多說了。尤其老板讓你做個powerpoint,找不到圖怎么辦?用google去搜索。,方法是利用語法filetype:后綴名。如找PDF文件,在正常關鍵詞后面加filetype:PDF即可,搜索結果全是PDF文件。找特定題目的網頁語法intitle:網站查找友情鏈接:"link:"(英文單字link后加冒號)用于搜索鏈接到某個URL地址的網頁??梢粤私庥心男┚W頁把鏈接指向您的網頁。,基本搜索語法——查找文件,查找特定站點:site:www.*.com如釣魚島site:但不可加入http://或/這類,否則是錯的。查找美國教育網上的宇宙大爆炸jpg圖片搜索:“BIGBANGfiletype:jpgsite:edu”結果:搜索有關BIGBANGfiletype:jpgsite:edu的圖片,基本搜索語法——查找站點,Site可將搜索定位于某一個域名上,有利于縮小搜索范圍,提高搜索效率。如keywordssite:edu,效果很好!可以方便地搜索到各大學內有用的資源。site:tw,site:edu.tw,site:.......這是定位于國家或地區(qū),將搜索局限于某些國家或地區(qū),或加上edu,則是這些國家或地區(qū)的大學,效果自然更好。如果site:則搜索國內醫(yī)科大學內的資源(會漏綜合性大學的資源的,要慎用)。,特殊語法:inurl,“inurl”語法返回的網頁鏈接中包含第一個關鍵字,后面的關鍵字則出現(xiàn)在鏈接中或者網頁文檔中。有很多網站把某一類具有相同屬性的資源名稱顯示在目錄名稱或者網頁名稱中,比如“MP3”、“GALLERY”等,于是,就可以用INURL語法找到這些相關資源鏈接,然后,用第二個關鍵詞確定是否有某項具體資料。,INURL語法和基本搜索語法的最大區(qū)別在于,前者通常能提供非常精確的專題資料。示例:查找MIDI曲“滄海一聲笑”。搜索:“inurl:midi滄海一聲笑”結果:已搜索有關inurl:midi滄海一聲笑的中文(簡體)網頁。,注意:“inurl:”后面不能有空格,GOOGLE也不對URL符號如“/”進行搜索。例如,GOOGLE會把“cgi-bin/phf”中的“/”當成空格處理。,google其它功能——查縮略詞的全稱,利用google查縮略詞的全稱,如果寫作時突然忘了某個縮略詞的全稱,當時手頭若有金山詞霸等軟件則是易事,若無可考慮使用google,將其中文名與其縮略名作為關鍵詞搜索,效果很好,如:不知道血管活性腸肽(VIP)的全稱,可在google中輸入血管活性腸肽VIP,google其它功能——查英文單詞的中文名稱,google是最全的英中詞典,你找到一個英文詞,卻不知中文怎么辦?用google,寫出英文詞,然后大概了解一下這個詞屬于哪一個學科,再用加用一個中文關鍵詞搜索一下,效果很好。如urotensin不知道中文意思,但知道它是收縮血管的藥物,這時用urotensin血管收縮查一下,可能會出現(xiàn)一些文章或綜述內,其中便附有這個詞的中文了,google其它功能——搜索電話,如果想知道某個公司的電話,往往許多人喜歡這樣選關鍵詞:公司名稱tel,結果得到的根本不是你需要的。如果你知道這個公司的性質或屬于什么地方的,則可以這樣搜索:區(qū)號公司名,這比上述關鍵詞要有效得多,這也涉及到搜索效率的問題。,搜索引擎的查詢技巧,?分析研究對象,選用搜索引擎?確定搜索途徑,使用不同方式?正確選用搜索引擎的搜索選項?正確選用搜索引擎的各項搜索功能,?根據反饋,修改檢索1、縮小搜索范圍:利用二次搜索(重新查詢、在結果中再查、在結果中去除)、使用檢索語法構造恰當?shù)臋z索表達式、選用正確的關鍵詞2、擴大搜索范圍:使用同義詞或近義詞、使用檢索語法or和截詞檢索、使用多個搜索引擎和元搜索引擎,如何提高查全率?,選擇上位詞和相關詞;如:查找關于孫中山的文獻,先用孫中山查,再用孫文、國父查找。調節(jié)檢索式的網羅度,刪除不必要的組面,如and(并且);進行族性檢索(分類檢索或用or連接相關檢索詞);截詞檢索;com*代替computer增加檢索途徑。,如何提高查準率?,提高專指度(用下位詞或換專指性強的自由詞)用邏輯乘“*”(and)或not相關檢索項;如查找克林頓,但不要關于萊溫斯基的信息。檢索式:克林頓not萊溫斯基用文獻外部特征限制輸出結果(在中文圖書中查找);用“二次檢索”、“條件檢索”排除誤檢;限制檢索字段,指定鄰接和優(yōu)先關系。,,,- 配套講稿:
如PPT文件的首頁顯示word圖標,表示該PPT已包含配套word講稿。雙擊word圖標可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設計者僅對作品中獨創(chuàng)性部分享有著作權。
- 關 鍵 詞:
- Internet 信息資源 及其 檢索
裝配圖網所有資源均是用戶自行上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作他用。
鏈接地址:http://www.hcyjhs8.com/p-11496642.html