2020年計(jì)算機(jī)三級(jí)考試網(wǎng)絡(luò)技術(shù)備考要點(diǎn):搜索引擎的原理和組成
時(shí)間:2020-03-19 11:14:00 來(lái)源:無(wú)憂(yōu)考網(wǎng) [字體:小 中 大]
2020年計(jì)算機(jī)三級(jí)考試網(wǎng)絡(luò)技術(shù)備考要點(diǎn):搜索引擎的原理和組成
(1)搜索引擎的原理
搜索引擎的原理起源于傳統(tǒng)的信息全文檢索理論,即計(jì)算機(jī)程序通過(guò)掃描一篇文章中的所有詞,建立以詞為單位的排序文件,檢索程序根據(jù)檢索詞在每篇文章中出現(xiàn)的頻率和概率,對(duì)包含這些檢索詞的文章排序,后輸出排序結(jié)果。
(2)全文搜索引擎功能模塊的組成
現(xiàn)在的全文搜索引擎一般由搜索器、索引器、檢索器和用戶(hù)接口4個(gè)部分組成。
①搜索器。搜索器也稱(chēng)為“蜘蛛”、“機(jī)器人”或“爬蟲(chóng)”,實(shí)際上是一種基于Web的程序。搜索器在Internet上逐個(gè)訪問(wèn)服務(wù)器來(lái)收集信息,它通過(guò)請(qǐng)求Web站點(diǎn)上的HTML網(wǎng)頁(yè)來(lái)采集該HTML網(wǎng)頁(yè),并建立一個(gè)網(wǎng)站的關(guān)鍵字列表。搜索器建立關(guān)鍵字列表的過(guò)程稱(chēng)為網(wǎng)絡(luò)爬行。
、谒饕。索引器的功能是理解搜索器所搜索的信息,從中抽取出索引項(xiàng),用于表示文檔以及生成文檔庫(kù)的索引表。索引器可使用集中式索引算法或分布式索引算法。索引算法對(duì)索引器的性能有很大的影響。一個(gè)搜索引擎的有效性在很大程度上取決于索引的質(zhì)量。
、蹤z索器。檢索器的功能是根據(jù)用戶(hù)查詢(xún)?cè)谒饕龓?kù)中快速地檢索出文檔,進(jìn)行文檔與查詢(xún)的相關(guān)度評(píng)價(jià),對(duì)將要輸出的結(jié)果進(jìn)行排序,并實(shí)現(xiàn)某種用戶(hù)相關(guān)性的反饋機(jī)制。網(wǎng)頁(yè)檢索器是一個(gè)在Web服務(wù)器上運(yùn)行的CGI(公共網(wǎng)關(guān)接口)程序。
、苡脩(hù)接口。用戶(hù)接口的作用是輸入用戶(hù)查詢(xún),顯示查詢(xún)結(jié)果,提供用戶(hù)相關(guān)性反饋機(jī)制。用戶(hù)接口可以分為簡(jiǎn)單接口和復(fù)雜接口兩種。
(3)目錄導(dǎo)航式搜索引擎和網(wǎng)頁(yè)搜索引擎的組成
目錄導(dǎo)航式搜索引擎的信息搜集系統(tǒng)主要由人工完成,搜索引擎的標(biāo)引專(zhuān)家依靠手工來(lái)搜尋不斷出現(xiàn)的新網(wǎng)站,給每個(gè)網(wǎng)站一個(gè)標(biāo)題和大概描述,將其放入相應(yīng)的類(lèi)目體系中。在頁(yè)面上體現(xiàn)為每個(gè)類(lèi)目路徑下排列著的相關(guān)網(wǎng)站,所以也稱(chēng)為目錄導(dǎo)航。目錄導(dǎo)航式搜索引擎提供兩種查詢(xún)接口形式:一種是直接單擊目錄樹(shù),另一種是關(guān)鍵字檢索。
- 2009年9月全國(guó)計(jì)算機(jī)四級(jí)數(shù)據(jù)庫(kù)工程師考試真題及答案
- 2009年3月全國(guó)計(jì)算機(jī)四級(jí)數(shù)據(jù)庫(kù)工程師考試真題及答案
- 2008年9月全國(guó)計(jì)算機(jī)四級(jí)數(shù)據(jù)庫(kù)工程師考試真題及答案
- 2008年4月全國(guó)計(jì)算機(jī)四級(jí)數(shù)據(jù)庫(kù)工程師考試真題及答案
- 2011年3月全國(guó)計(jì)算機(jī)二級(jí)Java考試真題及答案
- 2010年9月全國(guó)計(jì)算機(jī)二級(jí)Java考試真題及答案
- 查看計(jì)算機(jī)等級(jí)考試全部真題>>
- 2023年下半年計(jì)算機(jī)等級(jí)考試四級(jí)計(jì)算機(jī)組成與接口備考要點(diǎn)歸納
- 2023年下半年計(jì)算機(jī)等級(jí)考試三級(jí)信息安全技術(shù)復(fù)習(xí)要點(diǎn)匯總
- 2023年下半年計(jì)算機(jī)等級(jí)考試三級(jí)數(shù)據(jù)庫(kù)技術(shù)復(fù)習(xí)要點(diǎn)匯總
- 2023年下半年計(jì)算機(jī)等級(jí)一級(jí)考試Photoshop考點(diǎn)梳理
- 2023年下半年計(jì)算機(jī)等級(jí)考試三級(jí)網(wǎng)絡(luò)技術(shù)考點(diǎn)梳理
- 2023年下半年計(jì)算機(jī)等級(jí)一級(jí)考試WPS office考點(diǎn)匯總
- 查看計(jì)算機(jī)等級(jí)考試全部文檔 >>
- 2024年9月上海計(jì)算機(jī)一級(jí)成績(jī)查詢(xún)時(shí)間及查分入口
- 2024年9月全國(guó)計(jì)算機(jī)一級(jí)成績(jī)查詢(xún)時(shí)間及查分入口
- 2024年9月全國(guó)計(jì)算機(jī)一級(jí)考試成績(jī)查詢(xún)?nèi)肟冢ㄒ验_(kāi)
- 2024年9月浙江省全國(guó)計(jì)算機(jī)等級(jí)考試(NCRE)
- 2024年9月浙江計(jì)算機(jī)二級(jí)考試準(zhǔn)考證打印入口(9
- 2024年9月江蘇計(jì)算機(jī)一級(jí)成績(jī)查詢(xún)時(shí)間及查分入口
- 2024年9月江蘇計(jì)算機(jī)等級(jí)考試成績(jī)查詢(xún)時(shí)間及查分
- 2024年9月浙江計(jì)算機(jī)二級(jí)成績(jī)查詢(xún)時(shí)間及查分入口