什么是文件匹配?
分享 2017.12.14 瀏覽次數:9433次
杭州網站建設--帷拓小編說說 什么是文件匹配?
搜索詞經過處理后,搜索引擎得到的是以詞為基礎的關鍵詞集合。文件匹配階段就是找出含有所有搜索關鍵詞的所有文件。在索引部分提到的倒排索引使得文件匹配能夠快速完成,杭州網站建設--帷拓小編放一張圖給大家看看:
杭州網站建設--帷拓小編假設用戶搜索“關鍵詞2”和“關鍵詞7”,排名程序只要在倒排索引中找到“關鍵詞2”和“關鍵詞7”這兩個詞,就能找到分別含有這兩個詞的所有頁面。經過簡單求交集計算就能找出既包含”關鍵詞2”和“關鍵詞7”的所有頁面:文件1和文件6。
初始集結的選擇:找到所有關鍵詞的匹配文件后,還不能進行相關性計算,需要的時間還是太長。實際上用戶并不需要知道所有匹配的幾十萬,幾百萬個頁面,絕大部分用戶只會查看前兩頁,也就是前20個結果。搜索引擎也并不需要計算這么多頁面的相關性,而只要計算最重要的一部分頁面就可以了。常用搜索引擎的人都會注意到,搜索結果頁面通常最多顯示100個。用戶點擊搜索結果頁面底部“下一頁”鏈接,最多也只能看到第100頁,也就是1000個搜索結果,杭州網站建設--帷拓小編發張下圖。
百度則通常返回76頁結果,杭州網站建設--帷拓小編發張下圖。360搜索通常犯諱頁結果,必應貌似冒雨固定頁數,會根據不同查詢詞而變化,但也不會超過100頁。
總之,最多顯示1000個搜索結果,所以搜索引擎又怎么知道哪1000個文件是最相關的?所以用于最后相關性計算的初始頁面子集的選擇,必須依靠其他特珍而不是相關性(這些文件都包含所有查詢關鍵詞),搜索引擎通常會用非相關性的頁面特征選出一個初始子集。初始子集的數目是多少?幾萬個?或許更多,外人并不知道。不過可以肯定的是,當匹配頁面數目巨大時,搜索引擎不會對這么多頁面進行實時計算,而必須選出一個頁面權重較高的一個子集,再對子集的頁面進行相關性計算。
- PREV:網站建設排名相關性計算
- NEXT:互聯網汽車行業的威力
-
杭州網站建設:醫院網站設計中的“學習與執行”
日期:2025-06-10瀏覽次數:2004次
-
杭州網站制作公司:大型企業網站建設的核心要素與實踐
日期:2025-06-10瀏覽次數:1951次
-
杭州網站設計:醫院網站建設的主要內容與前景展望
日期:2025-06-10瀏覽次數:1981次
-
杭州網站建設:傳統企業網站面臨的挑戰與變革
日期:2025-05-16瀏覽次數:4753次
-
杭州品牌網站開發:建設與后期維護的雙重策略
日期:2025-05-16瀏覽次數:4769次
相關新聞
整合同類新聞,相關新聞一手掌握
-
鞍山網頁設計通常如何設計網頁?
日期:2020-10-15瀏覽次數:5770次
-
鞍山做網站,如何選擇主機與服務器?
日期:2020-10-15瀏覽次數:5697次
最新新聞
與互聯網同行,實時掌握網建行業最新動態
-
建設杭州定制網站如何選擇網站空間
日期:2020-04-14瀏覽次數:6041次
-
小說類洛陽app開發,要注意這些細節
日期:2020-10-29瀏覽次數:5889次
-
如果杭州營銷推廣效果不盡人意,應該考慮哪些因素?
日期:2021-08-06瀏覽次數:7760次
-
杭州營銷推廣:“引流之王”軟文營銷策略
日期:2023-01-07瀏覽次數:6373次
-
張家口網站設計需要注意的細節
日期:2023-02-22瀏覽次數:5486次
隨機新聞
新聞新動態,您需要的新聞管家
洞悉市場趨勢演變讓傳播回歸社會
免費獲取網站建設與網絡推廣方案報價
-
關于我們
杭州帷拓科技有限公司,是一家新型的全案網絡開發公司,作為以互聯網高端網站建設、APP開發、小程序開發為核心的專業網絡技術服務供應商,帷拓科技致力于全面分析市場環境、衡量與預測市場需求、整合區別于行業競爭對手的絕對優勢,結合品牌理念深度挖掘項目優勢和產品價值,提升客戶品牌認知、認可度。
-
我們的客戶
帷拓科技歷經十年沉淀,與國內外上千家客戶達成合作關系,其中穩定合作的公司有:浙江華為、浙江移動、浙江5G產業聯盟、浙江省社科院、綠城足球俱樂部、娃哈哈雙語學校、健康中國杭州峰會、科雷機電等,帷拓科技始終堅持“帷有專業,才能拓展無限”的服務理念,堅持“認真堅持細節”的優質服務理念,不斷完善自身,成就企業,最終實現共贏。
-
我們的業務
帷拓科技主營業務范圍包含互聯網高端網站建設、APP開發、小程序開發、商城網站建設、公眾號運營以及數字營銷等,涵蓋了服務、房產、數碼、服裝、物流貿易等行業,根據品牌現狀,為每個客戶量身定制項目整體服務方案,以敏銳的市場洞察力、創新的市場策劃能力,全面把握市場變化,為客戶實現從企業到消費者的價值轉換。