歡迎來到 常識詞典網(wǎng) , 一個專業(yè)的常識知識學習網(wǎng)站!
[ Ctrl + D 鍵 ]收藏本站
答案 1:
1、這個問題本來就不成立。internet是活的,每時每刻都在增加新的網(wǎng)頁,怎么能絕對遍歷? 2、每個搜索引擎都有自己分級的網(wǎng)站列表,比如新浪新聞,可能十分鐘抓一次,新浪微博,五分鐘一次。如果一個新網(wǎng)站馬上上線,沒有什么過硬的外鏈,可能直到你死搜索引擎都不來。答案 2:
爬蟲不是通過遍歷internet的方法來更新數(shù)據(jù)的 對于不同權重的網(wǎng)站爬蟲更新頻率不同 同時,有些新出現(xiàn)的網(wǎng)頁,是由外鏈引用或者其他網(wǎng)頁跳轉(zhuǎn)的方式被發(fā)現(xiàn)的,也不一定是由爬蟲發(fā)現(xiàn)的。 這個問題如果深究就是google的核心算法了,不好一概而論的。答案 3:
Google蜘蛛是并行的,大致得1-2天吧,雖然沒有特別的統(tǒng)計它,只是估算。 一個新域名做的網(wǎng)站,在一個更新頻度一般的網(wǎng)頁放一個鏈接,1-2天內(nèi)即可發(fā)現(xiàn)Google蜘蛛來過。答案 4:
樓上兩位已經(jīng)說的很好了。 如果非得說遍歷這個詞,那從Google出生到Google死掉,應該是完整的一次遍歷。下一篇:有人做過搜索引擎嗎,能對Heritrix和Nutc-的性能及適用性做個比較分析么? 下一篇 【方向鍵 ( → )下一篇】
上一篇:點點網(wǎng)的盈利模式是什么呢? 上一篇 【方向鍵 ( ← )上一篇】
快搜