全站广播:
快来一起嘀咕下该主题吧
搜索引擎可以搜索到网站的每一个链接。搜索引擎每增加一个访问的层次,就会产生组合爆炸,对于高权重的网站,搜索引擎会增加网站的搜索深度,对于普通的网站,搜索的深度为一般为3层。对于访问深度4 层以上的页面不再继续收集。访问层次,假如搜索引擎访问网站的首页为访问入口,首页上所有列出的链接,为访问的第一层,第一层连接进去的页面上的链接为第二层、以此类推。网站的 SEO 优化方向就是尽量降低页面的层次,有效的方法可以是:1)把重要的栏目和内容的链接提到首页,2)在页面尽可能多设置链接,3)建立网站地图4)优化分页的显示方法,将传统的“首页、上一页、下一页、尾页”第1 2 3 4 5 6 7 8 9 10 页
深度优先搜索是一种在开发爬虫早期使用较多的方法。它的目的是要达到被搜索结构的叶结点(即那些不包含任何超链的HTML文件) 。在一个HTML文件中,当一个超链被选择后,被链接的HTML文件将执行深度优先搜索,即在搜索其余的超链结果之前必须先完整地搜索单独的一条链。深度优先搜索沿着HTML文件上的超链走到不能再深入为止,然后返回到某一个HTML文件,再继续选择该HTML文件中的其他超链。当不再有其他超链可选择时,说明搜索已经结束。优点是能遍历一个Web 站点或深层嵌套的文档集合;缺点是因为Web结构相当深,,有可能造成一旦进去,再也出不来的情况发生。
事实上,深度优先搜索属于图算法的一种,英文缩写为DFS即Depth First Search.其过程简要来说是对每一个可能的分支路径深入到不能再深入为止,而且每个节点只能访问一次.
Tags: 博百优