搜索引擎搜不到什么?
网友解答: 1.网站不让爬虫提取的,也就是屏蔽它的2.法律不允许的敏感内容,如岛国片,如国外…另外,搜索引擎抓取了,未必就能展示给你看到,因为涉及到排名前后,排在20页以后被你看到的机率
1.网站不让爬虫提取的,也就是屏蔽它的
2.法律不允许的敏感内容,如岛国片,如国外…
另外,搜索引擎抓取了,未必就能展示给你看到,因为涉及到排名前后,排在20页以后被你看到的机率几乎为0…
网友解答:互联网的核心就是连接。所以
1、搜不到网络上本身没有的数据
2、搜不到网络爬虫爬不了的数据,像GitHub上的内容,前面百度爬虫乱搞别人,于是GitHub弄了一套反百度爬虫的机制。
于是答主前面在GitHub搭了一个个人博客,为了让百度能爬我的数据,主动献身还折腾了一番。博客地址everyblue.github.io
小弟刚玩酷米号,我猜说了你也不会关注我