HTML 防止爬虫抓取方法
HTML About 193 wordsrobots.txt
设置robots.txt
爬虫抓取规则,一般放置在域名根目录。
如:不允许抓取/admin
下的路径及子路径。
User-agent: *
Disallow: /admin/
meta 爬虫控制指令
<meta name="robots" content="NONE">
单页面应用
单页面应用也能应对爬虫,使用JavaScript
动态切换HTML
页面。
Views: 715 · Posted: 2023-09-13
————        END        ————
Give me a Star, Thanks:)
https://github.com/fendoudebb/LiteNote扫描下方二维码关注公众号和小程序↓↓↓
Loading...