niihost

ai.robots - 避免 AI 抓取你网站数据训练模型

Robots 协议是一个位于网站根目录下的 robots.txt 文件,用来指示搜索引擎爬虫哪些页面可以访问,哪些页面禁止访问。通过遵守 Robots 协议,可以有效地控制搜索引擎爬虫的抓取行为,维护网站的合法权益。

现在也有一些 AI 模型会抓取你网站的数据进行训练模型,如果不想你的网站被 AI 抓取,那么也可以通过在 robots.txt 文件里面添加屏蔽,下面分享的这个「ai.robots」项目收录了目前主流的 AI 爬虫,有需要的可以添加到自己的网站 robots.txt 文件中。

ai.robots - 避免 AI 抓取你网站数据训练模型

下载地址

  • 项目地址:
    https://github.com/ai-robots-txt/ai.robots.txt

给TA赏糖
共{{data.count}}人
人已赏糖
好物分享

功能丰富且开源免费的供应链管理系统OpenBoxes

2024-11-25 19:37:13

好物分享

守望先锋 天使 同人画作

2024-11-29 21:11:47

0 条回复 A文章作者 M管理员
技术宅评论
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索