当前位置：首页 » 资讯 » 新科技 » 正文

CloudflareVSPerplexity：“数据主权”战争一触即发

IP属地中国·北京 编辑：陈阳锦缎 时间：2025-08-05 15:55:33

协议，正面临人工智能时代的严峻挑战
锦缎
市值5000亿人民币的美国互联网基础设施巨头Cloudflare，向人工智能新势力Perplexity发起指控，称后者采用隐形爬虫技术规避网站封锁，秘密抓取明令禁止其访问的内容。
这场冲突凸显了AI公司训练数据获取与网站主权间的尖锐矛盾。
规避技术细节
Cloudflare安全团队在实验中发现：当Perplexity官方爬虫（标识为PerplexityBot）被robots.txt文件或防火墙规则拦截后，该公司会立即启用未声明的备用爬虫程序。该程序通过两种手段伪装身份：
1‌.篡改用户代理‌：
伪装成macOS版Chrome浏览器的普通用户访问；
2.轮换网络标识‌：
动态更换IP地址及自治系统网络（ASN）以绕过封锁。此类行为每天涉及数万个域名，产生数百万次违规请求。
冲突升级与反制
此次指控源于Cloudflare客户投诉尽管已通过技术手段屏蔽Perplexity爬虫，其网站内容仍出现在该AI公司的搜索结果中。
Cloudflare验证后采取两项措施：
1.将Perplexity移出已验证机器人白名单；
2.向所有用户（含免费客户）提供拦截其隐形爬虫的技术方案。
Perplexity发言人杰西德怀尔（Jesse Dwyer）驳斥指控为炒作，称报告存在根本性误解。但Cloudflare出示的实验记录显示：其专设的测试域名（含严格访问限制）内容仍被Perplexity抓取并解析。
行业博弈白热化
Cloudflare首席执行官马修普林斯（Matthew Prince）指出核心矛盾：AI公司抓取效率与网站收益严重脱钩。
OpenAI平均每1500次抓取带来1次用户跳转，Anthropic这一比例高达73300:1，而谷歌仅为18:1。
这促使Cloudflare于2025年7月推出革命性方案：
●「Pay Per Crawl」收费系统：‌允许网站向AI公司按次收取内容抓取费用；
●「AI迷宫」防御工具：‌用虚假内容消耗恶意爬虫资源。
目前已有美联社、Reddit等逾百万网站加入封锁AI爬虫的行列。
协议这份维系互联网三十余年的君子协定，正面临人工智能时代的严峻挑战。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

DeepSeek又更新了，这次梁文锋没放大招｜进击的独角兽

小米VS华为！澎程新车对标问界，智界RX盯上小米YU7

出走米哈游1000多天后，蔡浩宇的AI远征“撞墙”

华为深圳场景化解决方案发布，破解“模型强、场景弱”难题

CJ2026京东展区大揭秘：新潮数码与前沿科技共筑玩家乐园

韩寒出任荣耀影像创想家荣耀Robot Phone发布会定档8月12日

全站最新

DeepSeek又更新了，这次梁文锋没放大招｜进击的独角兽

小米VS华为！澎程新车对标问界，智界RX盯上小米YU7

出走米哈游1000多天后，蔡浩宇的AI远征“撞墙”

华为深圳场景化解决方案发布，破解“模型强、场景弱”难题

热门推荐

美的等入股钧舵机器人

DeepSeek又更新了，这次梁文锋没放大招｜进击的独角兽

小米VS华为！澎程新车对标问界，智界RX盯上小米YU7

出走米哈游1000多天后，蔡浩宇的AI远征“撞墙”

华为深圳场景化解决方案发布，破解“模型强、场景弱”难题

字节跳动在中卫成立新科技公司注册资本22亿

字节跳动在中卫成立新科技公司注册资本22亿

SpaceX财报前夕：轨道AI数据中心成估值关键，技术挑战与前景几何？

小米“食言”入局增程赛道，澎程系列SUV能否在激烈竞争中突围？

小米米家智能茶吧机台面式开启预售，双区出水精准控温，599元享便捷饮水煮茶体验

红杉资本深度对话：Transformer架构遇瓶颈，持续学习新架构或成AGI关键

MiniMax H3开源来袭：价格优势叠加技术突破，视频生成赛道迎新变局？

《2026 Q2热搜品牌TOP50》揭晓：自助餐、科技消费等新风口崛起，本土品牌发力

字节跳动Seedance 2.5发布：视频时长延长至30秒，多素材创作能力大幅提升

字节跳动Seedance 2.5发布：长叙事多模态编辑升级，赋能视频创作新体验