分享好友 资讯首页 频道列表

OpenAI宣布允许网站拦截网络爬虫,保障数据隐私

2023-08-08 13:169510

IT采购网8月8日消息,随着人工智能技术的迅猛发展,大型语言模型成为AI领域的一大热点。OpenAI旗下的GPT模型在自然语言处理方面取得了显著的进展,但在训练过程中却涉及到一系列问题,如数据隐私和版权等。

据了解,为了训练GPT模型,OpenAI需要大量的网络数据,而互联网上的数据成为主要的获取来源。然而,这种数据获取方式引发了许多争议。一方面,网站运营者担心其网站内容被GPTBot这样的网络爬虫获取,可能涉及隐私信息或侵犯版权。为此,OpenAI近日推出了一个新功能,允许网站运营者通过Robots.txt文件或屏蔽IP地址的方式,阻止GPTBot访问其网站,以保护数据的隐私和版权。

然而,这并不意味着之前从网站上抓取的内容会追溯性地从ChatGPT的训练数据中删除。这也引发了一些网站和创作者的担忧,他们担心其内容未经授权或未付费就被用于训练GPT模型,进而用于商业用途。一些网站已经采取措施限制AI公司免费使用其用户内容的行为,以维护用户的隐私和版权权益。

对于OpenAI而言,确保数据使用的合法性和透明性显得尤为重要。他们在博客文章中表示,使用GPTBot用户代理抓取的网页内容将会被筛选,过滤掉那些需要付费访问、包含个人身份信息(PII)或违反其政策的文本来源。这样的做法旨在提高AI模型的准确性、通用能力和安全性,从而更好地服务用户。

反对 0
举报 0
收藏 0
打赏 0
评论 0
DeepSeek-V3.2与智谱GLM-4.6新模型将至,技术迭代引发AI领域新期待
DeepSeek-V3.2与智谱GLM-4.6新模型将至,技术迭代引发AI领域新期待

0评论2025-09-301218

海天瑞声与阿里巴巴十年携手,凭综合优势成其AI训练数据重要供应商
海天瑞声与阿里巴巴十年携手,凭综合优势成其AI训练数据重要供应商

0评论2025-09-302303

观安信息亮相2025北京互联网大会,解锁可信数据空间与AI安全新实践
观安信息亮相2025北京互联网大会,解锁可信数据空间与AI安全新实践

0评论2025-09-302973

蚂蚁百宝箱与友盟携手,以一站式服务赋能开发者,共赴智能体开发新时代
蚂蚁百宝箱与友盟携手,以一站式服务赋能开发者,共赴智能体开发新时代

0评论2025-09-30688

AI成年轻人旅行“智囊”:从攻略制定到旅途应急,让出行更轻松
AI成年轻人旅行“智囊”:从攻略制定到旅途应急,让出行更轻松

0评论2025-09-30513

华为亮相2025青岛国际城轨展,携全栈方案共绘城轨智能化新蓝图
华为亮相2025青岛国际城轨展,携全栈方案共绘城轨智能化新蓝图

0评论2025-09-302533

“悟空”类脑计算机:模拟猕猴大脑 开启神经拟态计算新篇章
“悟空”类脑计算机:模拟猕猴大脑 开启神经拟态计算新篇章

0评论2025-09-302324

Flash Attention作者播客谈AI未来:英伟达GPU主导或三年内生变,推理成本有望再降10倍
Flash Attention作者播客谈AI未来:英伟达GPU主导或三年内生变,推理成本有望再降10倍

0评论2025-09-302444

国庆前夕DeepSeek-V3.2现身HuggingFace后又404 后续动态引关注
国庆前夕DeepSeek-V3.2现身HuggingFace后又404 后续动态引关注

0评论2025-09-301702

Anthropic发布Claude Sonnet 4.5:编码性能跃升,安全与自主性全面升级
Anthropic发布Claude Sonnet 4.5:编码性能跃升,安全与自主性全面升级

0评论2025-09-302894