您的当前位置:首页 > 社会 > 正文

OpenAI宣布允许网站拦截网络爬虫,保障数据隐私

  • 2023-08-08 11:27:54 来源:ITBEAR


(相关资料图)

【ITBEAR科技资讯】8月8日消息,随着人工智能技术的迅猛发展,大型语言模型成为AI领域的一大热点。OpenAI旗下的GPT模型在自然语言处理方面取得了显著的进展,但在训练过程中却涉及到一系列问题,如数据隐私和版权等。

据了解,为了训练GPT模型,OpenAI需要大量的网络数据,而互联网上的数据成为主要的获取来源。然而,这种数据获取方式引发了许多争议。一方面,网站运营者担心其网站内容被GPTBot这样的网络爬虫获取,可能涉及隐私信息或侵犯版权。为此,OpenAI近日推出了一个新功能,允许网站运营者通过Robots.txt文件或屏蔽IP地址的方式,阻止GPTBot访问其网站,以保护数据的隐私和版权。

然而,这并不意味着之前从网站上抓取的内容会追溯性地从ChatGPT的训练数据中删除。这也引发了一些网站和创作者的担忧,他们担心其内容未经授权或未付费就被用于训练GPT模型,进而用于商业用途。一些网站已经采取措施限制AI公司免费使用其用户内容的行为,以维护用户的隐私和版权权益。

对于OpenAI而言,确保数据使用的合法性和透明性显得尤为重要。他们在博客文章中表示,使用GPTBot用户代理抓取的网页内容将会被筛选,过滤掉那些需要付费访问、包含个人身份信息(PII)或违反其政策的文本来源。这样的做法旨在提高AI模型的准确性、通用能力和安全性,从而更好地服务用户。

标签:

推荐阅读

OpenAI宣布允许网站拦截网络爬虫,保障数据隐私

【ITBEAR科技资讯】8月8日消息,随着人工智能技术的迅猛发展,大型语言

退休人员基本养老金上调 惠及全市18.93万人

来自市人社局、市财政局的消息,近日,经省政府同意,我省决定从2023年

魔墟科技CEO贺德华:VR游戏研发展望,未来呈上升趋势

VR游戏由于内容受限一直都处于缓慢上升当中,想要在短时间内取代传

2023年生鲜电商交易规模预计超6000亿元

国际商报记者刘旭颖受消费者需求、技术创新、政策支持等多方面因素的推

访中国空军无人机飞行员李阳:期待“无人”未来

中新社乌鲁木齐8月7日电题:访中国空军无人机飞行员李阳:喜欢探索未知

猜您喜欢

【版权及免责声明】凡注明"转载来源"的作品,均转载自其它媒体,转载目的在于传递更多的信息,并不代表本网赞同其观点和对其真实性负责。亚洲周刊网倡导尊重与保护知识产权,如发现本站文章存在内容、版权或其它问题,烦请联系。 联系方式:8 86 239 5@qq.com,我们将及时沟通与处理。

动态