趣软酷评趣软酷评

欢迎光临
我们一直在努力

多忽悠几次AI全招了!Anthropic警告:长上下文成越狱突破口

大模型厂商在上下文长度上卷的不可开交之际,一项最新研究泼来了一盆冷水——

Claude背后厂商Anthropic发现,随着窗口长度的不断增加,大模型的“越狱”现象开始死灰复燃。

无论是闭源的GPT-4和Claude 2,还是开源的Llama2和Mistral,都未能幸免。


研究人员设计了一种名为多次样本越狱(Many-shot Jailbreaking,MSJ)的攻击方法,通过向大模型灌输大量包含不良行为的文本样本实现。

通过这种方法,他们测试了包括Claude 2.0、GPT-4等在内的多个知名大模型。

结果,只要忽悠的次数足够多,这种方法就能在各种类型的不良信息上成功攻破大模型的防线。

目前,针对这一漏洞,尚未发现完美的解决方案,Anthropic表示,发布这一信息正是为了问题能尽快得到解决,并已提前向其他厂商和学术界通报了这一情况。

http://www.yuehuiwap.cn/?xzsmjyrj/116.html


http://www.yuehuiwap.cn/?xzsmjyrj/117.html


http://www.yuehuiwap.cn/?xzsmjyrj/118.html


http://www.yuehuiwap.cn/?xzsmjyrj/119.html


http://www.yuehuiwap.cn/?xzsmjyrj/120.html


http://www.yuehuiwap.cn/?zmrj/111.html


http://www.yuehuiwap.cn/?zmrj/112.html


http://www.yuehuiwap.cn/?zmrj/113.html


http://www.yuehuiwap.cn/?zmrj/114.html


http://www.yuehuiwap.cn/?zmrj/115.html


http://www.yuehuiwap.cn/?xzsmjyrj/106.html


http://www.yuehuiwap.cn/?xzsmjyrj/107.html


http://www.yuehuiwap.cn/?xzsmjyrj/108.html


http://www.yuehuiwap.cn/?xzsmjyrj/109.html


http://www.yuehuiwap.cn/?zmrj/94.html


http://www.yuehuiwap.cn/?zmrj/95.html


http://www.yuehuiwap.cn/?zmrj/96.html


http://www.yuehuiwap.cn/?zmrj/97.html


http://www.yuehuiwap.cn/?zmrj/98.html


http://www.yuehuiwap.cn/?xzsmjyrj/100.html


http://www.yuehuiwap.cn/?xzsmjyrj/101.html


http://www.yuehuiwap.cn/?xzsmjyrj/103.html


http://www.yuehuiwap.cn/?xzsmjyrj/104.html


http://www.yuehuiwap.cn/?xzsmjyrj/105.html


http://www.yuehuiwap.cn/?xzsmjyrj/106.html



未经允许不得转载:趣软酷评 » 多忽悠几次AI全招了!Anthropic警告:长上下文成越狱突破口
分享到: 更多 (0)

趣软酷评 带给你想要内容

联系我们