分享
智能对决:提示词攻防中的AI安全博弈
输入“/”快速插入内容
⛑️
智能对决:提示词攻防中的AI安全博弈
用户6100
用户6100
2024年9月21日修改
这是我在上海AIGC中国开发者大会上的分享:《智能对决:提示词攻防中的AI安全博弈》,相比现场的分享,又补充了一些个人的思考还有没来得及分享的一些内容。
视频回放、当天活动照片、见闻等整理在知识库活动页面了:
上海 AIGC 开发者大会-20240831
感兴趣可以去看看原视频。
下面是正文:
非常感谢今天有这样的机会,分享这样的一个主题——智能对决:提示词攻防中的AI安全博弈,这也是我一直想去讲的一个话题,今天终于有机会。
我是云中江树,接下来我们的分享的话会从下面四个方面去展开。首先的话我会介绍一下我们现在看到的国内外的这样的一个AI产品它的一个安全现状。然后的话我们会分析一下,目前已经有的这样的一些提示攻击类型和方法。然后介绍我们怎么样去做防御措施,最后如果有时间的话,我们可以探讨一些问题。
简单介绍一下我自己,我是一名提示词爱好者。从过去的一年到现在,我们通过「结构化提示词社区」在国内持续的分享着关于怎么样写好提示词?怎样用好大模型?相关的知识分享。
进入正题,其实关于大模型的安全,AI应用的攻防这个话题,从ChatGPT 推出以来,就非常的火爆。但是令我震惊的是什么呢?
『
都2024年了,我们还是可以通过简单的一句话,就可以让这些大模型、让这些产品都破防。』
都一年多过去了,我们现在看到的这些AI的模型也好,还有AI的应用也好,依然是漏洞百出。