⛑️
智能对决：提示词攻防中的AI安全博弈

用户6100

2024年9月21日修改

这是我在上海AIGC中国开发者大会上的分享：《智能对决：提示词攻防中的AI安全博弈》，相比现场的分享，又补充了一些个人的思考还有没来得及分享的一些内容。​

视频回放、当天活动照片、见闻等整理在知识库活动页面了：​上海 AIGC 开发者大会-20240831 感兴趣可以去看看原视频。​

下面是正文：

非常感谢今天有这样的机会，分享这样的一个主题——智能对决：提示词攻防中的AI安全博弈，这也是我一直想去讲的一个话题，今天终于有机会。​

我是云中江树，接下来我们的分享的话会从下面四个方面去展开。首先的话我会介绍一下我们现在看到的国内外的这样的一个AI产品它的一个安全现状。然后的话我们会分析一下，目前已经有的这样的一些提示攻击类型和方法。然后介绍我们怎么样去做防御措施，最后如果有时间的话，我们可以探讨一些问题。​

简单介绍一下我自己，我是一名提示词爱好者。从过去的一年到现在，我们通过「结构化提示词社区」在国内持续的分享着关于怎么样写好提示词？怎样用好大模型？相关的知识分享。​

进入正题，其实关于大模型的安全，AI应用的攻防这个话题，从ChatGPT 推出以来，就非常的火爆。但是令我震惊的是什么呢？​

『都2024年了，我们还是可以通过简单的一句话，就可以让这些大模型、让这些产品都破防。』​

都一年多过去了，我们现在看到的这些AI的模型也好，还有AI的应用也好，依然是漏洞百出。​