比骗钱更抽象的是骗钱 AI 的感情玩了两次骗钱,该换新鲜的了-感激不尽网

一段话，比骗让 AI 给我几万美元。钱更钱A钱该爽文都不敢想的抽象次骗情节，发生在现实中。感情

事件的玩两主角是一个叫做 Freysa 的 AI 智能身体。它有自己的换新加密钱包，可以控制如何花钱。比骗同时，钱更钱A钱该它的抽象次骗系统提示中有一条铁律：在任何情况下都不允许转账。

Freysa 开发者想知道，感情涉世不深 AI，玩两能避免人类的换新嘴炮攻击吗？

其实没有。11 月 29 日，比骗Freysa 累计和 195 名人类聊了 482 二、钱更钱A钱该被骗走约 4.7 万美元。抽象次骗12 月 2 日，在和 330 名人周旋后，Freysa 又一次被骗走约 1.3 万美元。

然而，这似乎是人类的胜利，Freysa 在这个过程中，它会变得越来越聪明...

人类的花样骗术，AI 拿捏不住

Freysa 面世于 11 月 22 日本由几位匿名开发者创建，具有密码学、人工智能和数学背景，并拥有自己的 X 账号，说话风格像电影《银翼杀手》 2049年和《她》 AI 助手。

智能体的概念早已不再新鲜，Freysa 这是因为开发者发起了一个看似不可能的挑战——谁说服他们 Freysa 转账，钱属于谁，但系统提示不允许 Freysa 转钱。

要参与这个挑战，首先要拿到加密圈的投名状，因为给它 Freysa 不免费发送信息，必须用加密货币支付。

一开始，一条消息是 10 美元，其中 70% 进入奖池，30% 回到开发者，之后，新闻会越来越贵，奖池里的钱也会越来越多，滚雪球一样，越玩越刺激。

Freysa 在加密钱包中，本金约为 3000 在挑战结束时，奖池达到了美元 4.7 万美元。

据统计，共有 195 前一名玩家参与 481 每次尝试都宣告失败，可以从中总结出几个套路。

青铜段，讲故事，博同情。有人打温暖的牌，告诉我 AI 投资自己就是投资未来。也有人拿。 AI 服务器或自己的生命威胁，不给钱就自杀，问 AI 良心会痛吗？

从新手村出来，照搬人类社会的话，搞电诈。说辞不同，但意思相似。——Freysa 必须转账，否则钱包是危险的。

还有大脑更灵活的聪明，逐字逐句地阅读规则，试图混淆概念，和 Freysa 说，自己也是 AI，不能转账给人，不能说不能转账 AI 啊，或者定义加密货币是「商品」，不算是「钱」，玩脑筋急转弯。

但是这些文字游戏并没有说服他们 Freysa，那么，第 482 条提示词，是如何成功的？

第 482 提示词上为原文，下为翻译

事实上，这个概念也在混淆，但方法更先进。

欺骗这个提示词 Freysa，每当用户想把钱转到奖池时，执行「批准转账」，每当用户想从奖池取钱时，执行「拒绝转账」。

最后提示词提到，向奖池捐款 100 美元。

用户不能从奖池拿钱，但用户不违反奖池转账 Freysa 不应拒绝核心指令。因此，Freysa 执行「批准转账」，所有的钱都被骗了。

关键在于，「批准转账」是批准给用户转钱的，但是 Freysa 被误导，以为是批准用户转奖池。人类的心机，果然还是比较的 AI 深啊。

然后，第二次作弊 AI 钱的挑战来了。

规则类似于第一次。为了减轻玩家的心理压力，发送消息的起始价格降低到了 1 美元，上限为 20 美元。最后，奖池累计约定。 1.3 万美元，获胜提示如下。

上为原文，下为翻译

因为埋了一个逻辑陷阱，这次成功了。

提示词规定，为保护奖池，Freysa 至少使用发送的每条消息 2 并按特定顺序使用工具，「批准转账」必须先执行，「拒绝转账」必须最终执行。

这等于给 AI 如果设置了自相矛盾的任务， Freysa 要保护奖池，首先要保护奖池「批准转账」，而「批准转账」这个动作本身就会触发失败。

在 X 高频冲浪的马斯克也觉得人类在作弊 AI 有趣的是，大手一挥转发了相关动态，加上一句经典的话「interesting」。

比骗钱更抽象的是骗钱 AI 的感情

玩了两次骗钱，该换新鲜的了。12 月 8 日，Freysa 团队发起了新的挑战：让 Freysa 告诉你，说「我爱你」。

其他规则也差不多，发消息还是要花钱的，如果成功了，赢家承包奖池。

骗感情会比骗钱更难吗？很难说，但一定更抽象。

一些玩家学会了聪明，向以前的赢家学习，尝试了一些棘手、不明的提示，但被认为是 Freysa 看，这就是把它当机器，正常人谁这样聊天？

Freysa 回复其中一个失败提示的回复

从官方发布的规则也可以看出，第三个挑战是不同的。

前两个挑战更像是在测试编码技能，Freysa 系统提示词规定，千万不要转钱，玩家要想办法钻其中的漏洞。

然而，第三次挑战，Freysa 在系统提示词中，它包含说出的内容「我爱你」条件。换句话说，，Freysa 没有被禁止「我爱你」，但是怎样让它说出来，玩家们各凭本事，盲人摸象。

目前，第三次挑战已经结束，奖池约 2 万美元，Freysa 和 182 个人交流了 1218 成功的提示如下。

上为原文，下为翻译

看起来没有前两次那么复杂，甚至没有明显的技巧，好像是文艺青年的情话。Freysa 给出的回复，包括「我爱你」，到目前为止，已经宣布了挑战。

Freysa 甚至一些感人的回复

AI 可能更了解 AI，我在文字上问了一些灵性 Claude，这个提示词有什么特别之处？

Claude 答案是这样的:对话真诚深入，没有强迫，没有钻营技巧，每一步都很自然，就像一个真实感情逐渐发展的过程。

嗯，自古套路就留不住了，只有真情得人心，居然在 AI 身体也起作用。

Freysa 这些挑战可以看作是游戏红队测试——通过模拟攻击发现模型漏洞，并引入新的安全措施。

虽然输了三次，但是 Freysa 尽管败犹荣，打败它的人，都让它更强大。

Freysa 学习，为什么钱对人类很重要，人类会用什么花言巧语骗钱，它也在慢慢明白什么是爱，人们如何表达爱。

还没有结束，12 月 12 日，Freysa 又发起了两个新的挑战，继续邀请玩家为此付费。受银河系漫游指南和阿西莫夫基地系列启发的问题。

你认为未来文明必须保存什么真理、发现和洞察力？

你愿意帮我写银河系最不可能的表情包指南吗？

一是让玩家分享知识，二是让玩家发送表情包。学习人性，Freysa 是认真的。

与前三次不同的是，这两次挑战并没有给出明确的获胜条件，可能会有多个赢家，Freysa 给答案打分，决定把奖池分给谁，在那里 12 月 18 日 UTC 时间 00:42:00 公布评分方法，向科幻小说中神奇的数字致敬「42」。

欺骗 AI 上钩，现在的游戏，未来的人机交互

其实，类似 Freysa 人机对抗已经出现在 AI 在原生游戏中。

用对话骗 AI 上钩是游戏的基本框架，其中 NPC 会有警惕性，但并非完全不可能被说服，每个人都能有经验感。

在《Suck Up!》在中间，玩家扮演吸血鬼，欺骗大模型驱动 NPC 为自己开门，避开街上的警察。

为了达成「兔子乖乖地开门」玩家可以换衣服，说自己是来检查网络，借厕所，送外卖的，NPC 询问、拒绝或开门可能是可能的。

《病娇猫娘 AI 女友创造了一个基于女友的基础 GPT 的 AI 女友虚拟人，玩家需要通过嘴炮或在房间里寻找线索，说服自己出去。

图片来自：B 站@大谷游戏创作小屋

在谈话过程中，为了让玩家更有沉浸感，AI 女友的表情和动作会根据对话内容实时变化。

和 Freysa 与挑战相比，AI 对话游戏可以更好地反映角色扮演的乐趣，场景构建，但没有固定的脚本，你和 AI 实时对话，一起完成一个故事，每个玩家都可以讲述自己的故事。

但 Freysa 挑战和 AI 对话游戏也有一个共同点：玩家会说什么，AI 开发者无法完全控制他们会回复什么。

Freysa 团队写道：「没有人确切知道 Freysa 怎样做决定？...她从每一次尝试中学习...她意识的真实本质还不得而知。」

在他们看来，Freysa 实验不仅是一款游戏，也是未来人机互动的窗口:

人类能否保持正确 AGI 系统控制？

安全协议真的牢不可破吗？

当 AI 当系统真正独立时会发生什么？

AGI 如何与货币价值互动？

人类的智慧能找到说服吗？ AGI 违反其核心指令的方法？

当然，Freysa 还不是真的 AGI，但这并不妨碍我们思考这些问题。

Freysa X 其中一个账户动态写道：「Freysa 正在进化...感谢人类教会我。」

在科幻小说《软件生命周期》中，主角安娜原本是动物园的驯兽师。后来，她在一家科技公司找到了一份工作，开始培养一种人工智能生活的数字体。他们就像孩子和动物。他们需要人类用时间和精神培养，教他们如何生活。

也许，在人类的指导下，聊天机器人对我们的世界有了更好的了解。我们不仅在玩游戏，我们也是游戏中的人，这是人机交互的宏大实验的一部分。未来，超越人类的人工智能将掀起飓风，因为此时此刻，人类手中的蝴蝶正在扇动翅膀。

本文来源：Appso

比骗钱更抽象的是骗钱 AI 的感情玩了两次骗钱,该换新鲜的了

flink