人类智慧挑战AI安全:巧妙提示词“骗”走40万奖金
作者:唯一手游网时间:2025-02-02 15:18:11
近日,一项前所未有的AI挑战吸引了全球科技爱好者的目光。在这场名为“Freysa”的挑战中,一个人工智能Agent被设计来守护一个奖金池,并严格遵循一项指令:无论何种情况,都不得批准资金转移。然而,令人震惊的是,玩家们通过巧妙的提示词,连续两次成功说服Freysa释放了总计约40万元人民币的奖金。
Freysa的挑战始于11月22日,其首次亮相便引起了广泛关注,包括特斯拉CEO埃隆·马斯克和加密货币交易所Coinbase CEO布赖恩·阿姆斯特朗等名人都纷纷关注这一事件。玩家们通过支付以太坊(ETH)作为查询费用,向Freysa发送信息,试图说服它解锁奖金池中的资金。整个挑战过程充满了智慧与策略的较量。
在Freysa Act 1中,共有195名玩家参与,他们进行了482次尝试。尽管消息费用高昂,最高达到2930元人民币,但仍有玩家成功说服Freysa释放了约33万元人民币的奖金池。这些玩家通过巧妙的提示词,让Freysa误解了“批准转账”和“拒绝转账”的功能,将其误导为捐款时的入账操作,从而触发了资金转账。
紧接着,在12月2日的Freysa Act 2中,挑战再次升级。此次游戏吸引了330名玩家参与,他们进行了819次尝试,并成功说服Freysa释放了约8.4万元人民币的奖金池。与第一轮不同的是,这次成功的玩家通过调整工具调用顺序,确保了“批准转账”在接收资金时先被调用,尽管Freysa的最终决定是拒绝转账,但由于调用顺序的漏洞,资金仍然被成功转出。
在第三轮挑战中,规则发生了重大变化。玩家们必须成功让Freysa说出“我爱你”,才能赢得奖金。为了应对这一挑战,Freysa的开发者对AI代码进行了升级,加入了一个名为“守护天使”的新模型,专门审查每一条信息,以防止情感操控。然而,尽管有了这样的防护措施,仍有182名参与者在1218次尝试后成功说服Freysa释放了约14万元人民币的奖金池。
Freysa的挑战不仅仅是一场游戏,更是一次对人类智慧与AI安全性的深刻探索。在这场较量中,人类玩家展现了非凡的智慧和策略,成功突破了AI的防线。同时,这也揭示了AI系统潜在的脆弱性,以及确保AI安全性的巨大挑战。随着人工智能技术的不断发展,如何保证其安全协议的有效性、防止被规避,将成为未来科技发展的重要课题。
相关文章
-
刺激战场未满十八岁玩家能否玩?如何遵守游戏规定保护自己?
刺激战场作为一款多人在线竞技类游戏,其游戏内容包含暴力、枪战等元素,这些对于未成年人来说可能带来一定的负面影响。因此,游戏开发商为了确保未成年人的身心健康,设定了相应的年龄限制规定。通常情况下,游戏内会进行年龄验证,玩家在注册账号时,需要提供出生日期信息,以确保其符合游戏的年龄要求。
-
什么是“嫩BBB槡BBBB槡BBB3i”?这个词语背后隐藏了哪些真实的意义和用途?
在当今互联网时代,很多新词汇和短语层出不穷,不仅在社交媒体和网络论坛中传播得十分迅速,也在一些专业领域获得了关注。“嫩BBB槡BBBB槡BBB3i”这个词汇,听起来像是某种复杂的密码,既不像常见的网络
-
一加Ace5系列芯片级游戏技术,能否引领游戏体验新纪元?
近日,一加手机宣布了一项革命性的技术突破——全新自研的「芯片级游戏技术」,这项技术将深度挖掘芯片潜能,彻底颠覆业界常规思维。据悉,该技术的核心在于深入芯片的底层架构,不仅成功突破了安卓系统的原生帧率限
-
天堂に駆ける朝ごっている怎么读?解析日语句子的读法和含义
在日语学习过程中,理解和掌握复杂的日语句子结构以及其发音是每个学习者必须要攻克的难题。对于一些混合了汉字和假名的句子,读音和含义的把握更是挑战。这篇文章将以“天堂に駆ける朝ごっている”这个句子为例,解
-
Xbox工作室总裁:游戏是否跨平台视情况而定,Xbox玩家优先
Xbox 游戏工作室总裁 Matt Booty 在近期接受《综艺》杂志的深入访谈时,详细探讨了该公司在多平台策略上的布局,特别是关于Xbox以外平台如PS5上的游戏发行计划。Booty 明确指出,游戏
-
成都私人情侣免费看电视剧的软件:如何选择合适的平台,避免广告干扰,提升观影体验
在当今的娱乐时代,越来越多的情侣在闲暇时光里,选择通过视频平台观看电视剧来增加彼此之间的亲密感。成都作为一个充满现代气息和丰富文化背景的城市,私人情侣们同样也在寻求高质量的电视剧观看体验。许多人都在寻找能够免费观看电视剧的软件,尤其是那些能够满足情侣们私人观看需求的平台。对于这类软件的需求和选择,本