Anthropic PBC正广泛发布Mythos模型的一个版本,该版本将被禁止执行网络安全任务。数月前,该公司曾警告称,这款强大的人工智能模型能够发现并利用关键软件中的漏洞。
这款名为Fable 5的新模型将于周二推出,并配备防护措施,防止其回应某些类型的询问,包括与网络安全和生物学相关的询问。Anthropic表示,在这些情况下,其Claude聊天机器人将通过另一款名为Opus 4.8的模型来处理回应。
Anthropic还将发布不带部分防护措施的同一模型,名为Mythos 5,作为Mythos新版本。它将对能够通过一项名为Project Glasswing的计划使用具备网络能力模型的群体开放。上周,Anthropic又将150家组织加入了可使用Mythos的公司名单,使总数达到约200家。
近几个月来,随着这家总部位于旧金山的公司推进首次公开募股,Mythos已成为关注焦点。该公司作出了一项不同寻常的决定,将该模型的访问权限限制在选定合作伙伴范围内,理由是担心它“在用户指示下,可以识别并利用每一种主要操作系统和每一种主要网络浏览器中的漏洞”。不过,与竞争对手一样,Anthropic也在努力开发在一系列利润丰厚的任务上能力更强的模型,包括编码、金融和网络安全。
该公司表示,Fable 5旨在更擅长编码和其他专业任务,尤其是在比以往模型更长的时间内解决棘手问题方面。
Anthropic称,在对这款新软件的一项测试中,支付处理商Stripe能够在一天内完成一项耗时较长的软件工程任务,而如果由一个团队手动完成,本来需要两个月。该公司还表示,Mythos就一种大肠杆菌蛋白的新机制提出的假说,已在一个研究同一问题的实验室发表的研究论文中得到证实。
为了测试Fable 5的防护措施是否有效,Anthropic表示,其在内部开展了一项漏洞奖励计划,以寻找越狱该模型、或绕过其防护措施的方法。在超过1000小时的测试中,红队成员没有发现任何通用越狱方法。
上一篇:内蒙古六少年将为世界杯揭幕战护旗