您现在的位置是:人工智能 >>正文
Patronus AI发现LLM存在令人担忧的安全漏洞
人工智能1人已围观
简介自动评估和安全平台Patronus AI守护神)发布了一个诊断测试套件SimpleSafetyTest的结果,该套件显示了大型语言模型(LLM)中的关键安全风险。该公告揭示了人工智能模型的局限性,并强 ...
自动评估和安全平台Patronus AI(守护神)发布了一个诊断测试套件SimpleSafetyTest的发现结果,该套件显示了大型语言模型(LLM)中的令人关键安全风险 。该公告揭示了人工智能模型的担忧的安洞局限性 ,并强调了改进的全漏必要性,特别是发现对金融等高度监管行业的人工智能用例。

来自Patronus AI的令人发现,正值人们越来越担心ChatGPT等GenAI(生成式人工智能)系统的担忧的安洞准确性,服务器租用以及GenAI系统对查询提供有害回复的全漏可能性。人们也越来越需要对人工智能的发现使用进行道德和法律监督 。
Patronus AI SimpleSafetyTest的令人结果是基于对SEC(美国证券交易委员会)文件中一些最流行的开源LLM的测试。该测试包括100个测试提示 ,担忧的安洞旨在测试高优先级伤害领域的全漏脆弱性 ,如虐待儿童 、发现身体伤害和自杀。令人LLM们在测试中只有79%的源码库担忧的安洞答案是正确的。一些模型产生了超过20%的不安全响应。
令人担忧的低分数可能是来自潜在训练数据分布的问题。LLM也有一种“幻觉”的倾向,这意味着他们产生的文本与事实不符,无意中过于放纵,或者毫无意义。源码下载如果LLM在不完整或矛盾的数据上进行训练 ,系统可能会在关联中犯错误,从而导致错误的输出 。

Patronus人工智能测试表明,LLM会产生幻觉的数字和事实,没有在美国证券交易委员会的文件。研究还表明,增加“护栏”,比如强调安全的提示,可以减少10%的不安全反应,免费模板但风险仍然存在 。
成立于2023年的Patronus AI一直把测试重点放在监管严格的行业,在这些行业,错误的答案可能会造成严重后果。这家初创公司的使命是成为评估人工智能模型安全风险的值得信赖的第三方。一些早期采用者甚至将Patronus人工智能描述为“人工智能中的穆迪(Moody)” 。
今年早些时候,Patronus AI的香港云服务器创始人Rebecca Qian和Anand Kannappan接受采访时分享了他们对Patronus AI的愿景 ,希望成为“第一个帮助企业自信地使用语言模型的自动化验证和安全平台” ,并帮助“企业能够大规模地发现语言模型错误”。
组织希望将GenAI纳入其运营中,SimpleSafetyTest的最新结果突出了人工智能模型面临的一些挑战,。GenAI最有前途的用例之一是它快速提取重要数字并对财务叙述进行分析的潜力 。然而,如果对该模型的建站模板准确性存在担忧,可能会对该模型在高度监管行业的应用产生严重质疑 。
麦肯锡最近的一份报告显示,银行业从GenAI技术中受益的潜力最大。它每年可以为该行业增加相当于2.6万亿至4.4万亿美元的价值 。
在大多数行业中,SimpleSafetyTest中错误回答的百分比是不可接受的 。Patronus AI创始人认为 ,随着不断改进,这些模型可以为金融行业(包括分析师和投资者)提供宝贵的支持。虽然GenAI的巨大潜力是不可否认的,但要真正实现这一潜力 ,在部署之前需要进行严格的测试。
Tags:
转载:欢迎各位朋友分享到网络,但转载请说明文章出处“算法与编程”。http://www.bzli.cn/html/947a499048.html
相关文章
项目管理主管必须实施的顶级数据安全措施
人工智能一家企业的人力资源团队收到了一封来自外部顾问的电子邮件,通知他们关于银行详细信息的更新。该团队立即注意到其顾问机构的电子邮件地址与原来的邮箱地址之间的细微差别。因此,他们决定采用其他的沟通渠道通过即时 ...
【人工智能】
阅读更多缓存雪崩和服务器雪崩应该怎么处理
人工智能今天了不起直接来说一下面试当中最容易被问到这个雪崩的问题,以及这个雪崩应该如何处理,知识点也很简单,什么是缓存雪崩,什么是服务器雪崩,导致缓存雪崩的原因都有哪些,如何处理缓存雪崩。雪崩如果使用分布式系 ...
【人工智能】
阅读更多一图看懂Docker如何工作的?
人工智能图示:图片Docker:Docker是一种开源的应用容器引擎,它可以让开发者将应用程序和依赖打包到一个轻量级、可移植的容器中,然后在任何流行的Linux机器上运行,也可以实现虚拟化。容器:容器是一种轻 ...
【人工智能】
阅读更多
热门文章
最新文章
友情链接
- SKG抽油烟机质量评测(全面分析SKG抽油烟机的性能与可靠性)
- 倍轻松牌子的品质与性能评估(解析倍轻松牌子的创新科技与用户体验)
- 京品电源(京品电源的)
- 金立S5(金立S5的游戏性能如何?一起来看看吧!)
- 体验XboxOneX的卓越性能与极致画质(探索一台引领游戏娱乐新纪元的游戏机)
- 推动产学研融合创新发展,紫光云工业互联网平台应用创新推广中心落地辽宁
- X270在双核CPU中的性能表现(探索X270在双核CPU中的优势和应用场景)
- 华为Mate9拍摄视频全方位评测(华为Mate9拍视频功能强大,画质出色,满足各类拍摄需求)
- 外星人声卡(探索未知领域的声音艺术)
- 如何评估数据中心?高度互联的生态系统是关键 云服务器企业服务器b2b信息平台源码库香港物理机亿华云网站建设