站内搜索 | 手机版

智快网 - 新科技与新能源行业网络媒体

当前位置：智快网 > 行业 > 正文内容

OpenAI部署新监控，能否有效遏制o3和o4-mini生物风险？

发布时间：2025-04-17 07:31 来源：ITBEAR 作者：江紫萱

近期，人工智能领域的巨头OpenAI宣布了一项新举措，针对其最新研发的人工智能推理模型o3和o4-mini，部署了一套专门设计的监控系统。这一系统的主要目标是预防这些先进模型提供可能构成生物和化学威胁的有害建议。

OpenAI在一份安全报告中详细阐述了该系统的目的，即确保模型不会为潜在的恶意用户提供制造生物或化学武器的指导。据OpenAI介绍，尽管o3和o4-mini在性能上相较于之前的模型有了显著提升，但同时也带来了新的安全风险。

特别是o3模型，在OpenAI的内部基准测试中展现出了对回答有关生物威胁问题的高度能力。为了有效应对这一风险，OpenAI开发了名为“安全导向推理监控器”的新系统。该监控器经过专门训练，能够深入理解并遵循OpenAI的内容政策，实时监控o3和o4-mini的运行状态。

安全导向推理监控器的核心功能是识别与生物和化学风险相关的关键词或提示，一旦检测到这些风险信号，就会指示模型拒绝提供相关的建议。为了验证这一系统的有效性，OpenAI的红队成员投入了大量时间，标记了o3和o4-mini中涉及生物风险的“不安全”对话，并进行了模拟测试。

测试结果显示，在模拟安全监控器的“阻断逻辑”测试中，模型成功拒绝回应风险提示的比例高达98.7%。然而，OpenAI也坦诚地指出，这一测试并未涵盖用户在被监控器阻断后尝试使用新提示词的情况。因此，OpenAI表示将继续结合人工监控手段，以弥补这一潜在漏洞。

值得注意的是，尽管o3和o4-mini尚未达到OpenAI设定的生物风险“高风险”阈值，但与早期的o1和GPT-4相比，它们在回答关于开发生物武器的问题时表现出了更高的帮助性。OpenAI正在密切关注其模型可能如何被恶意用户利用，以更容易地开发化学和生物威胁。

为了降低模型带来的风险，OpenAI正越来越多地依赖自动化系统。例如，在防止GPT-4o的原生图像生成器创建儿童性虐待材料（CSAM）方面，OpenAI已经采用了与o3和o4-mini相似的推理监控器技术。

然而，并非所有人都对OpenAI的安全措施感到满意。一些研究人员对OpenAI在安全问题上的重视程度提出了质疑。特别是OpenAI的红队合作伙伴Metr表示，他们在测试o3的欺骗性行为基准时，由于时间限制，未能进行全面深入的评估。OpenAI还决定不为其最新发布的GPT-4.1模型发布安全报告，这一决定也引发了一些争议。

尽管如此，OpenAI仍在不断努力提升其模型的安全性，以确保人工智能技术的健康发展。

更多>同类内容

苹果Vision Air头显来袭：钛金属机身配深蓝新色，定位有何新变化？

04-17

OpenAI发布Codex CLI：终端上的推理智能体，现已完全开源

04-17

上汽集团大动作：国际与自主板块合并，研发总院整合进行中

04-16

一加13T小屏旗舰来袭，首发大型手游原生级120帧+1.5K画质体验

04-16

苹果地球日特惠：回收旧设备，立享配件9折优惠！

04-16

零跑B01纯电轿车工信部亮相，激光雷达版引关注

04-16

零跑汽车App故障，车主遭遇解锁难题？

04-16

大疆禅思S1无人机探照灯发布：7988元，照亮500米夜空，夜间作业新利器

04-16

红魔电竞小平板来袭！骁龙8至尊版加持，游戏性能再突破？

04-16

鸿蒙智行发布会：余承东亮出问界M8、享界S9，还有神秘新成员尚界！

04-16

京东3C数码新品战略升级，加速换新计划引领行业新增长

04-16

问界M8小艺升级，智慧搜歌一路畅聊，家庭出行更添温馨

04-16

“玲龙一号”小型堆主泵吊装成功，核能发电新纪元即将到来！

04-16

问界M8火爆上市！8分钟大定破8千，安全配置成家庭首选

04-16

腾势N9刷新鱼钩测试纪录，180km/h高速稳定性赶超保时捷卡宴！

04-16

点击查看更多 +

全站最新

谷歌Gemini Live功能大放送，安卓用户可免费体验实时屏幕识别

谷歌Gemini Live功能大放送，安卓用户可免费体验实时屏幕识别

苹果用户转投OPPO新旗舰，Find X8系列门店现“果潮”？

苹果用户转投OPPO新旗舰，Find X8系列门店现“果潮”？

2024胡润品牌榜出炉：抖音夺冠，华为小米重返前十

2024胡润品牌榜出炉：抖音夺冠，华为小米重返前十

胡润2024品牌榜揭晓：茅台蝉联冠军但品牌价值大幅缩水

胡润2024品牌榜揭晓：茅台蝉联冠军但品牌价值大幅缩水

《惊变28年》先导预告来袭，经典续作6月震撼上映！

《惊变28年》先导预告来袭，经典续作6月震撼上映！

五一火车票开售，铁路部门：官方购票更安心，避免损失

五一火车票开售，铁路部门：官方购票更安心，避免损失

尼康Z5II：色彩科学引领，重塑影像创作新境界

尼康Z5II：色彩科学引领，重塑影像创作新境界

Xbox总裁详解：Game Pass非万能钥匙，玩家应按需选择

Xbox总裁详解：Game Pass非万能钥匙，玩家应按需选择

热门内容

本栏最新

苹果Vision Air头显来袭：钛金属机身配深蓝新色，定位有何新变化？

苹果Vision Air头显来袭：钛金属机身配深蓝新色，定位有何新变化？

OpenAI发布Codex CLI：终端上的推理智能体，现已完全开源

OpenAI发布Codex CLI：终端上的推理智能体，现已完全开源

上汽集团大动作：国际与自主板块合并，研发总院整合进行中

上汽集团大动作：国际与自主板块合并，研发总院整合进行中

一加13T小屏旗舰来袭，首发大型手游原生级120帧+1.5K画质体验

一加13T小屏旗舰来袭，首发大型手游原生级120帧+1.5K画质体验

苹果地球日特惠：回收旧设备，立享配件9折优惠！

苹果地球日特惠：回收旧设备，立享配件9折优惠！

零跑B01纯电轿车工信部亮相，激光雷达版引关注

零跑B01纯电轿车工信部亮相，激光雷达版引关注

零跑汽车App故障，车主遭遇解锁难题？

零跑汽车App故障，车主遭遇解锁难题？

大疆禅思S1无人机探照灯发布：7988元，照亮500米夜空，夜间作业新利器

大疆禅思S1无人机探照灯发布：7988元，照亮500米夜空，夜间作业新利器

智快实验室评测约稿合作微信：netspread（注明:智快科技）简体繁体根据客户端智慧切换，如显示有问题，请点击页面右上角的简繁切换功能！
Copyright © 2016-2021 zhikuai.com All rights reserved. 鲁ICP备20033456号

微信群

微信扫一扫
加微信拉群
电动汽车群
科技数码群