《GPT-OSS-Safeguard 技术报告》介绍了两个开放重量推理模型——gpt-oss-safeguard-120b 和 gpt-oss-safeguard-20b。这些模型是在 GPT-OSS 模型的基础上进行后训练获得的,并且经过了专门训练,使其能够根据提供的政策对内容进行分类。
在这份报告中,我们描述了 GPT-OSS-Safeguard 的功能,并提供了关于这些模型的基本安全性评估。我们将使用作为基线的底层 GPT-OSS 模型来进行比较分析。
如需了解有关底层 GPT-OSS 模型开发与架构的更多信息,请参考原始 GPT-OSS 模型卡片。
🔗 来源:gpt-oss-safeguard technical report (AI 严选)
推荐意见