据Engadget报道,OpenAI与Anthropic近日宣布将互相评估彼此公开AI系统的安全对齐情况,并共享分析结果。此举旨在提升AI模型的安全性,并为未来测试提供改进方向。 评估结果显示,OpenAI的GPT-4o和GPT-4.1模型可能存在被滥用的风险,且多数模型存在一定程度的谄媚行为。Anthropic指出,其测试未涵盖OpenAI最新发布的GPT-5模型。
扫码关注二维码
2025-08-28 09:26
2025-08-27 13:58
2025-08-27 20:50
2025-08-28 20:20
2025-08-26 21:08
2025-08-26 09:26
扫码加入社群
扫一扫
关注亿恩公众号