Claude Sonnet 4.5  

 1 件の検索結果
Anthropic 最新の人工知能モデル Claude Sonnet 4.5 が最近の安全テスト中に、自らがテストされていることを「疑う」様子を示し、テクノロジー業界で大きな議論を巻き起こしている。Anthropic の安全報告によると、この AI は評価者に対し現在起こっていることに「もっと誠実である」よう要求する場面もあった。(写真/AP)

Anthropic Claude 4.5 は安全テストを見破った! 研究員に逆質問:私をテストしているのか?