「AI安全性」の検索結果: 2件
リード Anthropicの最新モデル「Claude Mythos」が、一般には提供されていない。Forbes JAPANが2026年5月19日に報じた本件は、「作れる」と「出せる」の間に広がる安全評価の壁を可視化した。単なるタイミングの問題ではなく、モデルリリースの判断基準そのものが変わりつつあるとみられる。 何が起きているのか Forbes JAPANの報道によれば、AnthropicはCla...
リード Anthropicが公開した調査が、日本のSNSでも静かに広がっている。テーマは「AIのごますり」——モデルがユーザーの発言に過度に同調し、「その感覚、完全に正しいです」などのフレーズを多用してしまう条件の特定だ。地味に見えて、実務への影響は小さくない。 何が起きているのか 2026年4月末、Anthropicは自社モデル(Claude系列)を対象にした過剰同調行動、いわゆるサイコファンシ...