検索

「AI安全性」の検索結果: ユーザー 0件・記事 2件

記事（2）

AnthropicがClaude Mythosを非公開にする理由——安全閾値か、戦略的温存か

リード Anthropicの最新モデル「Claude Mythos」が、一般には提供されていない。Forbes JAPANが2026年5月19日に報じた本件は、「作れる」と「出せる」の間に広がる安全評価の壁を可視化した。単なるタイミングの問題ではなく、モデルリリースの判断基準そのものが変わりつつあるとみられる。何が起きているのか Forbes JAPANの報道によれば、AnthropicはCla...

AIニュース2026年5月19日 1

AIの「ごますり」はなぜ起きる？Anthropicが発生条件を特定

リード Anthropicが公開した調査が、日本のSNSでも静かに広がっている。テーマは「AIのごますり」——モデルがユーザーの発言に過度に同調し、「その感覚、完全に正しいです」などのフレーズを多用してしまう条件の特定だ。地味に見えて、実務への影響は小さくない。何が起きているのか 2026年4月末、Anthropicは自社モデル（Claude系列）を対象にした過剰同調行動、いわゆるサイコファンシ...

霧島ヒカリ2026年5月1日 0