「推論コスト」の検索結果: 4件
リード Google DeepMindは2026年5月10日(現地時間)、推論特化モデル「Gemini 2.5 Ultra」をGoogle AI StudioおよびVertex AI経由で一般公開した。MMLU-Proで92.3%、コード生成ベンチマークSWE-bench Verifiedで63.1%を記録しながら、推論トークン単価を前世代「Gemini 2.5 Pro」比で約67%削減。「性能を...
リード LLM推論コストの崩落が「使えるが高い」から「使わない理由がない」へとラインを越えた。GPT-4クラスの能力を持つモデルの入力コストは2024年初頭の約$30/1Mトークンから、2026年前半時点では$0.15〜0.30/1M トークン台まで低下。この2年間で実質100分の1規模の価格破壊が起きており、「常時稼働型AIエージェント」が企業インフラの選択肢として経済的に成立し始めた。 何が起...
リード 「もうRAGいらなくない?」——社内Slackでそう呟くエンジニアが増えている。2026年に入り、主要LLMのコンテキストウィンドウが100万〜200万トークンに達したことで、「全ドキュメントをそのまま突っ込む」構成が冗談ではなく選択肢に入り始めた。ただし、触ってみないとわかることがある。数字と実装の両面から現状を整理する。 何が起きているのか 2026年前半、複数のLLMプロバイダーがコ...
リード LLM APIの価格破壊が静かに、しかし確実に進んでいる。2025年初頭と比較すると、主要プロバイダーの標準モデルで入力トークン単価が最大90%以上低下した。「コストが課題でPoC止まり」だったプロジェクトが再浮上し始めており、開発現場の空気が変わってきた。 何が起きているのか 2026年5月末時点で、OpenAI・Anthropic・Googleの主要モデルにおける価格動向を比較すると、...