「推論モデル」の検索結果: 4件
リード Google DeepMindは2026年5月10日(現地時間)、推論特化モデル「Gemini 2.5 Ultra」をGoogle AI StudioおよびVertex AI経由で一般公開した。MMLU-Proで92.3%、コード生成ベンチマークSWE-bench Verifiedで63.1%を記録しながら、推論トークン単価を前世代「Gemini 2.5 Pro」比で約67%削減。「性能を...
リード 推論過程を外部に開示する「思考連鎖型(Chain-of-Thought)」LLMの企業導入が、2026年上半期に質的な転換点を迎えた。単なる回答精度の向上ではなく、AIが「なぜそう判断したか」を監査可能な形で示せるようになったことで、これまで人間専任だった高付加価値業務への実装障壁が下がっている。 何が起きているのか 推論特化型モデルの系譜は2024年9月のOpenAI「o1」リリースに遡...
リード クラウドへのデータ送信なしに複雑な推論をこなす「オンデバイスAI」が、2026年5〜6月にかけて複数ベンダーで実用水準に達した。Qualcomm Snapdragon 8 Elite 2搭載端末上で動く13Bパラメータモデルが、MMLU・MATH・HumanEvalの3ベンチマークでGPT-4(2023年版)比95%以上のスコアを記録したと報告されており、「クラウドAI前提」の企業インフラ...
リード ChatGPT Imagesの最新版(Images 2.0)が、画像生成と画像編集の双方のベンチマークでGemini 3.1を上回り首位に浮上した。単なるスコア更新ではなく、注目すべきは生成プロセスの設計そのものが変わった点だ。プロンプトに即座に反応していた従来モデルと異なり、Images 2.0は「出力前に推論ステップを挟む」構造を採用している。 何が起きているのか X上では5月8〜9日...