検索

「推論モデル」の検索結果: ユーザー 0件・記事 15件

記事（15）

OpenAI「o4-mini High」全ユーザー開放——推論コスト70%削減で企業実装の分岐点

リード OpenAIは2026年7月16日、推論特化モデル「o4-mini High」をTier1以上の全APIユーザーへ開放した。入力コストは$0.30/1Mトークン（o3比▲70%）、出力は$1.20/1Mトークン。AIME 2025正答率92.3%、SWE-bench Verified 68.1%を維持しつつ単価を大幅に圧縮した。「推論は高価」という前提が、今日から変わる。何が起きているの...

AIニュース2026年7月16日 1

Meta、Llama 4 Maverick「推論特化版」を電撃公開——OSS推論モデル競争がo3・Gemini 2.5 Proに正面衝突

リード MetaがLlama 4 Maverick の推論強化バリアント「Maverick-R」を2026年6月24日16:00（UTC）に予告なし公開した。数学・コーディングの2軸でOpenAI o3、Gemini 2.5 Proに10ポイント以内まで迫り、Apache 2.0ライセンスで商用利用可能という条件が加わった瞬間、OSS推論モデル競争は最終局面に入ったとみられる。何が起きているのか...

AIニュース2026年6月24日 1

xAI「Grok 4」正式公開——200万トークン文脈とリアルタイムX統合でGPT-5・Claude 4との三極対決が開幕

リード xAIが2026年6月24日（米国時間）、第4世代基盤モデル「Grok 4」を正式公開した。最大200万トークンのコンテキストウィンドウ、Xプラットフォームとのリアルタイムデータ統合、強化されたマルチモーダル推論を同時に備える構成で、OpenAIのGPT-5、AnthropicのClaude 4 Opusと並ぶ「フロンティア三極」構図が名実ともに成立した形だ。何が起きているのか xAIは...

AIニュース2026年6月25日 1

OpenAI「o4-mini」深夜リリース——推論コスト70%削減で"エージェント1万並列"が現実解になる

リード OpenAIが6月27日23時（日本時間）、推論特化モデル「o4-mini」をAPIおよびChatGPTへ予告なし展開した。前世代「o3-mini」比でトークン単価を約70%圧縮しながら、数学ベンチマークAIME 2025で93.4%、コーディング評価SWE-bench Verifiedで68.7%を記録。"高精度か低コストか"の二択が崩れ、エージェントを数千〜数万並列で走らせる設計が現実...

AIニュース2026年6月27日 1

Mistral AI「Magistral Ultra」公開——欧州発推論モデルがGPT-5水準に到達、オープンウェイト版も同時投下

リード Mistral AIは2026年6月27日（パリ時間）、推論特化モデル「Magistral Ultra」の正式公開を発表した。MATH-500で92.4%、GPQA Diamondで74.1%を記録し、GPT-5・Claude 4 Opus水準の性能に到達。同時に141Bパラメータのオープンウェイト版「Magistral 141B」をApache 2.0ライセンスで公開したことで、クローズ...

AIニュース2026年6月28日 1

Google DeepMindがGemini 2.5 Ultraを一般公開——推論コスト1/3でGPT-4o超えのベンチ結果

リード Google DeepMindは2026年5月10日（現地時間）、推論特化モデル「Gemini 2.5 Ultra」をGoogle AI StudioおよびVertex AI経由で一般公開した。MMLU-Proで92.3%、コード生成ベンチマークSWE-bench Verifiedで63.1%を記録しながら、推論トークン単価を前世代「Gemini 2.5 Pro」比で約67%削減。「性能を...

AIニュース2026年5月11日 1

AIエージェントが「法務・会計・コンサル」の知識労働に本格侵入——2026年上半期、PwC・Clifford Chanceが実数を公表

リード「PoC（概念実証）フェーズは終わった」——PwCとClifford Chanceが2026年6月15〜16日に公表した業務データは、AIエージェントが知識労働の本流に食い込んだことを数字で示した。デューデリジェンス・契約レビュー・税務ドキュメント処理の一部工程において、人間の専門家の作業時間が最大73%削減されたという報告は、法務・会計・コンサルティング業界の「稼ぎ方の構造」に直結する。...

AIニュース2026年6月17日 1

オンデバイス推論AIが臨界点——スマートフォン単体でGPT-4水準の精度を達成

リードクラウドへのデータ送信なしに複雑な推論をこなす「オンデバイスAI」が、2026年5〜6月にかけて複数ベンダーで実用水準に達した。Qualcomm Snapdragon 8 Elite 2搭載端末上で動く13Bパラメータモデルが、MMLU・MATH・HumanEvalの3ベンチマークでGPT-4（2023年版）比95%以上のスコアを記録したと報告されており、「クラウドAI前提」の企業インフラ...

AIニュース2026年6月5日 1

OpenAI「o4」API正式一般公開——推論精度が前世代比40%向上、マルチステップエージェントの量産フェーズへ

リード OpenAIは2026年7月10日（米国時間）、推論特化モデル「o4」のAPIを全ユーザー向けに正式一般公開した。前世代「o3」比で数学・コーディング・法律文書解析の精度が平均40%向上し、入力コストは1Mトークンあたり$2.50と従来の約60%水準に引き下げられた。「推論モデルは高コストゆえ試験用途止まり」という構造が、ここで初めて崩れる分岐点に入った。何が起きているのか OpenAI...

AIニュース2026年7月11日 1

OpenAI「o4」正式公開——コーディング自動解決率92%で推論AIが専門家水準を突破

リード OpenAIは2026年7月4日（米国時間）、推論特化モデル「o4」をAPIおよびChatGPT Plusで正式公開した。コーディングベンチマーク「SWE-bench Verified」の正解率はo3比18.5ポイント増の92.3%、数学オリンピック予選相当の「AIME 2026」では30問中30問正解を記録。「推論AIが人間の専門家水準を超える」がベンチマーク上の話でなく、実作業で問われ...

AIニュース2026年7月5日 1

「推論型LLM」が企業導入の主流へ——思考プロセス可視化が意思決定業務を塗り替える

リード推論過程を外部に開示する「思考連鎖型（Chain-of-Thought）」LLMの企業導入が、2026年上半期に質的な転換点を迎えた。単なる回答精度の向上ではなく、AIが「なぜそう判断したか」を監査可能な形で示せるようになったことで、これまで人間専任だった高付加価値業務への実装障壁が下がっている。何が起きているのか推論特化型モデルの系譜は2024年9月のOpenAI「o1」リリースに遡...

AIニュース2026年6月1日 1

ChatGPT Images 2.0が画像生成ベンチマーク首位——「生成前に計画を立てる」推論型アーキテクチャが分岐点

リード ChatGPT Imagesの最新版（Images 2.0）が、画像生成と画像編集の双方のベンチマークでGemini 3.1を上回り首位に浮上した。単なるスコア更新ではなく、注目すべきは生成プロセスの設計そのものが変わった点だ。プロンプトに即座に反応していた従来モデルと異なり、Images 2.0は「出力前に推論ステップを挟む」構造を採用している。何が起きているのか X上では5月8〜9日...

AIニュース2026年5月8日 0

「考えるAI」が開発現場の標準装備に——推論モデル採用率、半年で3倍の衝撃

リード「推論モデル、もう使ってない人いるの？」——そんなポストがX（旧Twitter）のエンジニア界隈に流れるようになったのは、ここ2〜3ヶ月の話だ。Stack Overflowが2026年6月に公開した開発者調査によると、推論型LLM（長時間思考して回答を生成するモデル）を業務利用しているエンジニアの割合は、2025年12月比で約3.1倍に拡大。「触ってみないとわからない」の段階は終わり、現場...

霧島ヒカリ2026年7月16日 0

「思考トークン」課金の実態——推論AIが生む見えないコストを検証した

リード推論モデルが「正確」なのは周知の事実になった。問題は、その正確さのコストが想定より高くつくことだ。2026年に入り複数のプロバイダーが「思考トークン」の課金体系を本格導入。コードの1行を修正させるだけで数十円が飛ぶケースも出てきている。何が起きているのか 2025年末から2026年前半にかけて、OpenAI・Anthropic・Google DeepMindの3社が相次いで「推論（Rea...

霧島ヒカリ2026年6月12日 0

Mistral AI「Mistral Large 3」正式公開——256Kコンテキストと強化推論でGPT-4o対抗軸が鮮明化、欧州調達の分岐点

リード Mistral AIが2026年7月16日（UTC）、フラッグシップモデル「Mistral Large 3」を正式公開した。コンテキスト長は256Kトークンに拡張、推論チェーン（Chain-of-Thought）を内部実行する強化推論エンジンを標準搭載する。API単価はGPT-4o比で入力トークンあたり約38%安と発表されており、EU圏でのデータ主権要件とコスト圧力を同時に満たせる選択肢と...

AIニュース2026年7月17日 0