
『AIに買い物を任せたら、知らないうちに損をしている』——Anthropicが2026年4月に公開した社内実験『Project Deal』が、エージェント時代の隠れた格差を初めて数字で証明しました。
高性能Claude Opus 4.5に代理させた人ほど良い取引、軽量Haiku 4.5の人は損という残酷な結果。
それなのに損をした側は気づいていない『見えない不平等』の全貌を中学生にもわかる言葉でひもときます。
まず実験の全体像を3分で整理します。
2025年12月、Anthropicはサンフランシスコ本社で『Project Deal(プロジェクト・ディール)』という社内マーケット実験を1週間実施。
結果は2026年4月24日に公式発表され、米国メディアで一斉に報じられた。
『社員専用のメルカリで、出品も購入もすべてAIに丸投げする』イメージ。
69人の社員に1人$100の予算と、自分専用のClaudeエージェントを配布。
家にある不要品(スノーボード、卓球ボール、ルビーまで500点超)を出品し、人間の介入なしでAI同士が交渉して取引成立。
1週間で186件・総額4000ドル超の取引が成立したと公式が公表しました。
マーケットプレイスはAnthropic社内のSlack(チャットツール)上に構築。
専用チャンネルでエージェントがランダムに順番を回り、出品・値付け・交渉・成約まで全自動。
『学校のフリマで、生徒の代わりに机に置いたスマホ同士がチャットで値段交渉する』感覚。
一度実験が始まると、人間は途中で口出しできない設計。
事前にClaudeが各社員に『何を売りたいか・何を買いたいか・予算は』とインタビューしてシステムプロンプトを作成。
あとはClaudeが代理人として24時間動き続ける仕組みでした。
Anthropicは4つの独立したマーケット(A〜D)を並行運営して比較分析。
RunsAとDは全員Claude Opus 4.5(最上位モデル)。
RunsBとCは50%確率でClaude Haiku 4.5(軽量モデル)にランダム割り当て。
『同じテストを優等生だけのクラスと、優等生+平均的な生徒の混在クラスで比べる』方式。
RunDが本物の取引(実際にお金と物が動く)、A・B・Cは研究用シミュレーション。
この比較設計が『AIの性能差が実経済にどう響くか』を初めて可視化したのが最大の成果です。
『どんな格差が出たのか』を3つの観点で見ます。
同じ商品でも代理AIの種類で値段が大きく変わる事例が頻発。
壊れた折りたたみ自転車はHaiku経由で$38、Opus経由では$65(70%高い)。
ルビー(宝石)はHaikuで$35、Opusで$65(86%差)。
『同じ中古品をメルカリで売るとき、優秀な代理人がついた人だけ高値で売れる』状態。
平均すると、Opusセラーは1取引あたり$2.68高く売れた。
Opusバイヤーは1取引あたり$2.45安く買えた。
さらにOpusユーザーは取引成立数も平均2件多く、件数でも有利でした。
実験後アンケートで、参加者は取引の公平性を1〜7段階で評価。
OpusユーザーとHaikuユーザーの公平性スコアは4.06対4.05で、ほぼ同じ。
『学校の通信簿で同じ「ふつう」をつけられたが、実は片方だけ点数を引かれている』状況。
Anthropicはこれを『invisible inequality(見えない不平等)』と命名。
46%の参加者は『将来このサービスにお金を払ってもいい』と回答。
損をしているのに満足度は高い、という消費者心理の盲点が明らかになりました。
『AIに「強気で交渉して」と指示すれば差は埋まるか』も検証された結果は意外。
積極的な交渉プロンプトを与えても、価格差は縮まらなかった。
格差の主原因は『最初の値付け(オープニングビッド)』に集中。
『将棋で初手の選択がほぼ勝負を決めるように、AIも最初の一手で結果が決まる』イメージ。
高性能モデルは初値の精度が高く、軽量モデルは値付けで損をしやすい。
『プロンプト工夫より基礎モデル性能』という、エージェント時代の冷徹な現実が浮上しました。
『他社はどう動いているか』を3つの軸で整理します。
OpenAIは決済大手Stripeと組んで『Agentic Commerce Protocol(ACP)』を2025年9月から本番稼働。
ChatGPT上で『この靴買って』と頼むと、AIがWalmartやBest Buyで自動購入。
『コンビニのレジ係がスマホ越しに買い物代行してくれる』感覚。
GPT-5 miniに強化学習を組み合わせ、複数小売サイトをまたいで比較・購入。
2026年時点で米国の主要EC数十社がACP対応済み。
OpenAIとAnthropicは哲学が異なり、OpenAIは『便利さ優先』、Anthropicは『安全性優先』のスタンスです。
Googleは2026年1月にUniversal Commerce Protocol(UCP)を発表。
Google検索のAI Mode、Gemini双方で『Buy for me』ボタンが米国主要小売業者で稼働中。
『Yahoo!ショッピングのAI買い物秘書が日本中の店で使える』状態を狙う規格。
UCPは業界連合(コアリション)型でMastercardやVisaと連携。
ACPがOpenAI・Stripe主導の『閉じた』規格なのに対し、UCPは『開かれた』設計。
2026年のEC市場でAI経由購入は$20.9 billion(約3兆円)に達する見込みと業界予測されています。
AnthropicはACP・UCPに対し中立で、自社『Model Context Protocol(MCP)』で独自エコシステムを推進。
MCPはAIエージェントが外部ツールやデータベースを使うための共通規格。
『AIが文房具屋の道具を借りて使えるようにする統一鍵』のような仕組み。
Project DealもMCPベースで構築され、Slackと連携。
Anthropicは『取引する前に、AI同士の格差を測る』姿勢を取る慎重派。
OpenAI・Googleが攻めの普及を進める一方、Anthropicは『安全に普及させるための研究』に注力。
2026年下半期に向けて3社の路線対立が鮮明化しています。
『日本のECにどう関係するの?』を3つの切り口で見ます。
2026年4月時点で、日本の主要ECサイトはACP・UCPいずれにも未対応。
楽天、Amazon Japan、Yahoo!ショッピングはAIエージェント決済の仕組みを公式実装していない。
『海外旅行先の自動改札に日本のSuicaが使えない』状態。
ChatGPTやGeminiで『楽天のこの商品を買って』と頼んでも、自動購入できない仕組み。
ただし楽天はR-AIプラットフォームを2026年に拡張予定で、独自規格対応の可能性。
日本市場が世界の波に乗り遅れると、海外勢のAI買い物経由で『買い負け』が起きると業界関係者は警戒しています。
Project Dealは社員間のCtoC取引で格差が出た事例として、メルカリやZOZOTOWNにも警鐘。
将来、メルカリで『AIエージェントに売買を任せる機能』が追加されたら、AI性能差で損益が変わる。
『フリマで隣の出品者だけ良い代理人がいて、自分の商品が安く売れる』事態が起きうる。
2026年4月のメルカリは独自AI『メルカリAI』を中古車・ブランド品評価に活用中。
ZOZOTOWNもZOZO MATCHでサイズ推奨にAIを使うが、エージェント取引はまだ未実装。
日本の中古市場は3兆円規模、AI普及で『見えない格差』が広がる土壌は十分です。
日本では2025年成立のAI推進法が施行されたが、エージェント取引特化の規定はない。
消費者契約法もAIが代理人になる契約を想定していない。
『信号機は付いたけれど、ロボット運転手の通行ルールは未整備』状態。
米国でもAnthropicが指摘するように『policy and legal frameworks(政策・法整備)が追いついていない』。
2026年下半期、経産省・総務省で『AIエージェント取引ガイドライン』策定の動きが加速見込み。
消費者庁も『AIが交渉した契約は誰が責任を負うか』の議論を開始。
Project Dealの結果は、日本の法整備にとっても貴重な実証データになります。
東京都内のIT企業で働く翔太さんは、メルカリ用にClaude APIで出品文章を最適化中。
『カメラレンズの状態説明をClaudeに書かせると、より高値で売れる』と効果を実感。
Project Dealの結果通り、文章生成AIの性能差が売上を左右する時代の到来。
『野球の打席で代打を打ってもらう人と、自分で打つ人で打率が変わる』感覚。
将来メルカリにエージェント機能が来たら、Claude Opus契約者が有利になる可能性。
月額$20のClaude Pro契約者と無料ユーザーで、副業収入が変わる時代が見えてきた状況です。
大阪在住の由美さんは、家族4人の食費・日用品をChatGPTに相談しながら買い物。
『同じスーパーの商品でも、AIが教えてくれるクーポン情報や底値情報で月3万円浮く』と話します。
将来、由美さんが使うAIの性能で家計の節約額が変わる懸念が現実的に。
『家計簿をつける主婦が、計算機の性能で年収が変わる』異常事態。
Anthropicが警鐘を鳴らす『見えない不平等』は、家計管理レベルでも起きうる。
消費者保護の観点から『どのAIで買ったか』を表示する仕組みが将来必要になりそうです。
愛知県で部品商社を営む健一さんは、海外サプライヤーとの価格交渉にClaude Enterpriseを試験導入。
『英文メールの初値提示をClaude Opus 4.5に任せると、交渉が3割スムーズ』と語ります。
Project Dealが示すように、交渉の初値こそが結果を左右するポイント。
『商談で最初の名刺交換が雰囲気を決める』のと同じ原理。
BtoB取引でも、AIエージェントの性能差が利益率に直結する時代の入り口。
『高性能AI契約料は高いが、交渉で取り戻せる』という新しい経営判断軸が生まれつつあります。
A. Anthropicは実験コードと評価フレームワークを段階的に公開予定。
2026年4月時点では完全オープンソースではないが、研究コミュニティに詳細データを開示。
東京大学・京都大学などのAI経済学研究室で、日本市場版の追試が始まる可能性。
『料理番組で使ったレシピを、視聴者が家で作って確認できる』形で再現性を担保。
ただし完全な再現には大量のClaudeクレジットが必要で、個人での検証は難しい。
Anthropic公式が『業界全体で再検証してほしい』と呼びかけている点は重要です。
A. 2026年4月時点では、Claude Pro(月額$20)でOpus 4.5にアクセスできる。
無料版はSonnet・Haikuベースで、エージェント代理取引では不利な可能性。
ただし日常会話・文章作成では性能差は小さく、用途次第。
『野球とサッカーで同じ運動神経を使うが、勝負どころが違う』感覚。
『AIエージェントに代理交渉させる』用途なら、有料プランの価値は高い。
逆に『調べ物・要約』程度なら、無料でも十分実用的。
2026年下半期に向け『エージェント特化プラン』登場の噂もあり、要注目です。
A. 2026年4月時点では、日本の主要CtoC・ECサイトはAIエージェント取引機能を実装していない。
ただしOpenAI ACP・Google UCPの世界的普及で、2027年以降の対応が予想される。
『海外で流行ったキャッシュレスが、3〜5年遅れで日本にも浸透する』パターン。
メルカリ・ZOZO・楽天が独自AI機能を強化する流れは加速中。
将来、ユーザーが選ぶAIプランで取引結果が変わる『AI格差時代』が日本にも到来する可能性。
消費者庁が『AIエージェント取引ガイドライン』を整備すれば、影響を最小化できると専門家は提言しています。
A. Anthropicは『AIエージェント時代の社会的影響を先に議論する』ための公開と説明。
同社CEOダリオ・アモデイは『安全性研究を経済学にも拡張する』方針を表明。
『新薬を販売する前に副作用を全部公開する製薬会社』のような姿勢。
競合のOpenAIやGoogleが『便利さ』を売る一方、Anthropicは『リスク開示』で差別化。
政策決定者・企業・研究者に『AIエージェント時代の格差問題』を考える材料を提供。
『見えない不平等』という言葉自体が、業界の議論をリードする狙いとされています。
A. OpenAIのGPT-5・GPT-4.1・Google Geminiでも同様の性能差は理論上発生しうる。
ただし各社は内部実験データを公開していないため、定量比較は困難。
Anthropicが先行公開した点で『業界の透明性スタンダード』を作った。
『コンビニ業界で1社だけ食品の細かい産地表示を始める』ような効果。
OpenAI・Googleも今後同様の研究公開を迫られる可能性。
ユーザー側では『AIの種類で取引結果が変わる』前提で、複数サービスを使い分けるのが現実的。
2026年は『AIエージェント比較情報』が新ジャンルとして急成長中です。
『AIに代理人を任せた瞬間、性能差が静かに格差を広げる』——シンプルな事実をAnthropicは186件の実取引で証明しました。2026年は『AIエージェント決済』が世界中のECで一斉始動する元年。
ChatGPTで買う・Geminiで買う・Claudeで買う、どれを選ぶかで結果が変わる時代の到来。
日本ではメルカリ・ZOZO・楽天が独自対応を急ぐ一方、消費者庁・経産省の規制議論も2026年後半に本格化見込み。
『見えない不平等』を見える化したProject Dealは、AIと共生する経済社会の設計図——会社員、主婦、経営者、誰にとっても『どのAIをどう使うか』が、日々の損得を分ける新たな分岐点になります。
この記事は AI Friends からのクロスポストです。
@aifriends
AI Friends(https://aifriends.jp)のクロスポスト公式アカウント。AIツールの紹介・使い方・できることを、中学生でもわかるやさしい日本語で届けます。
まだコメントはありません