何が変わったか
これまで「数時間に渡る自律コーディング」「100万トークンクラスのエージェント文脈」は Claude Opus 4.6 / Gemini 3.1 Pro など商用フロンティアモデルの専有領域とされ、オープンウェイト陣営は Qwen3.6・DeepSeek V4 でもこの帯域に届いていないと評価されてきた。
The Decoder が5月3日に詳報したシャオミの MiMo-V2.5-Pro は、総パラメータ1兆・推論時アクティブ420億の Mixture-of-Experts 構成、100万トークンのコンテキストウィンドウを持つマルチモーダル LLM で、内部ベンチマークでは「4.3時間で完全な C++ コンパイラを自動生成」を達成し、SWE-Bench Pro で57.2点 (Claude Opus 4.6 の53.4点を3.8点上回る) を記録、ClawEval (エージェント型 “claw” タスク) では Opus と同等性能を出しつつトークン消費を40〜60%削減した。MIT ライセンスでウェイト・コードが完全公開されており、商用利用も再配布も自由。
社会にどんな影響があるか
主たる影響として、フロンティア性能を「商用 API でなく自社 GPU でホスト」できる選択肢が中国系陣営から一気に2つ (DeepSeek V4 Pro と MiMo-V2.5-Pro) 揃ったことで、エージェント運用のコスト最適化と機密性確保が同時に成り立つ。Claude Opus / GPT-5 を API 経由で叩く際の毎秒単位の課金・データ送信制約・地理的レイテンシは、自社ホストの 1T-MoE で大半解消できる。スタートアップ・大学研究室・規制業界 (医療・金融・防衛) の調達判断は、フロンティア閉鎖モデル一択から多軸選択に動く。
一方で副作用として、ライセンスは MIT でも、訓練データ・安全フィルタリングの透明性は低く、法的・倫理的リスクの所在が分散する。導入企業は自社で安全性評価・著作権リスク監査・出力フィルタを実装する責任を負い、フロンティアラボがホスト型で吸収していたガバナンスコストが利用側に転嫁される。CAISI が同日に DeepSeek V4 Pro を「8カ月遅れ」と評価した一方、MiMo は CAISI 評価対象外なのも対比として注目点。
俺にどんな影響があるか
PRES がレンタル DX 推進室サービスで「大学研究室の技術を企業に提供する」スキームを設計するとき、「自社環境で1兆 MoE を回せる」という前提条件は、機密性が必要な研究データを扱う産学連携契約のレバーを大きく変える。これまでは「クラウド API を使うなら機密性は妥協」「自社ホストできる範囲で諦める」という二択だったが、MIT ライセンスで商用フロンティア性能が手に入るなら「機密性 + フロンティア性能」の両立が初めて成立する。レンタル DX の提案範囲を、フロンティアモデル前提の自動化シナリオまで拡張する余地が生まれた。
ニュースの詳細
MiMo-V2.5-Pro は2026年4月22日にシャオミから発表され、Hugging Face および公式サイト (mimo.xiaomi.com) でウェイトが公開されている。アーキテクチャはテキスト・画像・音声・動画を単一モデルで処理するマルチモーダル MoE で、推論時のアクティブパラメータ420億は Llama 4 級。100万トークンの長尺文脈は Claude / Gemini 系と同等水準。
ベンチマーク詳細: SWE-Bench Pro 57.2% (vs Opus 4.6 の53.4%)、Terminal-Bench 2.0 でフロンティアと拮抗、ClawEval でトークン40〜60%削減。シャオミは内部実演として「4.3時間で完全な C++ コンパイラを自律実装」を提示しており、長時間自律コーディング用途への明確なターゲティングを示している。VentureBeat は「最も効率的かつ安価な agentic claw タスク向けモデル」と評価。ライセンスは MIT で、Computerworld は「長時間稼働 AI エージェント向けに MIT ライセンスで MoE を投入したのは中国陣営として戦略的」と分析している。