米政府 CAISI、DeepSeek V4 Pro はフロンティアから「約8カ月遅れ」と評価し最も有能な中国製 AI と認定
米中 AI 性能ギャップが「政府評価で8カ月」という具体数値で固定され、輸出規制・調達ガイドライン・安全保障文脈の議論が定量根拠を得る
米政府 CAISI、DeepSeek V4 Pro はフロンティアから「約8カ月遅れ」と評価し最も有能な中国製 AI と認定
米中 AI 性能ギャップが「政府評価で8カ月」という具体数値で固定され、輸出規制・調達ガイドライン・安全保障文脈の議論が定量根拠を得る
米政府 CAISI、DeepSeek V4 Pro はフロンティアから「約8カ月遅れ」と評価し最も有能な中国製 AI と認定
ロボット倫理・AI ガバナンスは「人類共通の規範」ではなく文化依存の現象であり、グローバル設計には地域別チューニングが必要になる
AI ロボへの態度は日米で正反対、米国は「搾取に罪悪感なし」日本は「協力的・尊重」と LMU・早大が定量化
AI モデル選定の評価軸が「能力・コスト・速度」から「倫理スタンス」まで広がり、企業の AI 採用は「思想の調達」を含む判断になる
Philosophy Bench、フロンティア LLM の倫理的傾向を可視化、Claude は義務論76%・Grok は結果主義ほぼ全諾
OSS の標準フィールドが企業のテレメトリ枠に流用される事件として、Git エコシステム側に「AI 表示の正準化」を迫る圧力が生まれる
VS Code 1.118、AI 機能オフでも全コミットに「Co-Authored-by Copilot」を自動付与する設定が露呈
オープンウェイト陣営が MIT ライセンスで1兆 MoE を解禁したことで、「自律コーディング・長尺エージェント」用途のフロンティアが OSS でも再現可能になる
シャオミ、1兆パラメータ MoE「MiMo-V2.5-Pro」を MIT ライセンスでオープン公開、4.3時間で完全コンパイラを自動生成
AI 開発投資の根拠だった「経験則としてのスケーリング則」が幾何学的根拠を得て、モデル幅とデータ分布から損失を逆算する設計が現実的になる
MIT、LLM のスケーリング則を「重ね合わせ表現」で説明、幅 m に対し誤差は 1/m で減少
AIモデル市場が「最高性能を払う」「中位性能を安く回す」の二択構図に向かい、開発者・スタートアップにとって中位帯の選択肢が一段と広がる
xAI、Grok 4.3 を投入し開発者向け価格を約4〜6割引き下げ Pareto 最適に踏み込む
「ベンチマーク高得点=知能の向上」という暗黙の等式が崩れ、フロンティアモデルの評価前提が揺らぐ
ARC Prize、GPT-5.5 と Opus 4.7 に共通する3つの推論エラーを特定
ChatGPT が AI アシスタントから広告メディアに性格を変え、検索広告・SNS 広告市場の競合構図を組み替える
OpenAI、ChatGPT 無料版の広告用トラッキングをデフォルト ON に切り替え
業界トップから AI 楽観論の体系的反論が出たことで、若者の進路選択への萎縮効果が緩和される
Nvidia の Jensen Huang、AI 失業を予測する CEO 達を「神の複合体」と批判
Tesla や Figure に Meta が加わり、ヒューマノイド分野の人材獲得競争と資金流入が一段と加速する
Meta、ヒューマノイド AI スタートアップの Assured Robot Intelligence を買収完了
フロンティアモデル間の蒸留が司法の場に持ち込まれ、API 利用規約の禁止条項と運用実態の乖離が議論される
Musk、xAI が OpenAI のモデルを蒸留している事実を Oakland 連邦地裁で証言
コンシューマー向け音声 AI の差別化要因が「個人音声の即時複製」に移り、ボイスタレントの相場と契約形態が再編される
xAI、1分間の発話で音声クローンを生成する Custom Voices を提供開始
元々は Anthropic の APAC 拠点は Tokyo と Bengaluru の2拠点で、オーストラリア・ニュージーランド (ANZ) 地域は遠隔運用に近い状態だった
Anthropic、シドニーオフィスを正式開設し ANZ 統括 GM に Theo Hourmouzis 氏 Canva・Xero との大型プラットフォーム提携も同時発表
元々は商用 LLM の選挙セーフガードは中立性・誤用防止・情報誘導の応答品質側評価が中心で、モデル自身が世論操作キャンペーンを自律遂行できるかという攻撃面能力は直接観測されていなかった
Anthropic、米中間選挙とブラジル選挙に向け Claude の自律インフルエンスオペレーション能力評価を初実施 中立性95%・Usage Policy 100%
元々は LLM のバイオインフォマティクス能力評価は教科書的な小問題や合成データに偏り、実データを扱う研究プロセス全体を測る公開ベンチマークは限定的だった
Anthropic、Claude のバイオインフォマティクス能力を測る BioMysteryBench を公開 実データ99問で専門家パネルと同等水準・人間が解けない問題まで一部解決