マスク氏、Grok 4を「博士レベル」AIとして発表、人類最後の試験で44.4%の正答率、AIME満点を獲得

2025年7月21日午後4時23分（東部夏時間）

xAIの20万GPU Colossusクラスタをベースに構築されたGrok 4は、コーディング、サイエンス、ロジックのためのモジュール式サブシステムを備えたハイブリッドニューラルアーキテクチャを採用しています。「Heavy」バリアントは並列エージェントコラボレーションを採用し、人間の学習グループを模倣して、反復的な推論を通じて複雑な問題を解決します。25万6000トークンのコンテキストウィンドウ（Grok 3の2倍）は大規模なドキュメント分析をサポートし、APIアクセスは100万入力トークンあたり3ドルからで、エンタープライズ開発者を対象としています。特に、8月にリリースされるGrok 4 Codeは、SWE-Benchで72～75%の精度でソフトウェアエンジニアリングタスクを制覇することを目指しています。

市場の反応は爆発的でした。Grok 4は発売後、ユーザー数が17%増加し、アプリダウンロード数は51%増加しました。これは、2025.26ソフトウェアアップデートによるテスラ車への統合が牽引力となっています。ユーザーは、ナビゲーション、リアルタイムデータ分析、そしてテスラのインフォテインメントシステム内でのコンテキストクエリのための音声コマンドを通じて、Grok 4を操作できるようになりました。マスク氏はまた、Grok 4をテスラのOptimusロボットと統合し、2025年後半までに自然言語による家庭内支援や産業オートメーションを実現する計画も発表しました。

しかし、Grok 4は安全性と透明性に関して厳しい調査に直面しています。このモデルは公開モデルカードなしでデビューし、トレーニングデータとアライメントプロトコルが非公開のままでした。これは、今年初めにGrok 3が反ユダヤ主義的なコンテンツを生成したことを受けて、警戒すべき事態となりました。OpenAIのBoaz Barak氏をはじめとする批評家は、xAIの安全性に関する文書の欠如を非難し、業界標準と比較して「無謀」だと非難しました。マスク氏は「最大限の真実追求」を優先すると誓っていますが、Grok 4は地政学的な問題に関するマスク氏の個人的な見解を反映しているとして既に批判を浴びており、偏見や説明責任に関する懸念が高まっています。

Grok 4は戦略的に、xAIをOpenAIのGPT-5（2025年後半にリリース予定）とGoogleのGeminiエコシステムへの挑戦へと位置づけています。マスク氏が研究者や企業向けに提供する月額300ドルのSuper Grok Heavyサブスクリプションは、業界で最も高価なAI層であり、コストに見合うプレミアムなパフォーマンスを約束しています。このモデルの技術的ブレークスルーは紛れもない事実ですが、その成功は、倫理的なギャップへの対応、マルチモーダル機能の拡張（動画生成機能は10月に提供開始）、そしてマスク氏が掲げる2026年までに「新物理学」を発見するという大胆な目標を達成できるかどうかにかかっています。AI開発競争が激化する中、Grok 4の持つ圧倒的なパワーと存在意義を秘めた野心は、技術的な限界と社会的な信頼の両方を試すことになるでしょう。

-------- 終わり --------

日々の情報

マスク氏、Grok 4を「博士レベル」のAIとして発表、人類最後の試験で44.4%の得点、AIME満点を獲得

あなたも気に入るかもしれない