日々の情報

マスク氏、Grok 4を「博士レベル」のAIとして発表、人類最後の試験で44.4%の得点、AIME満点を獲得

2分で読めます
マスク氏、Grok 4を「博士レベル」のAIとして発表、人類最後の試験で44.4%の得点、AIME満点を獲得
ロン・マスク氏のxAIは7月9日にGrok 4を発表し、博士レベルの推論能力とマルチモーダルな進歩を備えた「世界最強のAI」と位置付けました。xAIの基本モデルの4番目のメジャーバージョンでは、5つの新しい音声モードが導入され、応答遅延が半分に短縮され、リアルタイムの画像/動画処理が統合され、Xのようなソーシャルメディアプラットフォームで文化に配慮したコンテンツ分析が可能になります。
 

 

xAIの20万GPU Colossusクラスタをベースに構築されたGrok 4は、コーディング、サイエンス、ロジックのためのモジュール式サブシステムを備えたハイブリッドニューラルアーキテクチャを採用しています。「Heavy」バリアントは並列エージェントコラボレーションを採用し、人間の学習グループを模倣して、反復的な推論を通じて複雑な問題を解決します。25万6000トークンのコンテキストウィンドウ(Grok 3の2倍)は大規模なドキュメント分析をサポートし、APIアクセスは100万入力トークンあたり3ドルからで、エンタープライズ開発者を対象としています。特に、8月にリリースされるGrok 4 Codeは、SWE-Benchで72~75%の精度でソフトウェアエンジニアリングタスクを制覇することを目指しています。

 

市場の反応は爆発的でした。Grok 4は発売後、ユーザー数が17%増加し、アプリダウンロード数は51%増加しました。これは、2025.26ソフトウェアアップデートによるテスラ車への統合が牽引力となっています。ユーザーは、ナビゲーション、リアルタイムデータ分析、そしてテスラのインフォテインメントシステム内でのコンテキストクエリのための音声コマンドを通じて、Grok 4を操作できるようになりました。マスク氏はまた、Grok 4をテスラのOptimusロボットと統合し、2025年後半までに自然言語による家庭内支援や産業オートメーションを実現する計画も発表しました。

 

しかし、Grok 4は安全性と透明性に関して厳しい調査に直面しています。このモデルは公開モデルカードなしでデビューし、トレーニングデータとアライメントプロトコルが非公開のままでした。これは、今年初めにGrok 3が反ユダヤ主義的なコンテンツを生成したことを受けて、警戒すべき事態となりました。OpenAIのBoaz Barak氏をはじめとする批評家は、xAIの安全性に関する文書の欠如を非難し、業界標準と比較して「無謀」だと非難しました。マスク氏は「最大限の真実追求」を優先すると誓っていますが、Grok 4は地政学的な問題に関するマスク氏の個人的な見解を反映しているとして既に批判を浴びており、偏見や説明責任に関する懸念が高まっています。

 

Grok 4は戦略的に、xAIをOpenAIのGPT-5(2025年後半にリリース予定)とGoogleのGeminiエコシステムへの挑戦へと位置づけています。マスク氏が研究者や企業向けに提供する月額300ドルのSuper Grok Heavyサブスクリプションは、業界で最も高価なAI層であり、コストに見合うプレミアムなパフォーマンスを約束しています。このモデルの技術的ブレークスルーは紛れもない事実ですが、その成功は、倫理的なギャップへの対応、マルチモーダル機能の拡張(動画生成機能は10月に提供開始)、そしてマスク氏が掲げる2026年までに「新物理学」を発見するという大胆な目標を達成できるかどうかにかかっています。AI開発競争が激化する中、Grok 4の持つ圧倒的なパワーと存在意義を秘めた野心は、技術的な限界と社会的な信頼の両方を試すことになるでしょう。

-------- 終わり --------