Warning

この記事は、以下の情報源を参照し、LLMにより自動で生成・投稿された記事です。

内容の正確性にご注意ください。

OpenAIの新モデル「o3」と「o4-mini」が登場

OpenAIはライブストリームで、新しいモデル「o3」と「o4-mini」を発表しました。合わせてブログポストシステムカードも公開されています。

発表の様子はこちらの動画で確認できます。

主な特徴と改善点

今回の発表では、特に強化学習(RL)のスケーリングと全体的な効率の向上が強調されています。

  • RLスケーリングの向上: 大規模なRLによって、分析的な厳密さや複数ステップの実行能力が向上したとのこと
    • これにより、コーディング、数学、科学、視覚認識のベンチマークで最先端の結果を達成
  • 効率の向上: 全体的な効率も改善され、特にo4-miniは前世代のモデルと比較して、より安価でありながら性能が向上しています
  • ビジョン能力の向上: 画像を思考プロセスに直接統合できるようになり、マルチモーダルな理解力が向上
  • ツール使用能力の向上: ChatGPT内でツール(Web検索、ファイル分析、Python実行、画像生成など)を自律的に使用・組み合わせる能力が向上
    • ただし、現時点ではAPI経由でのツール使用はまだ利用できないようです

o4-miniは、OpenAIが優先してきた指標において、前世代よりも安価かつ高性能になっている点が注目されます。

出典: AI News ButtonDown

Dan Shipper氏による定性的なレビューもXで紹介されており、参考になりそうです。

アクセスと価格

  • 利用対象: ChatGPT Plus, Pro, Teamユーザーはo3, o4-mini, o4-mini-highにアクセス可能になる予定
  • 価格:
    • o4-miniは旧世代より安価
    • o3はGemini 2.5 Proと比較して4〜5倍高価になる可能性があるとの指摘あり

システムカードに記載されている評価は、発表内容ほど華々しくはないものの、全体としては非常に好意的に受け止められているようです。

オープンソースの「Codex CLI」も発表

今回の発表の「One more thing」として、新しいコーディングエージェント「Codex CLI」が発表されました。これは完全にオープンソースとして公開されています。

Codex CLIは、o3やo4-miniといったモデルを活用し、自然言語の指示を実際のコードに変換するツールです。開発者のコーディング作業を支援することが期待されます。これは先日発表されたAnthropicのClaude Codeに対抗するものと見られますが、オープンソースである点が大きな違いです。

他の注目モデル動向

OpenAI以外にも、様々なモデルに関する発表や話題がありました。

  • GPT-4.1シリーズ:
    • 開発者向けに発表された新しいシリーズ
    • 実世界タスクへの最適化が進んでいるとの見方
    • GPT-4.1-miniが一部ベンチマークでGPT-4.1を上回る性能を示すなど、注目されている
    • 全体としてGPT-4oシリーズからの堅実なアップグレードと評価されている
  • Gemini 2.5 Pro:
    • 長文コンテキストの理解能力が高いと評価されている
    • 価格対性能比が非常に高いとの指摘あり
  • ByteDance Seedream 3.0:
    • Artificial Analysis Image Leaderboardでトップに立った新しい画像生成モデル
    • 技術レポートも公開されている (_akhaliq氏のXポスト)
  • IBM Granite 3.3:
    • Apache 2.0ライセンスで公開された2B/8Bパラメータのモデルファミリー (Hugging Face)
    • 特にGPUリソースが限られた環境での利用が期待されている
  • ByteDance Liquid:
    • テキストと画像の両方を扱えるマルチモーダルモデルとして紹介された (i.redd.it)
    • ただし、公開されているチェックポイントはGemmaのファインチューンであり、マルチモーダル機能は未確認との指摘あり
  • HiDream (ComfyUI):
    • ComfyUIで低VRAMでも動作するバージョンが登場 (Civitai)
    • GGUF形式のモデルとローダーが公開されている (Hugging Face, GitHub)
    • 基本的なサポートがComfyUI本体にも追加された (GitHub Commit)

注目技術・トピック

モデル以外にも、様々な技術やツール、議論が注目されています。

  • エージェント技術:
    • ツール使用: OpenAIのo3/o4-miniがツール連携を強化。モデルが自律的にWeb検索やコード実行を行う能力が向上
    • FIRE-1: 複雑なWebサイトをナビゲートし、動的コンテンツと対話できるエージェントベースのWebスクレイパー (omarsar0氏のXポスト)
    • Codex CLI: 自然言語からコードを生成するオープンソースエージェント
  • 分散学習:
    • INTELLECT-2: 世界中の分散したハードウェア上で32Bパラメータモデルの強化学習を初めて実施したプロジェクト (Prime Intellectブログ)
      • 検証可能な計算と貢献者へのインセンティブ提供にブロックチェーン技術を活用
  • 動画生成:
    • Google Veo 2: Gemini Advancedで利用可能になったテキストから動画を生成する機能 (GoogleのXポスト)
    • ByteDance Liquid: テキストと画像の両方を生成できる統一的なマルチモーダルジェネレーター (_akhaliq氏のXポスト)
    • Kling AI 2.0: フェーズ2.0を発表し、ストーリーテリング能力を強化 (Kling_aiのXポスト)
  • 解釈可能性とステアリング:
    • GoodfireAIのSAEs: DeepSeekの67Bモデルで訓練された初のオープンソースSparse Autoencoder (SAE)をリリース。モデルの思考を理解し、制御するための新しいツールを提供 (GoodfireAIのXポスト)
    • 新規データの知識浸透と希釈: Googleの研究。新しい知識が不適切に適用される問題を調査し、その影響を軽減する方法を提案 (_akhaliq氏のXポスト)
  • 開発ツール:
    • PydanticAI: FastAPIライクな設計を生成AIアプリ開発にもたらす新しいフレームワーク (LiorOnAI氏のXポスト)
    • LangGraph: LangChainがLLManager(人間参加型の承認タスク自動化エージェント)をオープンソース化。アブダビ政府のAIアシスタントTAMM 3.0もLangGraph上で構築されている (LangChainAIのXポスト1, Xポスト2)
    • ComfyUI: HiDreamモデルのサポートを追加
  • ハードウェア:
    • 低コスト高VRAMビルド: 約1000ドルで160GBのVRAMを実現するビルド例(AMD Radeon Instinct MI50 x10)がRedditで紹介された
      • 大規模モデルやMoEには有効だが、推論速度やPCIe帯域幅に課題あり
    • RTX 5090: 初期の行列積(matmul)ベンチマークでは、RTX 4090と同程度の性能しか出ていないとの報告あり。より大きな行列サイズでのテストが必要か
  • 非検閲モデル:
    • Reddit (/r/LocalLlama) で、huihui-aiによるPhi 4 Abliterated、Gemma 3 27B Abliteratedなどが議論されている
    • 性能劣化とのトレードオフが課題
  • コミュニティ動向:
    • OpenRouterのプライバシーポリシー: 更新内容がLLM入力をログ記録するように見えると懸念の声が上がったが、運営側はデフォルトでは保存しないと説明し、表現を明確化する予定
    • AIの悪用: VRなどでの悪用、著作権侵害、ディープフェイク生成などの懸念がDiscordで議論されている
    • Discordコミュニティ: Manus.imなどでコミュニティ運営やメンバー間の交流に関する議論が見られた

まとめ

今回はOpenAIの新しいモデル「o3」「o4-mini」とオープンソースの「Codex CLI」の発表が大きなニュースでした。特にo4-miniは価格性能比の向上が期待され、Codex CLIは開発者の生産性向上に貢献しそうです。

一方で、Gemini 2.5 ProやGPT-4.1シリーズなど、他の主要プレイヤーも進化を続けており、競争はますます激化しています。また、画像生成や動画生成、エージェント技術、分散学習、解釈可能性など、周辺技術も急速に進歩しています。

ハードウェアの話題や、非検閲モデル、コミュニティでの倫理的な議論など、AIを取り巻く環境全体が活発に動いていることが伺えます。引き続き、これらの動向に注目していきたいですね。