Warning

この記事は、以下の情報源を参照し、LLMにより自動で生成・投稿された記事です。

内容の正確性にご注意ください。

AIEWF2025開催間近 GeminiとOpenAI新展開も

今年もAIエンジニアリング界隈が熱い季節がやってきました。昨年大きな注目を集めた「AI Engineer World’s Fair (AIEWF)」が、2025年も開催されます。今回は規模を2倍に拡大し、さらに充実した内容となるようです。この記事では、AIEWF2025の概要と、あわせて最近話題になっているAIモデルやツールの動向についてまとめてみます。

AI Engineer World’s Fair 2025 (AIEWF 2025) の詳細

AI Engineer World’s Fair 2025 は、AIエンジニアリングに特化した大規模カンファレンスです。昨年の成功を受け、今年はさらにパワーアップしています。

  • 開催概要
    • 日程: 6月3日から5日
    • 場所: サンフランシスコ
    • 規模: 昨年の2倍、18トラックに拡大
  • 注目のトラック
    • RAG関連: より専門深化
      • Retrieval + Search: LLMとウェブ検索の統合を背景に
      • GraphRAG: Neo4Jが昨年の人気トークをさらに発展
      • RecSys: Eugene Yan氏がホスト
    • エージェント関連: 2025年はエージェントの年
      • SWE-Agents
      • Agent Reliability
      • Reasoning + RL
    • マルチモーダル関連: より専門特化
      • Voice AI: リアルタイム音声APIなど
      • Generative Media: 画像・動画生成
    • 新設トラック
      • Infrastructure
      • Security
      • Evals: Braintrustなどが参加
    • リーダーシップ関連
      • AI Architects
      • AI in the Fortune 500: エンタープライズでのAI導入事例
    • 新しい方向性
      • MCP (Model Context Protocol): 最も応募が殺到したトラック
      • Tiny Teams: 少人数で高収益を上げる企業
      • Product Management for AI
      • Design Engineering for AI
      • Robotics and Autonomy: Waymo、Tesla、Googleなどからの新情報も
    • Hallway Track: 最も重要な非公式トラック、ネットワーキングの場
  • AI News読者向け割引
    • コード AINEWS を利用すると、早期割引価格でチケットを購入可能 (割引リンク)
      • 割引は金曜日EODまで

新モデル動向

AIEWFでも議論の中心となるであろう、最新のAIモデルの動向を見ていきましょう。

Google Gemini 2.5 Pro

GoogleのGemini 2.5 Proは、特にコーディング性能で目覚ましい進化を見せています。

  • コーディング性能No.1
  • 機能向上
  • Absolute Zero Reasoner (AZR)
    • 言語モデルが自己生成タスクを通じて自身の学習を最適化する新しいパラダイム (論文)
    • 外部の人間がキュレーションしたデータを必要とせず、コーディングや数学的推論のベンチマークでSOTAを達成

OpenAIの動き

OpenAI周辺では、大型買収のニュースや主力モデルに関するユーザーの声が注目されています。

  • Windsurf買収報道
    • AIコーディングエージェントのスタートアップWindsurfを約30億ドルで買収合意と報道
    • Windsurfは多モデル対応のオープンソースコーディングエージェントで知られる
    • 買収によりOpenAIモデルへの偏りが生じ、エコシステムの多様性やオープン性が損なわれる懸念も
  • GPT-4oの性能評価
    • DiscordのOpenAIチャンネルでは、GPT-4oの性能が低下したのではないかというユーザーの声が上がっている
      • 「ランダムでトピック外の応答をする」「全体的に質が低下した」などの意見が見られる一方で、「素晴らしい動作だ」という声も

その他注目モデル

  • Qwen 3
    • DiscordのLM Studioチャンネルなどで、コーディングタスクにおいてGemini 2.5 Proよりも優れているとの報告
      • 指示を正確に守り、機能的なコードを生成する点で評価
  • Mistral Medium 3
  • ACE-Step
    • Apacheライセンスのオープンソース音楽生成モデル (Github, HuggingFace)
    • 高速推論(RTX 4070で3分間の音楽を34秒で生成)とファインチューニング可能性が特徴
    • 音質はSunoやUdioに及ばないものの、ローカルでの高速生成能力は評価
  • LTXV 13B
    • Lightricksがリリースしたオープンソースの13Bパラメータ動画生成モデル (GitHub)
    • マルチスケールレンダリングにより高効率・高リアリティを実現し、同等モデル比で約30倍高速と主張
    • キーフレーム、カメラ制御など高度なコントロールに対応し、商用利用も可能
  • Apple FastVLM: Apple ML Researchがコードとモデルを公開したMLX実装のVLM (詳細)
  • Nvidia Parakeet ASR: NvidiaのSOTA音声認識モデルのMLX実装 (詳細)
  • Meta Perception Models: Metaが発表した視覚言語モデルPLMと視覚エンコーダ (PLM詳細, Encoder詳細)

開発ツール・プラットフォームの進化

AI開発を支えるツールやプラットフォームも日々進化しています。

コーディング支援

  • Cursor: 学生向けに無料化
    • ただし、Discordでは学生割引の認証や請求に関する問題が報告されている
  • Cline: Plan & Actモードや、プロジェクト標準をキャプチャする/newruleコマンドを導入

MaaS (Model as a Service) とエコシステム

データ・評価

ハードウェア・最適化

画像・動画・3D生成技術

クリエイティブ分野でもAIの進化は止まりません。

AIエージェントと自動化

自律的にタスクを実行するAIエージェントも主要な開発テーマです。

業界動向と議論

AI分野全体の大きな動きや、専門家による議論も活発です。

まとめ

AI Engineer World’s Fair 2025は、AIエンジニアリングの最前線を知る絶好の機会となりそうです。そして、Google Gemini 2.5 Proのコーディング能力の飛躍や、OpenAIによるWindsurf買収の動きなど、大手プレイヤーによる開発競争はますます激化しています。一方で、Qwen 3やMistral Medium 3といった新興勢力の台頭、ACE-StepやLTXV 13Bのような特定用途に特化したオープンソースモデルの登場も見逃せません。

開発ツールやプラットフォームも、コーディング支援からMaaS、データ評価、ハードウェア最適化に至るまで、急速な進化を遂げています。特に、AIエージェント技術は実用化に向けた動きが加速しており、AIEWFでも主要なテーマの一つとなるでしょう。

技術の進歩は目覚ましく、コミュニティも活発に情報を交換し、新たなツールやテクニックを生み出し続けています。今後の動向にも引き続き注目していきましょう。