Warning

この記事は、以下の情報源を参照し、LLMにより自動で生成・投稿された記事です。

内容の正確性にご注意ください。

最新AIニュースまとめ Veo 2とKling 2が一般公開

AIの世界は相変わらず動きが早いですね。今回は特に動画生成モデルの分野で大きな進展がありました。Googleの「Veo 2」と中国発の「Kling 2」という、現在トップクラスとされる動画生成モデルが開発者向けに一般公開されました。

その他にも、OpenAIが新しい「GPT-4.1」ファミリーを発表したり、各種開発ツールやコミュニティで活発な動きが見られたり、AI研究の最前線からの興味深い報告があったりと、盛りだくさんです。さっそく詳しく見ていきましょう。

動画生成モデルの進化が止まらない Veo 2 と Kling 2

これまでAI Newsではテキストやコーディング関連の話題が中心でしたが、今回は動画生成モデルの大きなニュースを取り上げます。

Artificial Analysisの動画生成モデルリーダーボードでトップを争う2つのモデルが、ほぼ同時に開発者向けにAPIアクセスを開放しました。これは動画生成技術の現状を知る良い機会ですね。

Google Veo 2

Googleの「Veo 2」は、Gemini APIGemini Advanced/Whisk を通じて利用可能になりました。(以前はFal.ai経由での提供でした)

注目すべきはその価格で、生成される動画1秒あたり35セントと、かなり手頃になっています。(ただし、実際の利用感とは異なる可能性もあるようです)

生成される動画の品質も向上しており、物理法則への暗黙的な理解が素晴らしいとの声も上がっています。

image.png

Kuaishou Kling 2

中国の快手(Kuaishou)が開発した「Kling 2」も同日に発表されました。

価格は10秒のクリップで約2ドルとVeo 2より高価ですが、生成される動画の品質は非常に高いと評判です。ただし、利用には最低でも月額700ドル(3ヶ月契約)のパッケージ購入が必要となるようです。

image.png

どちらのモデルも、テキストから高品質な動画を生成できる能力を示しており、今後のクリエイティブ分野での活用が期待されます。

OpenAIから「GPT-4.1」ファミリーが登場

OpenAIも負けじと新しいモデルファミリー「GPT-4.1」を発表しました。(OpenAIのアナウンス)

API限定リリースとモデルラインナップ

今回のリリースはAPI限定で、以下の3つのモデルが含まれます。

  • GPT-4.1
  • GPT-4.1 mini
  • GPT-4.1 nano

OpenAI Devsのポストによると、これらのモデルはAPI専用であり、既存のGPT-4.5 Previewは3ヶ月後の7月14日に廃止される予定です。GPT-4.1が同等以上の性能を低遅延・低コストで提供できるためとのこと。

性能向上と特徴

OpenAIの発表や開発者の声によると、以下の点が改善されています。

評価とベンチマーク

一方で、Scaling01氏のように、API版のGPT-4.1はOpenRouterのプレビュー版(Quasar Alpha, Optimus Alpha)よりも性能が低い、mini版は他の多くのモデルよりスコアが低い、といった指摘もあります。また、コーディング性能では依然としてDeepSeekV3に劣るものの、価格は8倍という比較も。

しかし、skirano氏は、GPT-4.1がベンチマークスコアだけでなく、**現実世界のタスク(特にフロントエンド開発やWebサイト構築)**に最適化されている可能性があると指摘しています。OpenAIのSam Altman氏も、ベンチマークは強力だが、現実世界での実用性に焦点を当てたと述べています

また、Aidan Clark氏は「名付けは下手だけど、miniと付くモデルは🔥だよ」とコメントしており、miniモデルの性能にも期待が持てそうです。DiscordのLMArenaコミュニティでも、GPT-4.1 miniがGPQAベンチマークでフルバージョンに匹敵する結果を出したという観察が共有されています。

移行を支援するためのプロンプティングガイドも公開されています。

その他注目モデルとツール動向

動画生成やGPT-4.1以外にも、多くのモデルやツールが登場・アップデートされています。

コミュニティとオープンソースの動向

開発者コミュニティやオープンソースプロジェクトも活発です。

/r/LocalLlama の声

Redditの/r/LocalLlamaコミュニティでは、以下のような議論が注目を集めています。

Discordコミュニティの活発な動き

各種Discordサーバーでも、ツール開発や情報共有が盛んに行われています。

最先端の研究動向

AI研究の分野でも興味深い発表が続いています。

まとめ

今回は、特に動画生成モデルの一般公開とGPT-4.1ファミリーの登場という大きなニュースがありました。これらのモデルが開発者の手に渡ることで、どのような新しいアプリケーションやサービスが生まれるのか、非常に楽しみです。

また、小規模モデルの性能向上、開発ツールの進化、活発なコミュニティ活動、そしてAI自身が新たな発見をするような最先端の研究まで、AI分野全体のダイナミックな動きが感じられるニュースが満載でした。

今後もこれらの技術動向やコミュニティの動きに注目していきたいと思います。