カメラ誘発ワープを「擬似履歴」として既存ビデオモデルに注入し、モデルの重みを変えずにカメラ制御を実現する新手法「Warp-as-History」を解説します。1本の動画でのLoRA学習でカメラ制御スコアを134.7%改善します。
世界最大の学術プレプリントサーバーarXivが、LLMへの論文丸投げを確認した著者を最長1年間投稿禁止にする新ポリシーを発表。AI使用の可否よりも「責任ある使用」が問われる段階に入りました。
NVIDIAが提案したMemLensは789問・5能力・4段階のコンテキスト長でマルチモーダル長期記憶を評価する初の体系的ベンチマークです。最先端モデルも30%以下に留まる視覚記憶の壁を解説します。
OpenAI共同創業者のGreg Brockmanが製品戦略責任者に正式就任しました。ChatGPTとプログラミング製品Codexを単一プラットフォームへ統合する計画も社内メモで明らかになっています。
動画VAEのデコーダに参照フレームを直接注入する「RefDecoder」が提案されました。ファインチューニング不要でWan 2.1やVideoVAE+に即座に適用でき、PSNRを最大+2.1dB向上させる新手法を解説します。
OpenAIがマルタ政府と提携し、全市民約53万人へのChatGPT Plus提供とAIスキル教育を国家事業として展開すると発表。政府がAIサブスクを公共サービスとして配布する世界初のモデルを解説します。
LLMエージェントの多ターン訓練における報酬信号の不安定性を解消する新手法「SDAR」を解説します。シグモイドゲートによる選択的自己蒸留とGRPOを統合し、ALFWorldで+9.4%、WebShopで+10.2%の性能改善を実現しました。
DatabricksがGPT-5.5をエンタープライズAIエージェントに採用し、業務文書QAベンチマークOfficeQA Proで最高性能を達成したとOpenAIが発表しました。データ基盤とLLMの垂直統合戦略を詳しく解説します。
訓練不要の進化的モデルマージフレームワーク「Darwin Family」が、GPQA Diamondで86.9%(1252モデル中6位)を達成。14次元ゲノムとMRI-Trust Fusionで複数LLMを重み空間で交配させ、追加学習なしに推論性能を高める革新的手法を解説します。
OpenAIがChatGPT Proユーザー向けに金融口座連携のパーソナルファイナンス機能をプレビュー公開。Plaid経由で1万2,000以上の金融機関に対応し、収支分析・資産管理をチャット形式で利用できます。
自己回帰型動画生成モデルに因果一貫性蒸留を導入し、1〜2ステップの超高速フレーム生成を実現するCausal Forcing++を解説。訓練コスト4倍削減と初回レイテンシ50%削減を達成しつつ、VBench品質スコアで従来手法を上回ります。
Runwayの共同創業者が2026年5月のインタビューで、動画生成AIからワールドモデル開発へ軸足を移す方針を明らかにした。最大の競合にGoogleを名指しし、「AIアウトサイダー」としての独自戦略を語った。
MolmoAct2とは?GPT-5・Gemini Roboticsを超えたオープンVLAモデルを解説
SANA-WMとは?単一GPUで720p・60秒動画を生成するNVIDIAの効率的世界モデル
Sapiens2とは?MetaのヒューマンAI基盤モデルが5Bパラメータ・4K解像度で姿勢・法線・点群推定を統合
arXiv、AI任せ論文の著者を1年間投稿禁止へ — 学術AI利用規制が本格化
HY-World 2.0とは?テキスト・画像・動画から3D世界を生成するマルチモーダルワールドモデル