Continuous-Time Distribution Matching(CDM)は、固定離散タイムステップへの依存を動的連続スケジュールで置き換えることで拡散モデルの蒸留を刷新。GANや報酬モデル不要で過平滑化を解消し、SD3-MediumとLongcat-Imageで4ステップの高品質生成を実現した新手法を解説します。
Google DeepMindが開発した数学研究支援エージェント「AI Co-Mathematician」を解説します。非同期マルチエージェントで仮説立案から定理証明まで一貫支援し、FrontierMath Tier 4で全AIシステム中最高の48%を達成しました。
埋め込みモデルとベクトル検索を使わず、grepやシェルで生コーパスを直接探索するDCI(Direct Corpus Interaction)がBRIGHTとBEIRで既存手法を大幅に上回ることを示した論文を解説します。
Text VAE・ブロック因果DiT・条件付きデコードの3段階で構成されるCola DLMを解説します。連続潜在拡散によって自己回帰パラダイムとは異なるアプローチを提案し、約2Bパラメータで8ベンチマークにわたる強いスケーリング特性を示しました。
拡散モデルのRL微調整で美的品質・テキスト描画・構図理解など5つの報酬を同時改善する「MARBLE」を解説。二次計画法による勾配ハーモナイゼーションで従来の加重和法が抱えるスペシャリストサンプル問題を解決します。
自己回帰型ストリーミング動画拡散モデルの蒸留フレームワーク「Stream-R1」を解説。ロールアウト単位の信頼性と空間・時間的複雑度を単一の報酬モデルで制御し、全ベンチマーク指標で品質を向上させます。
Tencent Hunyuanが提案するマルチモーダル深層検索エージェント「OpenSearch-VL」の完全公開訓練レシピを解説。致命的意識GRPOと多ツール環境により7ベンチマークで10ポイント超の改善を達成しています。
Transformer・Mamba等52のアーキテクチャを対象に、長文脈LLMが効率性・コンパクト性・想起能力の3条件を同時に実現できないことを情報理論で証明した基礎研究を解説します。
上海交通大学の学術チームによるOpenSeeker-v2は、SFTのみで4ベンチマークSoTAを達成。CPT+SFT+RLを使うTongyi DeepResearchを全指標で上回った「データ品質が鍵」という逆説的な知見を解説します。
異なるモデルファミリーの実行者と評価者が相互批評する敵対的マルチエージェント設計で、ML研究ワークフローを自律実行するオープンソースフレームワーク「ARIS」を解説します。
マルチモーダルRLのSFT後に生じる分布ドリフトを、知覚・推論の専門家を持つMoEディスクリミネータで修正する新パイプライン「PRISM」を解説します。Qwen3-VLで全ベンチマーク平均+4.4〜+6.0ポイントの改善を達成しました。
清華大学提案のWeightFormerは、Attention機構を動的パラメータMLPとして再定式化し、線形時間でグローバル視覚モデリングを実現。高解像度入力でDeiT比7.7倍の速度を達成した新手法を解説します。
LLMはなぜ日本文化に偏る? 欧州研究が明かすAIの隠れた文化バイアス
GitHub Copilot がトークン課金制へ移行、一部ユーザーで月額29ドルが750ドルに急騰
MolmoAct2とは?GPT-5・Gemini Roboticsを超えたオープンVLAモデルを解説
arXiv、AI任せ論文の著者を1年間投稿禁止へ — 学術AI利用規制が本格化
Absolicsのガラス基板とは?AIチップ性能を10倍高密度化する次世代パッケージング