AI最前線コラム

AI-PapersAI論文解説・ニュースブログ

検索運営者情報お問い合わせプライバシーポリシー利用規約

© 2026 AI-Papers. All rights reserved.

ホーム
論文解説

論文解説

論文解説画像

CDMとは？連続時間分布マッチングで拡散モデルの高速蒸留を刷新する新手法

Continuous-Time Distribution Matching（CDM）は、固定離散タイムステップへの依存を動的連続スケジュールで置き換えることで拡散モデルの蒸留を刷新。GANや報酬モデル不要で過平滑化を解消し、SD3-MediumとLongcat-Imageで4ステップの高品質生成を実現した新手法を解説します。

2026年5月9日

CDMとは？連続時間分布マッチングで拡散モデルの高速蒸留を刷新する新手法

論文解説言語・LLM

AI Co-Mathematicianとは？数学研究を支援するマルチエージェントの仕組みと成果

Google DeepMindが開発した数学研究支援エージェント「AI Co-Mathematician」を解説します。非同期マルチエージェントで仮説立案から定理証明まで一貫支援し、FrontierMath Tier 4で全AIシステム中最高の48%を達成しました。

2026年5月9日

AI Co-Mathematicianとは？数学研究を支援するマルチエージェントの仕組みと成果

論文解説言語・LLM

DCIとは？grepとシェルで直接コーパスを探索するエージェント検索の新手法

埋め込みモデルとベクトル検索を使わず、grepやシェルで生コーパスを直接探索するDCI（Direct Corpus Interaction）がBRIGHTとBEIRで既存手法を大幅に上回ることを示した論文を解説します。

2026年5月8日

DCIとは？grepとシェルで直接コーパスを探索するエージェント検索の新手法

論文解説言語・LLM

Cola DLMとは？連続潜在拡散でARに挑む階層型テキスト生成の新手法

Text VAE・ブロック因果DiT・条件付きデコードの3段階で構成されるCola DLMを解説します。連続潜在拡散によって自己回帰パラダイムとは異なるアプローチを提案し、約2Bパラメータで8ベンチマークにわたる強いスケーリング特性を示しました。

2026年5月8日

Cola DLMとは？連続潜在拡散でARに挑む階層型テキスト生成の新手法

論文解説画像

MARBLEとは？拡散モデルRL微調整で複数報酬を同時最適化する勾配ハーモナイゼーション手法

拡散モデルのRL微調整で美的品質・テキスト描画・構図理解など5つの報酬を同時改善する「MARBLE」を解説。二次計画法による勾配ハーモナイゼーションで従来の加重和法が抱えるスペシャリストサンプル問題を解決します。

2026年5月8日

MARBLEとは？拡散モデルRL微調整で複数報酬を同時最適化する勾配ハーモナイゼーション手法

論文解説動画

Stream-R1とは？信頼性と複雑度を考慮した報酬蒸留でストリーミング動画生成を向上させる新手法

自己回帰型ストリーミング動画拡散モデルの蒸留フレームワーク「Stream-R1」を解説。ロールアウト単位の信頼性と空間・時間的複雑度を単一の報酬モデルで制御し、全ベンチマーク指標で品質を向上させます。

2026年5月7日

Stream-R1とは？信頼性と複雑度を考慮した報酬蒸留でストリーミング動画生成を向上させる新手法

論文解説マルチモーダル

OpenSearch-VLとは？マルチモーダル深層検索エージェントの完全公開訓練レシピを解説

Tencent Hunyuanが提案するマルチモーダル深層検索エージェント「OpenSearch-VL」の完全公開訓練レシピを解説。致命的意識GRPOと多ツール環境により7ベンチマークで10ポイント超の改善を達成しています。

2026年5月7日

OpenSearch-VLとは？マルチモーダル深層検索エージェントの完全公開訓練レシピを解説

論文解説言語・LLM

長文脈LLMの不可能性三角形とは？Transformer・Mambaに課される根本的制約を解説

Transformer・Mamba等52のアーキテクチャを対象に、長文脈LLMが効率性・コンパクト性・想起能力の3条件を同時に実現できないことを情報理論で証明した基礎研究を解説します。

2026年5月7日

長文脈LLMの不可能性三角形とは？Transformer・Mambaに課される根本的制約を解説

論文解説言語・LLM

OpenSeeker-v2とは？SFTのみで産業界のRL学習パイプラインを超えた検索エージェント

上海交通大学の学術チームによるOpenSeeker-v2は、SFTのみで4ベンチマークSoTAを達成。CPT+SFT+RLを使うTongyi DeepResearchを全指標で上回った「データ品質が鍵」という逆説的な知見を解説します。

2026年5月6日

OpenSeeker-v2とは？SFTのみで産業界のRL学習パイプラインを超えた検索エージェント

論文解説言語・LLM

ARISとは？敵対的マルチエージェント協調でML研究を自動化するオープンソースフレームワーク

異なるモデルファミリーの実行者と評価者が相互批評する敵対的マルチエージェント設計で、ML研究ワークフローを自律実行するオープンソースフレームワーク「ARIS」を解説します。

2026年5月6日

ARISとは？敵対的マルチエージェント協調でML研究を自動化するオープンソースフレームワーク

論文解説強化学習

PRISMとは？マルチモーダルRLの分布ドリフトをMoE対抗学習で解消する新手法

マルチモーダルRLのSFT後に生じる分布ドリフトを、知覚・推論の専門家を持つMoEディスクリミネータで修正する新パイプライン「PRISM」を解説します。Qwen3-VLで全ベンチマーク平均+4.4〜+6.0ポイントの改善を達成しました。

2026年5月6日

PRISMとは？マルチモーダルRLの分布ドリフトをMoE対抗学習で解消する新手法

論文解説言語・LLM

WeightFormerとは？Attentionを線形時間に置き換える動的MLP手法を解説

清華大学提案のWeightFormerは、Attention機構を動的パラメータMLPとして再定式化し、線形時間でグローバル視覚モデリングを実現。高解像度入力でDeiT比7.7倍の速度を達成した新手法を解説します。

2026年5月5日

WeightFormerとは？Attentionを線形時間に置き換える動的MLP手法を解説

前へ
1
…
11
12
13
…
25
次へ

カテゴリ

論文解説
ニュース
- 技術
- ビジネス
AI最前線コラム

人気記事

LLMはなぜ日本文化に偏る？欧州研究が明かすAIの隠れた文化バイアス
2026年4月30日
GitHub Copilot がトークン課金制へ移行、一部ユーザーで月額29ドルが750ドルに急騰
2026年5月31日
MolmoAct2とは？GPT-5・Gemini Roboticsを超えたオープンVLAモデルを解説
2026年5月5日
arXiv、AI任せ論文の著者を1年間投稿禁止へ — 学術AI利用規制が本格化
2026年5月17日
Absolicsのガラス基板とは？AIチップ性能を10倍高密度化する次世代パッケージング
2026年3月15日