AI最前線コラム

AI-PapersAI論文解説・ニュースブログ

検索運営者情報お問い合わせプライバシーポリシー利用規約

ホーム
論文解説
言語・LLM

言語・LLM

論文解説言語・LLM

Manifold Power Iterationとは？MoEルーター設計を特異方向で刷新する新手法

MoEモデルのルーター設計に数学的根拠を与えるManifold Power Iteration（MPI）を解説。エキスパート行列の主特異方向への整合で損失を改善し、下流タスク性能も向上させる新手法を紹介します。

2026年6月11日

Manifold Power Iterationとは？MoEルーター設計を特異方向で刷新する新手法

論文解説言語・LLM

Attention Amnesiaとは？ハイブリッドLLMの長距離記憶を壊すCoT学習の問題と修復法

CoT微調整がハイブリッドLLMの長文書検索性能を67%から9%へ激減させる「Attention Amnesia」問題と、追加学習不要の修復法QK-Restoreを解説します。

2026年6月10日

Attention Amnesiaとは？ハイブリッドLLMの長距離記憶を壊すCoT学習の問題と修復法

論文解説言語・LLM

OpenSkillとは？教師データ不要でLLMエージェントがスキルを自己構築する進化フレームワーク

タスク固有の教師データなしでLLMエージェントがスキルを自己構築する「OpenSkill」を解説。SkillsBenchで43.6%のパス率を達成し、モデル間のスキル転移も実証しました。

2026年6月8日

OpenSkillとは？教師データ不要でLLMエージェントがスキルを自己構築する進化フレームワーク

論文解説言語・LLM

Goedel-Architectとは？ブループリントでIMO 2025の4問を形式証明

Goedel-ArchitectはLean 4形式証明エージェント。補題の依存グラフを生成・洗練し、IMO 2025の6問中4問・MiniF2F-testで99.2%を達成。類似システムより最大500倍コスト効率に優れます。

2026年6月7日

Goedel-Architectとは？ブループリントでIMO 2025の4問を形式証明

論文解説言語・LLM

Code2LoRAとは？ハイパーネットワークがリポジトリ固有のLoRAを自動生成するコードLLM高速化手法

ハイパーネットワークがリポジトリ固有のLoRAアダプターを自動生成する「Code2LoRA」を解説。推論時のトークンオーバーヘッドなしに+5.2ポイントの改善を達成した仕組みと、604リポジトリのベンチマーク「RepoPeftBench」を紹介します。

2026年6月6日

Code2LoRAとは？ハイパーネットワークがリポジトリ固有のLoRAを自動生成するコードLLM高速化手法

論文解説言語・LLM

CLSAとは？ルーティング共有で128Kコンテキスト推論を17倍高速化するスパースアテンション

ルーティングインデックスをクロスレイヤーで共有するCLSAが、128Kコンテキストでスループット17.1倍・デコーディング7.6倍を実現。精度劣化はほぼゼロで長文脈LLMに広く適用可能な新手法を解説します。

2026年6月5日

CLSAとは？ルーティング共有で128Kコンテキスト推論を17倍高速化するスパースアテンション

論文解説言語・LLM

MLEvolveとは？自己進化LLMエージェントがMLアルゴリズムを自動発見する新手法

自律的にMLアルゴリズムを発見する新フレームワーク「MLEvolve」を解説。12時間の予算でMLE-Benchにて65.3%のメダル率を達成し、AlphaEvolveを上回る汎用性を示しました。

2026年6月5日

MLEvolveとは？自己進化LLMエージェントがMLアルゴリズムを自動発見する新手法

論文解説言語・LLM

ThoughtFoldとは？推論チェーンの冗長ステップを56%削減する内省的選好学習

強化学習で学んだ推論チェーンの冗長なステップを内省的に特定し、マスク付き選好最適化で圧縮する新手法「ThoughtFold」。DeepSeek-R1-Distill-Qwen-7Bでトークン使用量を約56%削減しながら最先端の精度を維持します。

2026年6月4日

ThoughtFoldとは？推論チェーンの冗長ステップを56%削減する内省的選好学習

論文解説言語・LLM

OCC-RAGとは？0.6B小型LLMで忠実なマルチホップQAを実現する専門特化フレームワーク

0.6B・1.7Bの小型モデルで自身の2〜6倍サイズの汎用LLMと同等以上の性能を達成したOCC-RAGを解説します。325万件の合成データで訓練し、逐語引用による構造化推論と回答不能時の棄権機能を備えた忠実性重視の設計が特徴です。

2026年6月3日

OCC-RAGとは？0.6B小型LLMで忠実なマルチホップQAを実現する専門特化フレームワーク

論文解説言語・LLM

Hopeとは？人間の睡眠を模した記憶統合でLLM継続学習を実現する新フレームワーク

人間の睡眠中の記憶統合を着想源に、LLM向け「Sleep」パラダイムを提案。Knowledge SeedingとDreamingの2段階で壊滅的忘却を抑制し、数学推論・長文脈理解など複数タスクで既存手法を上回ることを実証した。

2026年6月3日

Hopeとは？人間の睡眠を模した記憶統合でLLM継続学習を実現する新フレームワーク

論文解説言語・LLM

Dominoとは？因果モデリングとドラフト生成を分離してLLM推論を5.8倍高速化

投機的デコーディングの新手法「Domino」を解説します。並列ドラフト生成と軽量な因果補正の2段構成で、Qwen3-8BのLLM推論を最大5.8倍高速化しました。

2026年6月2日

Dominoとは？因果モデリングとドラフト生成を分離してLLM推論を5.8倍高速化

論文解説言語・LLM

NITPとは？暗黙トークン予測でLLM事前学習を強化し推論コストゼロで精度向上

標準的な次トークン予測（NTP）に浅い層の表現を自己教師信号とした連続監督を追加するNITPが提案されました。0.5B〜9BパラメータのLLMでMMLP-Proに5.7%・C3に6.4%の精度向上を実現しながら推論コストはゼロです。

2026年6月2日

言語・LLM

Manifold Power Iterationとは？MoEルーター設計を特異方向で刷新する新手法

Attention Amnesiaとは？ハイブリッドLLMの長距離記憶を壊すCoT学習の問題と修復法

OpenSkillとは？教師データ不要でLLMエージェントがスキルを自己構築する進化フレームワーク

Goedel-Architectとは？ブループリントでIMO 2025の4問を形式証明

Code2LoRAとは？ハイパーネットワークがリポジトリ固有のLoRAを自動生成するコードLLM高速化手法

CLSAとは？ルーティング共有で128Kコンテキスト推論を17倍高速化するスパースアテンション

MLEvolveとは？自己進化LLMエージェントがMLアルゴリズムを自動発見する新手法

ThoughtFoldとは？推論チェーンの冗長ステップを56%削減する内省的選好学習

OCC-RAGとは？0.6B小型LLMで忠実なマルチホップQAを実現する専門特化フレームワーク

Hopeとは？人間の睡眠を模した記憶統合でLLM継続学習を実現する新フレームワーク

Dominoとは？因果モデリングとドラフト生成を分離してLLM推論を5.8倍高速化

NITPとは？暗黙トークン予測でLLM事前学習を強化し推論コストゼロで精度向上

人気記事