記事一覧 (24ページ目) | AI-Papers

AI最前線コラム

AI-PapersAI論文解説・ニュースブログ

検索運営者情報お問い合わせプライバシーポリシー利用規約

© 2026 AI-Papers. All rights reserved.

論文解説画像

Unified Latents（UL）とは？拡散事前分布で正則化した潜在空間でFID 1.4を達成する新手法

GoogleがImageNet-512でFID 1.4、Kinetics-600でFVD 1.3を達成する新フレームワーク「Unified Latents（UL）」を提案。拡散事前分布で潜在空間を正則化し、Stable Diffusionより少ない学習FLOPsで優れた品質を実現する潜在表現学習の仕組みを解説します。

2026年2月23日

Unified Latents（UL）とは？拡散事前分布で正則化した潜在空間でFID 1.4を達成する新手法

ニュースビジネス

Google VP、LLMラッパーとAIアグリゲーターは生き残れないと警告

GoogleのスタートアップVP Darren Mowryが、TechCrunchポッドキャストでLLMラッパーとAIアグリゲーターという2種類のビジネスモデルが存続困難になりつつあると警告しました。差別化の壁とクラウド黎明期との類比を解説します。

2026年2月22日

Google VP、LLMラッパーとAIアグリゲーターは生き残れないと警告

AI最前線コラム

【CES2026】NVIDIAが宣言したフィジカルAI元年|注目のデバイス5選

CES 2026では「フィジカルAI」が主役でした。NVIDIAのジェンスン・フアン氏が宣言した「フィジカルAIのChatGPTモーメント」とは何か。触覚ロボット・腸内AI・現場監督AI・ペン型録音・音声遮断ウェアラブルの5事例と、日本企業の勝ち筋を読み解きます。

2026年2月22日

【CES2026】NVIDIAが宣言したフィジカルAI元年|注目のデバイス5選

論文解説画像

DDiTとは？動的パッチスケジューリングでFLUX-1.Devを3.5倍高速化する再学習不要の新手法

再学習不要でDiffusion Transformerを最大3.52倍高速化するDDiTの仕組みと検証結果を解説。FLUX-1.DevやWan 2.1に即適用でき、推論コスト削減に活用できます。

2026年2月22日

DDiTとは？動的パッチスケジューリングでFLUX-1.Devを3.5倍高速化する再学習不要の新手法

ニュース技術

OpenAI、数学コンペ「First Proof」に初挑戦 — 全10問中5問で正解の可能性

OpenAIが数学コンペ「First Proof」の全10問にAIモデルで挑戦し、専門家評価で少なくとも5問が正解の可能性ありと判定。研究レベルの定理証明における形式的推論能力の到達点と今後の展望を解説します。

2026年2月21日

OpenAI、数学コンペ「First Proof」に初挑戦 — 全10問中5問で正解の可能性

AI最前線コラム

AI時代に消えるフリーランス、重要なのは「シナプス型思考」だった

フリーランスになったとたん年収は上がる。しかし「作業者」のままでは5年後にAIと内製化に仕事を奪われる。AI時代を生き抜くフリーランスが実践する「探索（シナプス）戦略」とは何か。

2026年2月21日

AI時代に消えるフリーランス、重要なのは「シナプス型思考」だった

ニュース技術

llama.cpp開発元GGMLがHugging Faceに参加 — ローカルAI推論とtransformersの統合を加速

llama.cppの作者Georgi Gerganov氏とGGMLチームがHugging Faceに参加。プロジェクトの独立性・オープンソース方針を維持しつつ、transformersとの統合によりローカルAI推論のワンクリック実行を目指します。

2026年2月21日

llama.cpp開発元GGMLがHugging Faceに参加 — ローカルAI推論とtransformersの統合を加速

論文解説動画

SpargeAttention2とは？Top-k+Top-pハイブリッドマスキングでビデオ生成を16.2倍高速化

清華大学が提案したSpargeAttention2は、Top-kとTop-pのマスキング限界を理論分析し、ハイブリッド統合と蒸留微調整でアテンション計算を95%削減・16.2倍高速化しながら、既存手法を全指標で上回る生成品質を実現します。

2026年2月21日

SpargeAttention2とは？Top-k+Top-pハイブリッドマスキングでビデオ生成を16.2倍高速化

論文解説マルチモーダル

GUI-Owl-1.5：3プラットフォーム対応GUIエージェントが20超ベンチマークでオープンSOTA

Alibaba X-PLUGのGUIエージェント「GUI-Owl-1.5」がOSWorld 56.5%など20以上のベンチマークでオープンソース最高性能を達成。新強化学習アルゴリズムMRPOとマルチプラットフォーム対応の仕組みを解説します。

2026年2月21日

GUI-Owl-1.5：3プラットフォーム対応GUIエージェントが20超ベンチマークでオープンSOTA

AI最前線コラム

Unsloth × Hugging Face Jobs — 無料GPU枠でLLMファインチューニングが誰でも可能に

2026年2月20日、Hugging FaceとUnslothが連携を発表。Hugging Face Jobs上の無料GPU枠でLLMのファインチューニングが利用可能になり、個人開発者でもゼロコストからモデル訓練を開始できる環境が整った。

2026年2月20日

Unsloth × Hugging Face Jobs — 無料GPU枠でLLMファインチューニングが誰でも可能に

論文解説動画

SLA2とは？学習可能なルーティングとQATでビデオ拡散モデルのアテンションを18.6倍高速化する新手法

UC BerkeleyとTsinghua大学の共同研究「SLA2」が、学習可能なルーターとQATによりビデオ拡散モデルのアテンション計算を97%スパース化しながら18.6倍の高速化と品質向上を同時に実現しました。ICML 2025採択。

2026年2月20日

SLA2とは？学習可能なルーティングとQATでビデオ拡散モデルのアテンションを18.6倍高速化する新手法

ニュース技術

Google、Gemini 3.1 Proを発表 — ARC-AGI-2で前世代比2倍超の推論性能を達成

GoogleがARC-AGI-2で77.1%を達成した「Gemini 3.1 Pro」を発表。前世代比2倍超の推論性能向上が確認され、API料金は据え置きでGemini APIとVertex AI経由での即日利用が可能となった。

2026年2月20日

Google、Gemini 3.1 Proを発表 — ARC-AGI-2で前世代比2倍超の推論性能を達成

前へ
1
…
23
24
25
…
52
次へ

カテゴリ

論文解説
ニュース
- 技術
- ビジネス
AI最前線コラム

人気記事

MolmoAct2とは？GPT-5・Gemini Roboticsを超えたオープンVLAモデルを解説
2026年5月5日
SANA-WMとは？単一GPUで720p・60秒動画を生成するNVIDIAの効率的世界モデル
2026年5月15日
Sapiens2とは？MetaのヒューマンAI基盤モデルが5Bパラメータ・4K解像度で姿勢・法線・点群推定を統合
2026年4月29日
arXiv、AI任せ論文の著者を1年間投稿禁止へ — 学術AI利用規制が本格化
2026年5月17日
Absolicsのガラス基板とは？AIチップ性能を10倍高密度化する次世代パッケージング
2026年3月15日