記事一覧 (26ページ目) | AI-Papers

AI最前線コラム

AI-PapersAI論文解説・ニュースブログ

検索運営者情報お問い合わせプライバシーポリシー利用規約

© 2026 AI-Papers. All rights reserved.

論文解説強化学習

P-GenRM: ユーザーごとの好みに適応する生成報酬モデルがICLR 2026 Oralに採択

Alibaba Groupが提案するP-GenRMは、ユーザーごとの嗜好を構造化された評価チェーンに変換し、パーソナライズされた報酬モデルを実現する新手法です。テスト時スケーリング機構との組み合わせで従来手法を大幅に上回り、8Bモデルが70B規模を凌駕する成果を達成。ICLR 2026 Oralに採択されました。

2026年2月16日

P-GenRM: ユーザーごとの好みに適応する生成報酬モデルがICLR 2026 Oralに採択

AI最前線コラム

HuggingFace、AIエージェントにCUDAカーネル開発を教える「Agent Skill」をオープンソース公開

Hugging Faceが、AIコーディングエージェントにCUDAカーネル開発の専門知識を付与する「Agent Skill」をオープンソース公開しました。約550トークンの知識パッケージにより、Claude CodeやCodexがRMSNormなどの本番品質カーネルを自動生成し、PyTorch比最大2.47倍の高速化を達成しています。

2026年2月15日

HuggingFace、AIエージェントにCUDAカーネル開発を教える「Agent Skill」をオープンソース公開

論文解説強化学習

Composition-RL: 簡単な問題を組み合わせてLLMの推論力を伸ばす強化学習フレームワーク

Tencent Hunyuanが、強化学習で「簡単すぎる問題」を自動的に組み合わせて新たな複合問題を生成するComposition-RLを提案。4B〜30Bモデルで一貫した推論能力の向上を実現し、カリキュラム学習やクロスドメイン構成でさらなる改善を達成しました。

2026年2月15日

Composition-RL: 簡単な問題を組み合わせてLLMの推論力を伸ばす強化学習フレームワーク

ニュース技術

GPT-5.2がグルーオン散乱振幅の「ゼロ」定説を覆す一般公式を発見、12時間で形式的証明も完成

OpenAIのGPT-5.2 Proが、教科書で「ゼロになる」とされてきたグルーオン散乱振幅のシングルマイナス配置について一般公式を発見。内部モデルが12時間で形式的証明を完成させ、IAS・ハーバード等の物理学者と共同プレプリントとしてarXivに公開された。AI支援科学研究の新たなマイルストーンとなる成果。

2026年2月14日

GPT-5.2がグルーオン散乱振幅の「ゼロ」定説を覆す一般公式を発見、12時間で形式的証明も完成

論文解説画像

DeepGen 1.0：50億パラメータで大規模モデルを凌駕する画像生成・編集の統合AI

Shanghai Innovation Instituteが開発した50億パラメータの軽量モデル「DeepGen 1.0」は、画像生成と編集を統合的に処理し、800億パラメータのモデルを28%上回る性能を実現。独自のSCB手法と3段階学習戦略が鍵となっています。

2026年2月14日

DeepGen 1.0：50億パラメータで大規模モデルを凌駕する画像生成・編集の統合AI

AI最前線コラム

GLM-5とは？744BパラメータでClaude Opus級の性能を達成した中国発オープンソースAI

中国Zhipu AIが公開したオープンソースモデル「GLM-5」を解説。744Bパラメータ（MoE構成で40Bアクティブ）でClaude Opus 4.5を上回る性能を示し、API価格は約6分の1という特徴を紹介します。

2026年2月14日

GLM-5とは？744BパラメータでClaude Opus級の性能を達成した中国発オープンソースAI

論文解説強化学習

GigaBrain-0.5Mとは？World Model強化学習で次世代ロボット制御を実現するVLA

GigaAI発表の「GigaBrain-0.5M」を解説。World Modelベース強化学習（RAMP）により従来の模倣学習を30%上回る性能を実現したVLAモデルの仕組みと、実環境での成果を紹介します。

2026年2月14日

GigaBrain-0.5Mとは？World Model強化学習で次世代ロボット制御を実現するVLA

ニュース技術

AWS、新推論エンジン「Project Mantle」でオープンウェイトモデル6種を一挙サポート開始

AWSが新推論エンジン「Project Mantle」を発表し、DeepSeek V3.2やQwen3 Coder Nextなど6つのオープンウェイトモデルへの対応を開始しました。主要クラウドでのオープンモデル対応が拡大し、AI開発の選択肢と民主化がさらに進みます。

2026年2月13日

AWS、新推論エンジン「Project Mantle」でオープンウェイトモデル6種を一挙サポート開始

論文解説言語・LLM

Step 3.5 Flashとは？110億パラメータでGPT-5.2級の性能を達成したオープンモデル

StepFun社のオープンモデル「Step 3.5 Flash」を解説。110億の活動パラメータのみでGPT-5.2やGemini 3.0 Proに匹敵する性能を達成。スパースMoE設計と強化学習の革新に迫ります。

2026年2月13日

Step 3.5 Flashとは？110億パラメータでGPT-5.2級の性能を達成したオープンモデル

ニュースビジネス

ゴールドマン・サックスがClaude AIを会計業務に導入 — 金融AI活用の最前線

ゴールドマン・サックスがAnthropicのClaude AIを会計・コンプライアンス業務に導入した事例を解説。エンジニア6ヶ月常駐の共同開発で、オンボーディング時間30%短縮・開発者生産性20%向上の成果を紹介します。

2026年2月12日

ゴールドマン・サックスがClaude AIを会計業務に導入 — 金融AI活用の最前線

ニュース技術

OpenAIとAnthropic、わずか30分差で新AIコーディングモデルを競合リリース

2026年2月、AnthropicとOpenAIがわずか30分差でコーディング特化AIモデルを発表。Claude Sonnet 5はSWE-Bench 82.1%を達成し、GPT-5.3 Codexは25%の高速化を実現。OpenAI初のサイバーセキュリティ「High」分類も注目を集めている。

2026年2月11日

OpenAIとAnthropic、わずか30分差で新AIコーディングモデルを競合リリース

ニュースビジネス

OpenAI、ChatGPT無料版に広告表示を開始 — AI業界初の本格的広告モデル導入

OpenAIが2月9日、ChatGPTの無料版およびGoプランで広告表示テストを米国で開始しました。月間7.5億ユーザーを抱えるプラットフォームへの広告導入は、AI業界の収益モデルにおける大きな転換点です。有料プランは広告非表示を維持し、プライバシー保護にも配慮した設計となっています。

2026年2月11日

OpenAI、ChatGPT無料版に広告表示を開始 — AI業界初の本格的広告モデル導入

前へ
1
…
25
26
27
…
52
次へ

カテゴリ

論文解説
ニュース
- 技術
- ビジネス
AI最前線コラム

人気記事

MolmoAct2とは？GPT-5・Gemini Roboticsを超えたオープンVLAモデルを解説
2026年5月5日
SANA-WMとは？単一GPUで720p・60秒動画を生成するNVIDIAの効率的世界モデル
2026年5月15日
Sapiens2とは？MetaのヒューマンAI基盤モデルが5Bパラメータ・4K解像度で姿勢・法線・点群推定を統合
2026年4月29日
arXiv、AI任せ論文の著者を1年間投稿禁止へ — 学術AI利用規制が本格化
2026年5月17日
Absolicsのガラス基板とは？AIチップ性能を10倍高密度化する次世代パッケージング
2026年3月15日