Alibaba Groupが提案するP-GenRMは、ユーザーごとの嗜好を構造化された評価チェーンに変換し、パーソナライズされた報酬モデルを実現する新手法です。テスト時スケーリング機構との組み合わせで従来手法を大幅に上回り、8Bモデルが70B規模を凌駕する成果を達成。ICLR 2026 Oralに採択されました。
Hugging Faceが、AIコーディングエージェントにCUDAカーネル開発の専門知識を付与する「Agent Skill」をオープンソース公開しました。約550トークンの知識パッケージにより、Claude CodeやCodexがRMSNormなどの本番品質カーネルを自動生成し、PyTorch比最大2.47倍の高速化を達成しています。
Tencent Hunyuanが、強化学習で「簡単すぎる問題」を自動的に組み合わせて新たな複合問題を生成するComposition-RLを提案。4B〜30Bモデルで一貫した推論能力の向上を実現し、カリキュラム学習やクロスドメイン構成でさらなる改善を達成しました。
OpenAIのGPT-5.2 Proが、教科書で「ゼロになる」とされてきたグルーオン散乱振幅のシングルマイナス配置について一般公式を発見。内部モデルが12時間で形式的証明を完成させ、IAS・ハーバード等の物理学者と共同プレプリントとしてarXivに公開された。AI支援科学研究の新たなマイルストーンとなる成果。
Shanghai Innovation Instituteが開発した50億パラメータの軽量モデル「DeepGen 1.0」は、画像生成と編集を統合的に処理し、800億パラメータのモデルを28%上回る性能を実現。独自のSCB手法と3段階学習戦略が鍵となっています。
中国Zhipu AIが公開したオープンソースモデル「GLM-5」を解説。744Bパラメータ(MoE構成で40Bアクティブ)でClaude Opus 4.5を上回る性能を示し、API価格は約6分の1という特徴を紹介します。
GigaAI発表の「GigaBrain-0.5M」を解説。World Modelベース強化学習(RAMP)により従来の模倣学習を30%上回る性能を実現したVLAモデルの仕組みと、実環境での成果を紹介します。
AWSが新推論エンジン「Project Mantle」を発表し、DeepSeek V3.2やQwen3 Coder Nextなど6つのオープンウェイトモデルへの対応を開始しました。主要クラウドでのオープンモデル対応が拡大し、AI開発の選択肢と民主化がさらに進みます。
StepFun社のオープンモデル「Step 3.5 Flash」を解説。110億の活動パラメータのみでGPT-5.2やGemini 3.0 Proに匹敵する性能を達成。スパースMoE設計と強化学習の革新に迫ります。
ゴールドマン・サックスがAnthropicのClaude AIを会計・コンプライアンス業務に導入した事例を解説。エンジニア6ヶ月常駐の共同開発で、オンボーディング時間30%短縮・開発者生産性20%向上の成果を紹介します。
2026年2月、AnthropicとOpenAIがわずか30分差でコーディング特化AIモデルを発表。Claude Sonnet 5はSWE-Bench 82.1%を達成し、GPT-5.3 Codexは25%の高速化を実現。OpenAI初のサイバーセキュリティ「High」分類も注目を集めている。
OpenAIが2月9日、ChatGPTの無料版およびGoプランで広告表示テストを米国で開始しました。月間7.5億ユーザーを抱えるプラットフォームへの広告導入は、AI業界の収益モデルにおける大きな転換点です。有料プランは広告非表示を維持し、プライバシー保護にも配慮した設計となっています。
MolmoAct2とは?GPT-5・Gemini Roboticsを超えたオープンVLAモデルを解説
SANA-WMとは?単一GPUで720p・60秒動画を生成するNVIDIAの効率的世界モデル
Sapiens2とは?MetaのヒューマンAI基盤モデルが5Bパラメータ・4K解像度で姿勢・法線・点群推定を統合
arXiv、AI任せ論文の著者を1年間投稿禁止へ — 学術AI利用規制が本格化
Absolicsのガラス基板とは?AIチップ性能を10倍高密度化する次世代パッケージング