スキル選択・実行・蒸留の3能力を単一の強化学習ポリシーで共進化させるSkill1フレームワークを解説。報酬信号を低周波と高周波に分解して各段階の信用割り当てに活用し、ALFWorldで97.5%の成功率を達成しています。
音声入力AIのWispr FlowがHinglish(ヒンディー語+英語)対応後にインドでの月次成長率が100%に加速。多言語市場でのローカライゼーション戦略と収益化の課題を解説します。
GRPOで全サンプルが失敗した際にLorem Ipsumテキストを前置するだけで探索空間を広げる「LoPE」を解説します。1.7B〜7Bモデルで最大+6.20ポイントの性能向上を達成しました。
採用管理企業Greenhouseの調査によると、米国求職者の63%がAI面接を経験済みながら、70%が事前告知なしに気づいたと回答。透明性の欠如と法的義務化を求める声を背景に、企業の採用設計が問われています。
SwiftI2Vは2段階フレームワークとCSG(セグメント単位生成)を組み合わせ、2K解像度のImage-to-Video生成においてGPU処理時間を202倍削減しながらVBench-I2Vで最高スコアを達成した新手法です。RTX 4090でも実用的な運用が可能です。
GoogleはAIスタジオ「Flow」と広告業界の著名クリエイター3名を組み合わせ、中小企業向けにスタジオ品質の広告を制作する「The Small Brief」を発表。最終キャンペーンは6月に公開予定。
Continuous-Time Distribution Matching(CDM)は、固定離散タイムステップへの依存を動的連続スケジュールで置き換えることで拡散モデルの蒸留を刷新。GANや報酬モデル不要で過平滑化を解消し、SD3-MediumとLongcat-Imageで4ステップの高品質生成を実現した新手法を解説します。
Nvidiaが2026年のわずか5ヶ月でAI企業への株式投資400億ドル超をコミット。チップメーカーからAIエコシステム全体の戦略的投資家へと転換する動向と、循環取引批判の実態を解説します。
Google DeepMindが開発した数学研究支援エージェント「AI Co-Mathematician」を解説します。非同期マルチエージェントで仮説立案から定理証明まで一貫支援し、FrontierMath Tier 4で全AIシステム中最高の48%を達成しました。
Allen AIが発表したEMOは、文書内のトークンが同じ専門家プールを共有するという制約から、健康・医療やニュース報道などのドメイン特化が自動発生するMoEモデルです。全専門家の12.5%のみで性能低下約3%に留まるため、デプロイコストの大幅削減が期待できます。
OpenAIがCodexの安全運用設計を公式解説。サンドボックス境界、承認ポリシー、ネットワーク分離、OpenTelemetryログで企業導入に必要なセキュリティ統制を実現する手法を紹介します。
埋め込みモデルとベクトル検索を使わず、grepやシェルで生コーパスを直接探索するDCI(Direct Corpus Interaction)がBRIGHTとBEIRで既存手法を大幅に上回ることを示した論文を解説します。
MolmoAct2とは?GPT-5・Gemini Roboticsを超えたオープンVLAモデルを解説
SANA-WMとは?単一GPUで720p・60秒動画を生成するNVIDIAの効率的世界モデル
Sapiens2とは?MetaのヒューマンAI基盤モデルが5Bパラメータ・4K解像度で姿勢・法線・点群推定を統合
arXiv、AI任せ論文の著者を1年間投稿禁止へ — 学術AI利用規制が本格化
HY-World 2.0とは?テキスト・画像・動画から3D世界を生成するマルチモーダルワールドモデル