OpenAIがアプリケーションセキュリティ特化のAIエージェント「Codex Security」を研究プレビュー公開しました。プロジェクト全体のコンテキストを解析し、複雑な脆弱性を自律的に検出・検証・修正します。
OpenAIが2026年3月5日に発表したGPT-5.4は、コーディング・コンピューター操作・100万トークンを1つに統合したプロ向けモデルです。OSWorldで人間の基準値を上回る75%を達成しました。
東京大学松尾・岩澤研究室とさくらインターネットが、109Bパラメータの日本語医療特化LLM「Weblab-MedLLM-109B」を共同開発しました。医学知識ベンチマークでo1を超える93.3%を達成し、3月5日から研究者に無償提供が開始されています。
GoogleがGemini 3シリーズの最速・最安モデル「Gemini 3.1 Flash-Lite」を発表しました。前世代比で応答速度2.5倍、入力100万トークン0.25ドルの低価格で大量処理ワークロードに対応します。
OpenAIが2026年2月25日、AIモデルの悪用事例をまとめた最新脅威レポートを公開しました。複数プラットフォームを横断するハイブリッド攻撃の実態から、カンボジア発ロマンス詐欺、中国・ロシアの情報工作まで7つの事例を解説します。
AnthropicがAIコーディングエージェント「Claude Code」の新機能「Remote Control」をリサーチプレビューで公開。スマートフォンやタブレットからローカルマシンのセッションを遠隔操作でき、コードはクラウドに渡らない設計です。
OpenAIが2026年2月、コーディングAI評価の業界標準「SWE-bench Verified」の廃止を公式発表。審査した問題の過半数にテスト欠陥があり、主要3モデルすべてで学習データへの汚染が確認されたことが理由です。
OpenAIが数学コンペ「First Proof」の全10問にAIモデルで挑戦し、専門家評価で少なくとも5問が正解の可能性ありと判定。研究レベルの定理証明における形式的推論能力の到達点と今後の展望を解説します。
llama.cppの作者Georgi Gerganov氏とGGMLチームがHugging Faceに参加。プロジェクトの独立性・オープンソース方針を維持しつつ、transformersとの統合によりローカルAI推論のワンクリック実行を目指します。
GoogleがARC-AGI-2で77.1%を達成した「Gemini 3.1 Pro」を発表。前世代比2倍超の推論性能向上が確認され、API料金は据え置きでGemini APIとVertex AI経由での即日利用が可能となった。
GoogleがDeepMindの最新AI音楽生成モデル「Lyria 3」をGeminiアプリに統合。テキストや写真から30秒のオリジナル楽曲を生成する機能の詳細と、著作権保護の仕組みを解説します。
NVIDIAが日本語特化の90億パラメータLLM「Nemotron-Nano-9B-v2-Japanese」を公開。Nejumi Leaderboard 4の10B以下カテゴリで1位を獲得し、最大6倍のスループット向上とエージェント能力を両立したソブリンAI向けモデルの詳細を解説します。
ゴールドマン・サックスがClaude AIを会計業務に導入 — 金融AI活用の最前線
NVIDIAが日本語特化LLM「Nemotron 2 Nano 9B」を公開 — ソブリンAI実現に向けた性能を解説
AIエージェントフレームワーク比較【2026】LangGraph・CrewAI・OpenAI Agents SDKの選び方
開発者向け検索AI「Phind 2」登場、視覚的検索強化!
Step 3.5 Flashとは?110億パラメータでGPT-5.2級の性能を達成したオープンモデル