東京大学松尾・岩澤研究室とさくらインターネットが、109Bパラメータの日本語医療特化LLM「Weblab-MedLLM-109B」を共同開発しました。医学知識ベンチマークでo1を超える93.3%を達成し、3月5日から研究者に無償提供が開始されています。
GoogleがGemini 3シリーズの最速・最安モデル「Gemini 3.1 Flash-Lite」を発表しました。前世代比で応答速度2.5倍、入力100万トークン0.25ドルの低価格で大量処理ワークロードに対応します。
OpenAIが2026年2月25日、AIモデルの悪用事例をまとめた最新脅威レポートを公開しました。複数プラットフォームを横断するハイブリッド攻撃の実態から、カンボジア発ロマンス詐欺、中国・ロシアの情報工作まで7つの事例を解説します。
AnthropicがAIコーディングエージェント「Claude Code」の新機能「Remote Control」をリサーチプレビューで公開。スマートフォンやタブレットからローカルマシンのセッションを遠隔操作でき、コードはクラウドに渡らない設計です。
OpenAIが2026年2月、コーディングAI評価の業界標準「SWE-bench Verified」の廃止を公式発表。審査した問題の過半数にテスト欠陥があり、主要3モデルすべてで学習データへの汚染が確認されたことが理由です。
OpenAIが数学コンペ「First Proof」の全10問にAIモデルで挑戦し、専門家評価で少なくとも5問が正解の可能性ありと判定。研究レベルの定理証明における形式的推論能力の到達点と今後の展望を解説します。
llama.cppの作者Georgi Gerganov氏とGGMLチームがHugging Faceに参加。プロジェクトの独立性・オープンソース方針を維持しつつ、transformersとの統合によりローカルAI推論のワンクリック実行を目指します。
GoogleがARC-AGI-2で77.1%を達成した「Gemini 3.1 Pro」を発表。前世代比2倍超の推論性能向上が確認され、API料金は据え置きでGemini APIとVertex AI経由での即日利用が可能となった。
GoogleがDeepMindの最新AI音楽生成モデル「Lyria 3」をGeminiアプリに統合。テキストや写真から30秒のオリジナル楽曲を生成する機能の詳細と、著作権保護の仕組みを解説します。
NVIDIAが日本語特化の90億パラメータLLM「Nemotron-Nano-9B-v2-Japanese」を公開。Nejumi Leaderboard 4の10B以下カテゴリで1位を獲得し、最大6倍のスループット向上とエージェント能力を両立したソブリンAI向けモデルの詳細を解説します。
OpenAIのGPT-5.2 Proが、教科書で「ゼロになる」とされてきたグルーオン散乱振幅のシングルマイナス配置について一般公式を発見。内部モデルが12時間で形式的証明を完成させ、IAS・ハーバード等の物理学者と共同プレプリントとしてarXivに公開された。AI支援科学研究の新たなマイルストーンとなる成果。
AWSが新推論エンジン「Project Mantle」を発表し、DeepSeek V3.2やQwen3 Coder Nextなど6つのオープンウェイトモデルへの対応を開始しました。主要クラウドでのオープンモデル対応が拡大し、AI開発の選択肢と民主化がさらに進みます。
Anthropic、Coefficient Bioを約4億ドルで買収、AI創薬に本格参入
AIエージェントフレームワーク比較【2026】LangGraph・CrewAI・OpenAI Agents SDKの選び方
Absolicsのガラス基板とは?AIチップ性能を10倍高密度化する次世代パッケージング
ベクトルデータベース比較【2026年版】Pinecone・Qdrant・Weaviate・Milvusを徹底解説
ゴールドマン・サックスがClaude AIを会計業務に導入 — 金融AI活用の最前線