記事一覧 (17ページ目)

WildDet3D とは？テキスト・点・ボックスプロンプトで動く単眼3D物体検出の仕組み

Allen Institute for AI が発表した WildDet3D は、単一RGB画像からオープンワールドの3D物体検出を行うフレームワークです。テキスト・点・ボックスの3種プロンプトに対応し、複数ベンチマークで最高精度を達成しました。

2026年4月14日

WildDet3D とは？テキスト・点・ボックスプロンプトで動く単眼3D物体検出の仕組み

AI最前線コラム

トークナイザーとは？LLMのAPI料金を左右する仕組みとBPE・tiktoken・日本語の課題を図解

トークナイザーはLLMがテキストをトークンに分割する仕組みで、API料金に直結します。BPE・tiktoken・日本語の課題を図解で解説します。

2026年4月13日

トークナイザーとは？LLMのAPI料金を左右する仕組みとBPE・tiktoken・日本語の課題を図解

ニュースビジネス

「日本AI基盤モデル開発」設立か — 4社が1兆パラメーターでフィジカルAI開発

ソフトバンク・NEC・ホンダ・ソニーを中核とする新会社「日本AI基盤モデル開発」の設立が報じられました。1兆パラメーター規模の国産AI基盤モデルを開発し、2030年度までにロボットと連携するフィジカルAI戦略を解説します。

2026年4月13日

「日本AI基盤モデル開発」設立か — 4社が1兆パラメーターでフィジカルAI開発

論文解説動画

Matrix-Game 3.0とは？720p・最大40FPSでリアルタイムを実現するインタラクティブワールドモデル

Matrix-Game 3.0は、Unreal Engineとゲームデータを活用した大規模学習と3段階の推論最適化により、720p・最大40FPSのリアルタイムインタラクティブ動画生成を実現した世界モデルです。ゲームや自動運転分野への実用化が注目されます。

2026年4月13日

Matrix-Game 3.0とは？720p・最大40FPSでリアルタイムを実現するインタラクティブワールドモデル

ニュースビジネス

アルトマンCEO、AGI権力集中を「権力の指輪」と警告 — 民主的管理を訴え

OpenAIのアルトマンCEOが自宅への火炎瓶事件後、AGI権力集中の危険性を「権力の指輪」に例えて警告。民主的なAIガバナンスの必要性を訴えるブログを公開した。

2026年4月12日

論文解説言語・LLM

推論SFTの一般化とは？「SFTは暗記のみ」を覆す条件付き実験分析

「SFTは暗記、RLは一般化」という通説を再考。長いCoTによる推論SFTでも最適化・データ品質・モデル能力の3条件が揃えばドメイン横断的な一般化が可能であることを解説します。

2026年4月12日

ニュース技術

OpenAI、Axiosのサプライチェーン攻撃に対応しmacOS証明書を更新

Axios v1.14.1へのサプライチェーン攻撃がOpenAIのGitHub Actionsワークフローに影響を及ぼし、macOSアプリ署名証明書が漏洩リスクにさらされました。原因の設定ミスと対応措置、5月8日の旧バージョン機能停止スケジュールを解説します。

2026年4月11日

論文解説マルチモーダル

HY-Embodied-0.5とは？ロボット専用VLMがGemini 3.0 Proを超えた仕組み

Tencent Hunyuanが発表したロボット専用VLM「HY-Embodied-0.5」を解説します。MoTアーキテクチャの仕組みから22ベンチマーク中16項目での最優秀達成、実ロボット操作の検証結果まで詳しく紹介します。

2026年4月11日

HY-Embodied-0.5とは？ロボット専用VLMがGemini 3.0 Proを超えた仕組み

ニュースビジネス

Gartnerが警告、2028年までに企業生成AIアプリの25%がセキュリティ事故、MCP普及でリスク拡大

Gartnerは2026年4月9日、2028年までに企業向け生成AIアプリの25%が年間5件以上のセキュリティ事故を経験すると予測。MCP普及がリスク拡大の主因と指摘し、具体的な4つの対策を提言しています。

2026年4月10日

Gartnerが警告、2028年までに企業生成AIアプリの25%がセキュリティ事故、MCP普及でリスク拡大

論文解説強化学習

RAGEN-2とは？「テンプレート崩壊」を相互情報量で診断するエージェントRL改善手法

Stanford・UW・Microsoftの研究チームが提案したRAGEN-2は、エントロピーでは検出できない「テンプレート崩壊」という新失敗モードを相互情報量で診断し、SNR-Awareフィルタリングで修正します。

2026年4月10日

RAGEN-2とは？「テンプレート崩壊」を相互情報量で診断するエージェントRL改善手法

AI最前線コラム

RAG vs ファインチューニング：コスト・精度・実装難易度で選ぶLLM最適化手法

RAGとファインチューニングをコスト・精度・実装難易度の3軸で徹底比較。PEFT・RAFT・Agentic RAGなど最新手法も解説し、実務エンジニアが最適なLLM最適化手法を選ぶ判断基準を紹介します。

2026年4月9日

RAG vs ファインチューニング：コスト・精度・実装難易度で選ぶLLM最適化手法

ニュース技術

Anthropic、「Claude Managed Agents」で本番AI開発を10倍高速化

AnthropicがAIエージェント管理プラットフォーム「Claude Managed Agents」パブリックβを公開。実行環境の自動管理とマルチエージェント協調機能で、本番AIエージェント開発の高速化と運用負荷軽減を実現します。

2026年4月9日

WildDet3D とは？テキスト・点・ボックスプロンプトで動く単眼3D物体検出の仕組み

トークナイザーとは？LLMのAPI料金を左右する仕組みとBPE・tiktoken・日本語の課題を図解

「日本AI基盤モデル開発」設立か — 4社が1兆パラメーターでフィジカルAI開発

Matrix-Game 3.0とは？720p・最大40FPSでリアルタイムを実現するインタラクティブワールドモデル

アルトマンCEO、AGI権力集中を「権力の指輪」と警告 — 民主的管理を訴え

推論SFTの一般化とは？「SFTは暗記のみ」を覆す条件付き実験分析

OpenAI、Axiosのサプライチェーン攻撃に対応しmacOS証明書を更新

HY-Embodied-0.5とは？ロボット専用VLMがGemini 3.0 Proを超えた仕組み

Gartnerが警告、2028年までに企業生成AIアプリの25%がセキュリティ事故、MCP普及でリスク拡大

RAGEN-2とは？「テンプレート崩壊」を相互情報量で診断するエージェントRL改善手法

RAG vs ファインチューニング：コスト・精度・実装難易度で選ぶLLM最適化手法

Anthropic、「Claude Managed Agents」で本番AI開発を10倍高速化

人気記事