記事一覧 (22ページ目)

Heliosとは？KV-cacheなしで19.5 FPS達成するリアルタイム長時間動画生成モデル

KV-cacheや量子化を一切使わずに単一H100 GPUで19.5 FPSを実現した14B自己回帰拡散モデル「Helios」。長時間動画のdrifting問題もトレーニング戦略で根本解決し、T2V・I2V・V2Vをネイティブサポートします。

2026年3月6日

Heliosとは？KV-cacheなしで19.5 FPS達成するリアルタイム長時間動画生成モデル

AI最前線コラム

LoRA（ローラ）とは？仕組み・QLoRA・DoRAとの違い・LLM/画像生成AIでの活用方法をわかりやすく解説

LoRA（Low-Rank Adaptation）の仕組みから、QLoRA・DoRA・RSLoRAなど最新の発展形まで、LLMと画像生成AI両方の活用方法をわかりやすく解説します。

2026年3月5日

LoRA（ローラ）とは？仕組み・QLoRA・DoRAとの違い・LLM/画像生成AIでの活用方法をわかりやすく解説

ニュース技術

東大、医療特化LLM「Weblab-MedLLM-109B」を研究者に無償公開、o1超え93.3%

東京大学松尾・岩澤研究室とさくらインターネットが、109Bパラメータの日本語医療特化LLM「Weblab-MedLLM-109B」を共同開発しました。医学知識ベンチマークでo1を超える93.3%を達成し、3月5日から研究者に無償提供が開始されています。

2026年3月5日

東大、医療特化LLM「Weblab-MedLLM-109B」を研究者に無償公開、o1超え93.3%

論文解説言語・LLM

PRISMとは？PRM誘導の粒子的洗練でAIME25 90%を達成する推論アルゴリズム

推論候補解を粒子として扱い、PRM（プロセス報酬モデル）のスコアで逐次洗練するアルゴリズム「PRISM」を解説します。gpt-oss-20bでAIME25 90.0%・GPQA Diamond 71.4%を達成し、6倍大きなモデルと同等の性能を計算効率よく実現。

2026年3月5日

PRISMとは？PRM誘導の粒子的洗練でAIME25 90%を達成する推論アルゴリズム

ニュース技術

Google、Gemini 3.1 Flash-Liteを発表。大規模利用で速度とコスト効率を両立した最速AIモデル

GoogleがGemini 3シリーズの最速・最安モデル「Gemini 3.1 Flash-Lite」を発表しました。前世代比で応答速度2.5倍、入力100万トークン0.25ドルの低価格で大量処理ワークロードに対応します。

2026年3月4日

Google、Gemini 3.1 Flash-Liteを発表。大規模利用で速度とコスト効率を両立した最速AIモデル

論文解説マルチモーダル

OmniLottieとは？マルチモーダル指示からLottieアニメーションを自動生成する新フレームワーク

テキスト・画像・動画の3種類のマルチモーダル指示からLottie形式のベクターアニメーションを自動生成するフレームワーク「OmniLottie」を解説します。専用トークナイザーと200万件データセットMMLottie-2Mによる仕組みを詳しく紹介します。

2026年3月4日

OmniLottieとは？マルチモーダル指示からLottieアニメーションを自動生成する新フレームワーク

ニュースビジネス

AIコーディングツール「Cursor」の年間収益が20億ドルを突破、わずか3ヶ月で倍増

2026年3月2日のBloomberg報道によると、AIコーディングツール「Cursor」のARRが20億ドルを突破しました。2025年末の約10億ドルから3ヶ月で倍増した急成長の背景を解説します。

2026年3月3日

AIコーディングツール「Cursor」の年間収益が20億ドルを突破、わずか3ヶ月で倍増

論文解説強化学習

CUDA Agentとは？強化学習でGPUカーネルを自動最適化してtorch.compileを超える新手法

ByteDance Seedが開発したCUDA Agentは、アジェンティック強化学習でGPUカーネルを自動生成・最適化します。KernelBenchで幾何平均2.11倍のスピードアップを達成し、Claude Opus 4.5やGemini 3 Proなどフロンティアモデルを大きく凌駕する性能を実証しました。

2026年3月3日