記事一覧 (14ページ目) | AI-Papers

AI最前線コラム

AI-PapersAI論文解説・ニュースブログ

検索運営者情報お問い合わせプライバシーポリシー利用規約

© 2026 AI-Papers. All rights reserved.

論文解説動画

UniVidXとは？動画・アルベド・法線・RGBAを1モデルで統一生成する新手法

動画・アルベド・法線・RGBAを単一モデルで統一生成するフレームワーク「UniVidX」をSIGGRAPH 2026に発表。1,000本未満のデータで既存SOTAと同等以上の性能を達成しています。

2026年5月5日

UniVidXとは？動画・アルベド・法線・RGBAを1モデルで統一生成する新手法

AI最前線コラム

RLHF・DPO・GRPOとは？ChatGPTとDeepSeek-R1を支えるLLMアライメント技術をわかりやすく解説

RLHF・DPO・GRPOはLLMを人間の価値観に合わせるアライメント技術です。ChatGPTの基盤RLHFから効率化されたDPO、DeepSeek-R1を支えるGRPOまで、仕組みと違いを初学者向けにわかりやすく解説します。

2026年5月4日

RLHF・DPO・GRPOとは？ChatGPTとDeepSeek-R1を支えるLLMアライメント技術をわかりやすく解説

ニュース技術

OpenAI o1、救急トリアージ診断で内科医2名を上回る — ハーバード研究

ハーバード医科大学とBeth Israel医療センターの共同研究がScience誌に掲載。OpenAI o1が救急トリアージ診断で67%の正確率を達成し、内科専門医2名（55%・50%）を上回りました。医療AIの実用化議論に新たなエビデンスが加わりました。

2026年5月4日

OpenAI o1、救急トリアージ診断で内科医2名を上回る — ハーバード研究

論文解説言語・LLM

RoundPipeとは？コンシューマーGPU複数台でLLMファインチューニングを最大2.16倍高速化する新スケジューリング手法

パイプライン並列化の「weight binding問題」を解消する新手法RoundPipeを解説します。GPUをステートレスなワーカープールとして扱うラウンドロビン方式で8×RTX 4090でのLLMファインチューニングを最大2.16倍高速化し、単一コンシューマーサーバーでQwen3-235BのLoRAチューニングを実現します。

2026年5月4日

RoundPipeとは？コンシューマーGPU複数台でLLMファインチューニングを最大2.16倍高速化する新スケジューリング手法

ニュースビジネス

Replit CEO、Cursorとの売却交渉・Apple対立・独立維持の真相を語る

Replit CEO Amjad Masad氏が、Cursorとの買収交渉の内幕、AppleのApp Storeブロックとの摩擦、粗利益プラスを根拠に独立を維持する戦略をインタビューで明かした。

2026年5月3日

Replit CEO、Cursorとの売却交渉・Apple対立・独立維持の真相を語る

論文解説マルチモーダル

Eywaとは？科学基盤モデルをLLMエージェントに統合するヘテロジニアスフレームワーク

UIUCが提案するEywaは、時系列・表形式データを扱う科学基盤モデルをLLMエージェントと統合するフレームワークです。3層設計と双方向Tsaheyluインターフェースにより、従来比7%の性能向上と30%のトークン削減を実証しました。

2026年5月3日

Eywaとは？科学基盤モデルをLLMエージェントに統合するヘテロジニアスフレームワーク

ニュースビジネス

マスク対オルトマン裁判第1週：xAIがOpenAIモデル蒸留を認め業界に衝撃

マスク氏が自社xAIによるOpenAIモデルの蒸留を法廷で認め、波紋が広がっています。非営利から営利への転換の合法性を問う本裁判の第1週の主要証言を解説します。

2026年5月2日

マスク対オルトマン裁判第1週：xAIがOpenAIモデル蒸留を認め業界に衝撃

ニュース技術

Google DeepMind「AI Co-Clinician」発表 — 三者協働医療モデルとは？

Google DeepMindが発表した「AI Co-Clinician」は、医師・AI・患者が協働する三者医療モデルを提唱。140以上の診療指標で遠隔診療AIの性能を多角的に評価します。

2026年5月1日

Google DeepMind「AI Co-Clinician」発表 — 三者協働医療モデルとは？

論文解説マルチモーダル

MiniCPM-o 4.5とは？全二重リアルタイム・オムニモーダルインタラクションを9Bで実現

9BパラメータながらGemini 2.5 Flashに匹敵する視覚言語性能を実現したMiniCPM-o 4.5。Omni-Flowが可能にする全二重リアルタイム対話の仕組みと性能を解説します。

2026年5月1日

MiniCPM-o 4.5とは？全二重リアルタイム・オムニモーダルインタラクションを9Bで実現

AI最前線コラム

MoE（Mixture of Experts）とは？スパースアーキテクチャがLLMの性能と効率を両立できる理由をわかりやすく解説

MoE（Mixture of Experts）の仕組みとDenseモデルとの違い、ゲーティング機構・負荷分散の課題から、Mixtral・DeepSeek V3・Gemma 4など主要LLMへの応用まで初学者向けにわかりやすく解説します。

2026年4月30日

MoE（Mixture of Experts）とは？スパースアーキテクチャがLLMの性能と効率を両立できる理由をわかりやすく解説

ニュース技術

LLMはなぜ日本文化に偏る？欧州研究が明かすAIの隠れた文化バイアス

スペイン・バスク大学と英カーディフ大学の研究チームが、GPT-4o-miniなど8つのLLMを独自データセットで評価。6モデルで日本が最頻参照国となる文化的偏りの実態と、その原因がファインチューニングにあることを明らかにしました。

2026年4月30日

LLMはなぜ日本文化に偏る？欧州研究が明かすAIの隠れた文化バイアス

論文解説マルチモーダル

Sapiens2とは？MetaのヒューマンAI基盤モデルが5Bパラメータ・4K解像度で姿勢・法線・点群推定を統合

MetaのFacebook Researchが発表したSapiens2は、10億枚の人物画像で事前学習した0.4B〜5Bパラメータの統合基盤モデルです。姿勢推定+4 mAP・法線推定誤差45.6%削減を達成し、ICLR 2026に採択されました。

2026年4月29日

Sapiens2とは？MetaのヒューマンAI基盤モデルが5Bパラメータ・4K解像度で姿勢・法線・点群推定を統合

前へ
1
…
13
14
15
…
52
次へ

カテゴリ

論文解説
ニュース
- 技術
- ビジネス
AI最前線コラム

人気記事

MolmoAct2とは？GPT-5・Gemini Roboticsを超えたオープンVLAモデルを解説
2026年5月5日
SANA-WMとは？単一GPUで720p・60秒動画を生成するNVIDIAの効率的世界モデル
2026年5月15日
Sapiens2とは？MetaのヒューマンAI基盤モデルが5Bパラメータ・4K解像度で姿勢・法線・点群推定を統合
2026年4月29日
arXiv、AI任せ論文の著者を1年間投稿禁止へ — 学術AI利用規制が本格化
2026年5月17日
HY-World 2.0とは？テキスト・画像・動画から3D世界を生成するマルチモーダルワールドモデル
2026年4月17日