AI-Papers

AI最前線コラム

AI-PapersAI論文解説・ニュースブログ

検索運営者情報お問い合わせプライバシーポリシー利用規約

論文解説の記事一覧 (21ページ目) | AI-Papers

ホーム
論文解説

論文解説

データセット論文解説

時系列データ解析のための生成モデル「PaD-TS」

本記事で使用している画像は論文中の図表、またはそれを参考に作成した画像を使用しております。本論文の概要この論文では、時系列データを生成するために新しいモデル「Population-Aware Diffusion fo […]

2025年1月27日

言語・LLM論文解説

長文タスクに優れたエンコーディング「TAPE」で頑健性と効率性を向上

本記事で使用している画像は論文中の図表、またはそれを参考に作成した画像を使用しております。本論文の概要本論文では、Transformerモデルの性能を向上させる新しい位置エンコーディングフレームワーク「TAPE（Tr […]

2025年1月27日

動画論文解説

動画の細粒度認識のための半教師あり学習手法「SeFAR」

本記事で使用している画像は論文中の図表、またはそれを参考に作成した画像を使用しております。本論文の概要この論文では、動画データに基づいた細粒度動作認識を対象として、新しい半教師あり学習フレームワーク「SeFAR」を提 […]

2025年1月27日

言語・LLM論文解説

SSMの長期依存タスクの性能向上を実現する新手法

本記事で使用している画像は論文中の図表、またはそれを参考に作成した画像を使用しております。本論文の概要この論文では、State Space Models（SSM）における情報の再現性や長期的依存関係の限界を克服するた […]

2025年1月27日

動画論文解説

LTX-Videoとは？リアルタイムで高品質な動画を生成するAIモデルの仕組み

Lightricks開発の動画生成AI「LTX-Video」の技術詳細を解説。Video Latent Diffusionにより、リアルタイムで高品質な動画生成を実現する仕組みとアーキテクチャの特徴を紹介します。

2025年1月27日

マルチモーダル論文解説

画像の安全性を自動判断するAI技術「MLLM-as-a-Judge」

本記事で使用している画像は論文中の図表、またはそれを参考に作成した画像を使用しております。本論文の概要この論文では、画像が有害かどうかを判断する手法「MLLM-as-a-Judge」を提案しています。この方法は、大規 […]

2025年1月26日

言語・LLM論文解説

【CodeRM-88】コード生成評価を改善する新手法

本記事で使用している画像は論文中の図表、またはそれを参考に作成した画像を使用しております。本論文の概要この論文では、コード生成モデルの評価における課題を克服するため、CodeRM-88という新たな手法が提案されていま […]

2025年1月26日

言語・LLM論文解説

【A3】モバイルアプリ上で動作するエージェント評価

本記事で使用している画像は論文中の図表、またはそれを参考に作成した画像を使用しております。本論文の概要本論文では、モバイルアプリのGUI（グラフィカルユーザインタフェース）上で動作するエージェントを評価・改善するため […]

2025年1月25日

データセット論文解説

GPT-4で地理情報推論力を評価するデータセット「MapEval」の提案

本記事で使用している画像は論文中の図表、またはそれを参考に作成した画像を使用しております。本論文の概要この論文では、地理空間推論能力を評価するための新しいベンチマークデータセット「MapEval」が提案されています。 […]

2025年1月24日

言語・LLM論文解説

生成回答を改善する自己修正手法「ProgCo」の効果やいかに

本記事で使用している画像は論文中の図表、またはそれを参考に作成した画像を使用しております。本論文の概要本論文では、言語モデル（LLM）における自己修正能力を強化する新しい手法「ProgCo（Program-drive […]

2025年1月14日

画像論文解説

VF LossでLightDiffusionDTの速度2.5倍向上

本記事で使用している画像は論文中の図表、またはそれを参考に作成した画像を使用しております。本論文の概要この論文では、「Latent Diffusion Models（LDM）」における再構成と生成のトレードオフ問題を […]

2025年1月14日

データセット論文解説

YouTubeの教育動画データセットで視覚質問の応答性能を向上

本記事で使用している画像は論文中の図表、またはそれを参考に作成した画像を使用しております。本論文の概要この研究では、視覚と言語の統合された事前学習を可能にする「Multimodal-Textboo」と呼ばれる新しいデ […]

2025年1月7日

論文解説

時系列データ解析のための生成モデル「PaD-TS」

長文タスクに優れたエンコーディング「TAPE」で頑健性と効率性を向上

動画の細粒度認識のための半教師あり学習手法「SeFAR」

SSMの長期依存タスクの性能向上を実現する新手法

LTX-Videoとは？リアルタイムで高品質な動画を生成するAIモデルの仕組み

画像の安全性を自動判断するAI技術「MLLM-as-a-Judge」

【CodeRM-88】コード生成評価を改善する新手法

【A3】モバイルアプリ上で動作するエージェント評価

GPT-4で地理情報推論力を評価するデータセット「MapEval」の提案

生成回答を改善する自己修正手法「ProgCo」の効果やいかに

VF LossでLightDiffusionDTの速度2.5倍向上

YouTubeの教育動画データセットで視覚質問の応答性能を向上

人気記事