AI最前線コラム

AI-PapersAI論文解説・ニュースブログ

検索運営者情報お問い合わせプライバシーポリシー利用規約

ホーム
論文解説
言語・LLM

言語・LLM

言語・LLM論文解説

【WACK】LLMのハルシネーションを2種類に区別する手法！幻覚の種類に応じた対処が可能に

本記事で使用している画像は論文中の図表、またはそれを参考に作成した画像を使用しております。この研究のポイントは？本論文は、大規模言語モデル(LLM)の「誤った出力(ハルシネーション)」について、その原因を「知識の欠如 […]

2024年11月3日

【WACK】LLMのハルシネーションを2種類に区別する手法！幻覚の種類に応じた対処が可能に

言語・LLM論文解説

SDTTとは？自己蒸留でLLMを高速化し32トークン同時生成を実現する新手法

LLM高速化手法「Self-Distillation Through Time（SDTT）」を解説。自己蒸留により投機的デコーディングを改善し、最大32トークンの同時生成を実現する仕組みと性能評価を紹介します。

2024年11月2日

言語・LLM論文解説

GPT-4oの異なる音声入力に対する性能を多様な国のデータを用いて評価

本記事で使用している画像は論文中の図表、またはそれを参考に作成した画像を使用しております。この研究のポイントは？本論文の内容は、GPT-4の音声性能に関するもので、多様な形式の情報を処理できるモデルの特性やリスクを評 […]

2024年10月31日

言語・LLM論文解説

【AgentStore】特定タスクに対する最適なエージェントの組み合わせを自動選択

本記事で使用している画像は論文中の図表、またはそれを参考に作成した画像を使用しております。この研究のポイントは？本論文は、異なるAIエージェントを柔軟かつスケーラブルに統合するためのプラットフォーム「AgentSto […]

2024年10月30日

【AgentStore】特定タスクに対する最適なエージェントの組み合わせを自動選択

言語・LLM論文解説

ポーランド語専用のLLM「Bielik 7B v0.1」が公開！

本記事で使用している画像は論文中の図表、またはそれを参考に作成した画像を使用しております。この研究のポイントは？この論文は、ポーランド語に特化した言語モデル「Bielik 7B v0.1」の開発とその評価について述べ […]

2024年10月29日

言語・LLM論文解説

【jina-embeddings-v3】LoRAアダプターを導入し最大8192トークン処理可能に！

本記事で使用している画像は論文中の図表、またはそれを参考に作成した画像を使用しております。この研究のポイントは？本論文は、「jina-embeddings-v3」という多言語対応のテキスト埋め込みモデルを提案していま […]

2024年9月23日

【jina-embeddings-v3】LoRAアダプターを導入し最大8192トークン処理可能に！

言語・LLM論文解説

TransformerにCoTを導入することで全ての推論問題を解決できる！

本記事で使用している画像は論文中の図表、またはそれを参考に作成した画像を使用しております。この研究のポイントは？本論文の内容は、「Transformerが複雑な計算を苦手とする」という課題に対し、「Chain of […]

2024年9月22日

言語・LLM論文解説

Synthetic Continued Pretrainingとは？小規模データで効率的にLLMの知識を獲得する手法

スタンフォード大学が提案する「Synthetic Continued Pretraining」を解説。小規模なドメイン固有データから合成データを生成し、効率的にLLMへ知識を獲得させる新手法の仕組みと成果を紹介します。

2024年9月21日

Synthetic Continued Pretrainingとは？小規模データで効率的にLLMの知識を獲得する手法

言語・LLM論文解説

【MobileLLM】スマホ上でも高性能に動作する小型の言語モデル！

本記事で使用している画像は論文中のもの、紹介スライドのもの、またはそれを参考に作成したものを使用しております。この研究のポイントは？本論文は、モバイルデバイス上で効率的に動作する小規模の言語モデル「MobileLLM […]

2024年9月19日

言語・LLM論文解説

LLMには科学研究のアイデアを生み出す能力がある？研究者は無くなるのか

本記事で使用している画像は論文中のもの、紹介スライドのもの、またはそれを参考に作成したものを使用しております。この研究のポイントは？この論文は、大規模言語モデル(LLM)が新しい科学研究のアイデアを生み出す可能性につ […]

2024年9月17日

言語・LLM

【WACK】LLMのハルシネーションを2種類に区別する手法！幻覚の種類に応じた対処が可能に

SDTTとは？自己蒸留でLLMを高速化し32トークン同時生成を実現する新手法

GPT-4oの異なる音声入力に対する性能を多様な国のデータを用いて評価

【AgentStore】特定タスクに対する最適なエージェントの組み合わせを自動選択

ポーランド語専用のLLM「Bielik 7B v0.1」が公開！

【jina-embeddings-v3】LoRAアダプターを導入し最大8192トークン処理可能に！

TransformerにCoTを導入することで全ての推論問題を解決できる！

Synthetic Continued Pretrainingとは？小規模データで効率的にLLMの知識を獲得する手法

【MobileLLM】スマホ上でも高性能に動作する小型の言語モデル！

LLMには科学研究のアイデアを生み出す能力がある？研究者は無くなるのか

人気記事