大模型笔记
Home
0.inbox
[Read]2025 04
Alg interview faq
1.[基建]数据
Data
3.[基建]效率
Inference
Train
4.[模型]文本
Embedding
PostTraining
PreTraining
5.[模型]多模态
MultiModalEmbedding
T2V
VLA
VLM
6.[模型]评测
Benchmark
7.[应用]产品
Agent
Product
VibeCoding
大模型笔记
5.[模型]多模态
T2V
文章
#
[2023.05]
Training Diffusion Models with Reinforcement Learning
用VLM+RL训练Diffusion模型
jannerm/ddpo
[2025.05]
DanceGRPO: Unleashing GRPO on Visual Generation
« Previous
Next »