Ctrlk

Welcome!
常用工具手册
论文收集
网站或工具收藏
学习记录
- 强化学习
  - GRPO
    GRPO Llama-1B
- Python tools
图片墙
- 晓美焰
东方 Project
Nikke

Powered by GitBook

On this page

学习记录
强化学习

GRPO

参考材料

GRPO Llama-1B: This GitHub demo shows how to use GRPO to train custom LLMs.

Previous强化学习 NextGRPO Llama-1B

Last updated 6 months ago