Tutorials¶

Hands-on tutorials to help you master Flux for various RLHF training scenarios.

Learning Path¶

graph LR
    A[Basic RLHF] --> B[Custom Rewards]
    B --> C[Multi-GPU]
    C --> D[DPO Training]
    D --> E[Adaptive Async]
    E --> F[Production]

Basic RLHF Training

Complete walkthrough of training an LLM with RLHF using Flux.

Time: 30 minutes Prerequisites: Flux installed

Start Tutorial
Custom Reward Functions

Learn to create custom reward functions for your specific task.

Time: 20 minutes Prerequisites: Basic RLHF tutorial

Start Tutorial

Multi-GPU Training

Scale your training across multiple GPUs on a single node.

Time: 45 minutes Prerequisites: Basic training working

Start Tutorial
Fine-tuning with DPO

Use Direct Preference Optimization for preference learning.

Time: 30 minutes Prerequisites: Preference data available

Start Tutorial

Adaptive Async in Practice

Deep dive into configuring and monitoring adaptive async control.

Time: 60 minutes Prerequisites: Multi-GPU training

Start Tutorial
Production Deployment

Deploy Flux training at scale with monitoring and fault tolerance.

Time: 90 minutes Prerequisites: All previous tutorials

Start Tutorial

Tutorial	Difficulty	Time	Key Topics
Basic RLHF	Beginner	30 min	FluxTrainer, GRPO, basic config
Custom Rewards	Beginner	20 min	RewardFunction, FunctionReward
Multi-GPU	Intermediate	45 min	TP, DP, distributed training
DPO Training	Intermediate	30 min	DPO algorithm, preference data
Adaptive Async	Advanced	60 min	PID tuning, staleness monitoring
Production	Advanced	90 min	Monitoring, checkpoints, scaling

Each tutorial follows a consistent structure:

Complete example projects you can clone and run:

Train a model for mathematical reasoning using GRPO.

git clone https://github.com/flux-team/flux-examples
cd flux-examples/math-reasoning
./run.sh

Train a model for code generation with custom evaluation.

git clone https://github.com/flux-team/flux-examples
cd flux-examples/code-generation
./run.sh

Build a general-purpose chat assistant.

git clone https://github.com/flux-team/flux-examples
cd flux-examples/chat-assistant
./run.sh

Coming soon! Subscribe to our YouTube channel for video walkthroughs.

Have you written a tutorial about Flux? Submit it here and we'll feature it!

Stuck on a tutorial? Here's how to get help: