Skip to content

Flux

API Reference

API Reference¶

Complete reference documentation for all Flux classes and functions.

Core Classes¶

FluxConfig

Main configuration class for all Flux settings
FluxTrainer

High-level trainer interface for easy training
FluxCoordinator

Low-level coordinator for custom training loops
Trajectory

Data structure for storing generated responses
Rewards

Reward function classes and utilities
Algorithms

RL algorithm implementations
Utilities

Helper classes and functions

Quick Import Reference¶

# Main classes
from flux import FluxConfig, FluxTrainer

# Configuration
from flux.core.config import (
    FluxConfig,
    AdaptiveAsyncConfig,
    RolloutConfig,
    BatchComposerConfig,
    WeightSyncConfig,
    CheckpointConfig,
)

# Coordinator
from flux.coordinator import FluxCoordinator

# Trajectories
from flux.core.trajectory import Trajectory, TrajectoryBuffer

# Rewards
from flux.rewards import (
    RewardFunction,
    LengthReward,
    FormatReward,
    KeywordReward,
    CompositeReward,
    FunctionReward,
    RewardModel,
    LLMJudge,
)

# Algorithms
from flux.training.algorithms import (
    register_adv_estimator,
    register_policy_loss,
    get_adv_estimator,
    get_policy_loss,
)

# Utilities
from flux.utils import (
    CheckpointManager,
    GracefulShutdown,
    with_retry,
    MetricsRegistry,
)

# Types
from flux.core.types import (
    PromptsType,
    MetricsDict,
    StateDict,
)

Class Hierarchy¶

classDiagram
    class FluxConfig {
        +model_path: str
        +num_steps: int
        +from_yaml(path)
        +to_yaml(path)
    }

    class FluxTrainer {
        +config: FluxConfig
        +fit(prompts)
        +evaluate(prompts)
        +save_checkpoint(path)
    }

    class FluxCoordinator {
        +config: FluxConfig
        +run(prompts)
        +step(prompts)
        +shutdown()
    }

    class Trajectory {
        +id: str
        +prompt: str
        +response: str
        +reward: float
    }

    class RewardFunction {
        +compute_reward(trajectory)
    }

    FluxTrainer --> FluxConfig
    FluxTrainer --> FluxCoordinator
    FluxCoordinator --> Trajectory
    FluxTrainer --> RewardFunction

Common Usage Patterns¶

Basic Training¶

from flux import FluxConfig, FluxTrainer

config = FluxConfig(
    model_path="Qwen/Qwen3-8B",
    num_steps=1000,
)

trainer = FluxTrainer(config)
result = trainer.fit(prompts="data/prompts.jsonl")

Custom Reward Function¶

from flux import FluxTrainer
from flux.rewards import FunctionReward

def my_reward(traj):
    return 1.0 if "answer" in traj.response.lower() else 0.0

trainer = FluxTrainer(
    config,
    reward_function=FunctionReward(my_reward),
)

Custom Training Loop¶

from flux.coordinator import FluxCoordinator

async def custom_training():
    coordinator = FluxCoordinator(config)
    await coordinator.initialize()

    async for result in coordinator.run(prompts):
        print(f"Step {result.step}: {result.loss}")

        if result.loss < 0.1:
            break

    await coordinator.shutdown()

Custom Algorithm¶

from flux.training.algorithms.base import register_policy_loss

@register_policy_loss("my_loss")
def compute_my_loss(old_logp, logp, advantages, mask, **kwargs):
    ratio = torch.exp(logp - old_logp)
    loss = -(ratio * advantages * mask).sum() / mask.sum()
    return loss, {"loss": loss.item()}

Type Annotations¶

Flux uses comprehensive type annotations:

from flux.core.types import (
    PromptsType,      # list[str] | list[dict] | str (file path)
    MetricsDict,      # dict[str, float]
    StateDict,        # dict[str, torch.Tensor]
    CallbackType,     # Callable[[CoordinatorState, MetricsDict], None]
    StepCallbackType, # Callable[[StepResult], None]
)

Version Compatibility¶

Flux Version	Python	PyTorch	CUDA
0.1.x	3.10+	2.0+	12.0+

See Also¶

Getting Started - Installation and quick start
Tutorials - Step-by-step guides
How-to Guides - Task-specific guides