LMGame Training Framework

A comprehensive framework for multi-turn reinforcement learning training of language model agents in gaming environments.

Quick Start

Prerequisites

Python 3.10
CUDA-compatible GPU (A100, L40, or similar)
Conda package manager

Installation

Create conda environment:

conda create --name lmgame_train python=3.10
conda activate lmgame_train

Set up authentication (optional but recommended):

export WANDB_API_KEY=your_wandb_api_key
export WANDB_ENTITY=your_wandb_entity
export HF_TOKEN=your_huggingface_token

Run setup script:
```
./scripts/setup.sh
```

Training Examples

Sokoban Agent Training

source train_sokoban.sh

Hardware Configuration

The framework is pre-configured for different GPU setups:

GPU Type	Agent Groups	Group Size	Total Agents	Default Model
A100 (default)	8	16	128	Qwen/Qwen2.5-0.5B-Instruct
L40	4	2	8	Qwen/Qwen2.5-0.5B-Instruct

Note: The A100 configuration is the default setting in configs/base.yaml. For other GPUs, adjust agent_group_num and agent_group_size in the config file.

Documentation

System Design Overview - Architecture and design principles
Development Guide - Contributing and development workflow

License

This project is licensed under the MIT License - see the LICENSE file for details.

Name		Name	Last commit message	Last commit date
Latest commit History 123 Commits
agents		agents
configs		configs
external		external
rollout		rollout
scripts		scripts
tests		tests
trainer		trainer
verl @ 8d9e350		verl @ 8d9e350
.gitignore		.gitignore
.gitmodules		.gitmodules
DEVELOPMENT.md		DEVELOPMENT.md
LICENSE		LICENSE
README.md		README.md
SYSTEMDESIGN.md		SYSTEMDESIGN.md
requirements.txt		requirements.txt
setup.py		setup.py
train.py		train.py
train_custom_qwen_7b.sh		train_custom_qwen_7b.sh
train_custom_qwen_half_b.sh		train_custom_qwen_half_b.sh
train_sokoban_example.sh		train_sokoban_example.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

LMGame Training Framework

Quick Start

Prerequisites

Installation

Training Examples

Sokoban Agent Training

Hardware Configuration

Documentation

License

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

LMGame Training Framework

Quick Start

Prerequisites

Installation

Training Examples

Sokoban Agent Training

Hardware Configuration

Documentation

License

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages