[WIP] Initial glm 5.2 support on amd by borontion · Pull Request #528 · lightseekorg/tokenspeed

borontion · 2026-06-26T05:19:20Z

Summary

Early draft for GLM 5.2 support on AMD MI350 with Triton kernels.

Test Plan

tokenspeed serve zai-org/GLM-5.2-FP8 \
  --served-model-name glm-5.2 \
  --trust-remote-code \
  --tensor-parallel-size 8 \
  --enable-expert-parallel \
  --moe-backend triton \
  --kv-cache-dtype fp8 \
  --max-model-len 262144 \
  --chunked-prefill-size 8192 \
  --max-num-seqs 128 \
  --host 0.0.0.0 \
  --port 8000

Signed-off-by: Pengzhan Zhao <borontion@gmail.com>

…port

Signed-off-by: Pengzhan Zhao <borontion@gmail.com>

draft glm support on amd

17f35c2

Signed-off-by: Pengzhan Zhao <borontion@gmail.com>

borontion changed the title ~~[WIP] Initial glm support on amd~~ [WIP] Initial glm 5.2 support on amd Jun 26, 2026

borontion added 11 commits June 26, 2026 10:15

add tests

f05fcb3

Signed-off-by: Pengzhan Zhao <borontion@gmail.com>

Merge remote-tracking branch 'origin/main' into borontion/amd-glm-sup…

2a36c39

…port

cleanup

b00dffd

Signed-off-by: Pengzhan Zhao <borontion@gmail.com>

unified fast hadamard transform

6cd9c65

Signed-off-by: Pengzhan Zhao <borontion@gmail.com>

cleanup

3d783b1

Signed-off-by: Pengzhan Zhao <borontion@gmail.com>

fix branch

b0238cf

Signed-off-by: Pengzhan Zhao <borontion@gmail.com>

unify dsa api

599f992

Signed-off-by: Pengzhan Zhao <borontion@gmail.com>

de-compose triton kernel registry

00c440a

Signed-off-by: Pengzhan Zhao <borontion@gmail.com>

unify dsa api

3bb26e8

Signed-off-by: Pengzhan Zhao <borontion@gmail.com>

cleanup

addb44a

Signed-off-by: Pengzhan Zhao <borontion@gmail.com>

cleanup

fb01593

Signed-off-by: Pengzhan Zhao <borontion@gmail.com>

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

[WIP] Initial glm 5.2 support on amd#528

[WIP] Initial glm 5.2 support on amd#528
borontion wants to merge 12 commits into
mainfrom
borontion/amd-glm-support

borontion commented Jun 26, 2026 •

edited

Loading

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant

Uh oh!

Conversation

borontion commented Jun 26, 2026 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Summary

Test Plan

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant

borontion commented Jun 26, 2026 •

edited

Loading