Discover/Building a monokernel for LLM inference on AMD MI300X - up to 3,300 output tokens/s per request [P]

article

Building a monokernel for LLM inference on AMD MI300X - up to 3,300 output tokens/s per request [P]

r/MachineLearning · 0 upvotes

Type

article

Stars

Added

May 29, 2026

↗Related Items

repo⚫ GitHub

⭐ 85,979

12 weeks, 26 lessons, 52 quizzes, classic Machine Learning for all

article🟤 Reddit

⭐ 50

r/MachineLearning · 0 upvotes

article🟤 Reddit

⭐ 50

r/artificial · 0 upvotes