Basic

基础数学原理

Transformer 模型结构

Embedding

Attention

MLP

swiglu

MoE

VLM

vlm

Huggingface

huggingface-transformers

Training

N-D 并行

Comm-Compute Overlap

低精度训练

负载均衡

LongContext

Dataload & Ckpt

Inference

Decode

KV-Cache

PD 分离/合并

Quant

quant

Kernel

RL 强化学习

RL Algo

RL System

Post-Training Recipes

MaaS

tinker

Hardward

通信

Misc

Kernels

Benchmarks

paperbench

Author houmin

Publish January 1, 0001

LastMod June 4, 2026

License CC BY-NC-ND 4.0

Linked Mentions

No backlinks found.