GeeeekExplorer fd011c11aa torch rmsnorm 1 년 전
..
configs 4c2fdb8f55 Release DeepSeek-V3 1 년 전
convert.py 8710ec2ecb require model-parallel in convert.py 1 년 전
fp8_cast_bf16.py 8f1c9488b5 handle missing scale_inv_name (#2) 1 년 전
generate.py 4c2fdb8f55 Release DeepSeek-V3 1 년 전
kernel.py 4c2fdb8f55 Release DeepSeek-V3 1 년 전
model.py fd011c11aa torch rmsnorm 1 년 전
requirements.txt 4c2fdb8f55 Release DeepSeek-V3 1 년 전