GeeeekExplorer fd011c11aa torch rmsnorm пре 1 година
..
configs 4c2fdb8f55 Release DeepSeek-V3 пре 1 година
convert.py 8710ec2ecb require model-parallel in convert.py пре 1 година
fp8_cast_bf16.py 8f1c9488b5 handle missing scale_inv_name (#2) пре 1 година
generate.py 4c2fdb8f55 Release DeepSeek-V3 пре 1 година
kernel.py 4c2fdb8f55 Release DeepSeek-V3 пре 1 година
model.py fd011c11aa torch rmsnorm пре 1 година
requirements.txt 4c2fdb8f55 Release DeepSeek-V3 пре 1 година