LinkReal.top
模型量化对 Token 消耗的影响:FP16 和 INT4 差了 4 倍显存 | LinkReal