lz

lz

7 days ago
22
Total Use
0
Total Share
0
Total Likes
0
Total Saved
Use Voice

Description

N/A

zh
Samples
1
Default Sample
我们来看看这款RTX 4090的性能表现呢,在运行Llama 2模型的时候能够达到78.5token每秒。即使是在70B参数规模下呢,依然可以保持稳定的35.6token每秒的推理速度,这个性能表现在本地部署场景下是非常理想的。