Update README.md

This commit is contained in:
DingDing 2024-02-02 17:36:05 +08:00 committed by GitHub
parent 1994166f0a
commit 3e868cd671
No known key found for this signature in database
GPG Key ID: B5690EEEBB952194

View File

@ -109,7 +109,7 @@ python inference.py --model_path <vllmcpm_repo_path> --prompt_path prompts/promp
```
#### Huggingface 模型
我们发现当前Huggingface的推理代码推理效果差于Vllm的推理代码我们正在对齐中目前已定为到PageAttention和普通attention的区别,请耐心等待)
我们发现当前Huggingface的推理代码推理效果差于Vllm的推理代码我们正在对齐中目前已定位到attention计算的精度问题,请耐心等待)
##### MiniCPM-2B
* 安装`transformers>=4.36.0`以及`accelerate`后,运行以下代码
```python