Update README

This commit is contained in:
zh-zheng 2024-02-18 10:52:06 +08:00
parent 1370b0196f
commit 7e9aa5efa5
2 changed files with 2 additions and 2 deletions

View File

@ -527,7 +527,7 @@ python demo/hf_based_demo.py --model_path <hf_repo_path>
## Citation
* Please cite our [techinical report](https://shengdinghu.notion.site/MiniCPM-c805a17c5c8046398914e47f0542095a) if you find our work valuable.
* Please cite our [techinical report](https://shengdinghu.notion.site/MiniCPM-Unveiling-the-Potential-of-End-side-Large-Language-Models-d4d3a8c426424654a4e80e42a711cb20) if you find our work valuable.
```
@misc{minicpm2024,

View File

@ -27,7 +27,7 @@ MiniCPM 是面壁智能与清华大学自然语言处理实验室共同开源的
- 一张1080/2080可高效参数微调一张3090/4090可全参数微调一台机器可持续训练 MiniCPM二次开发成本较低。
我们完全开源MiniCPM-2B的模型参数供学术研究和有限商用在未来我们还将发布训练过程中的所有Checkpoint和大部分非专有数据供模型机理研究。
具体而言,我们目前已公开以下模型,地址详见 模型下载 部分
具体而言,我们目前已公开以下模型,地址详见 [模型下载](#1) 部分
- 基于MiniCPM-2B的指令微调与人类偏好对**MiniCPM-2B-SFT/DPO**。
- 基于MiniCPM-2B的多模态模型**MiniCPM-V**能力超越基于Phi-2的同参数级别多模态模型。
- MiniCPM-2B-SFT/DPO的Int4量化版**MiniCPM-2B-SFT/DPO-Int4**。