128k模型无法推理的问题修复

2026-01-19 12:53:36 +08:00 · 2024-04-14 19:00:46 +08:00 · 2024-04-14 19:00:46 +08:00 · 3e7c74ec7a
commit 3e7c74ec7a
parent 8272667430
1 changed files with 3 additions and 2 deletions
--- a/demo/vllm_based_demo.py
+++ b/demo/vllm_based_demo.py
@ -56,6 +56,7 @@ def vllm_gen(dialog: List, top_p: float, temperature: float, max_dec_len: int):
    """
    assert len(dialog) % 2 == 1
    prompt = tokenizer.apply_chat_template(dialog, tokenize=False, add_generation_prompt=False)
+    token_ids = tokenizer.convert_tokens_to_ids(["<|im_end|>"])
    params_dict = {
        "n": 1,
        "best_of": 1,
@ -67,8 +68,8 @@ def vllm_gen(dialog: List, top_p: float, temperature: float, max_dec_len: int):
        "use_beam_search": False,
        "length_penalty": 1,
        "early_stopping": False,
-        "stop": None,
-        "stop_token_ids": None,
+        "stop": "<|im_end|>",
+        "stop_token_ids": token_ids,
        "ignore_eos": False,
        "max_tokens": max_dec_len,
        "logprobs": None,