llama.cpp

mirror of https://github.com/RYDE-WORK/llama.cpp.git synced 2026-01-19 21:23:26 +08:00

History

Georgi Gerganov 99bd4ac28c

* llama : infill sampling handle very long tokens

ggml-ci

* cont : better indices

ggml-ci

2024-10-17 22:32:47 +03:00

llama.h

2024-10-17 22:32:47 +03:00