Update to use `llama.cpp/master-aacdbd4`#8

Open

alexrozanski wants to merge 355 commits intov2from update-llama-cpp-aacdbd4

+25,702-5,965

This pull request is big! We're only showing the most recent 250 commits

Commits on May 2, 2023

Commits on May 3, 2023

Commits on May 4, 2023

fix ggerganov#1224 reverse prompt and multi line (ggerganov#1297 )

newTomas
and
ggerganov
authored
Update main's README.md with new features (ggerganov#1296 )
DannyDaemonic
authored
Only escape prompts when used with -e (ggerganov#1311 )
DannyDaemonic
authored
ggml : change immintrin.h to intrin.h for compatibility (ggerganov#1307 )
iRonJ
authored
main : add --in-suffix option (ggerganov#1318 )
44670
authored
readme : add OpenBuddy link (ggerganov#1321 )
44670
authored
convert: support DT_BF16 tensors (ggerganov#1309 )

ivanstepanovftw
and
prusnak
authored
Wrap exceptions in std::exception to verbose output on exception. (ggerganov#1316 )
ivanstepanovftw
authored
quantize: make output filename optional, default to ggml-model-<ftype>.bin (ggerganov#1301 )
slaren
authored

Commits on May 6, 2023

Remove default arguments from sampling functions (ggerganov#1343 )
j-f1
authored

Commits on May 7, 2023

Commits on May 10, 2023

main : add option to save full output to session (ggerganov#1338 )

ejones
and
DannyDaemonic
authored

Commits on May 11, 2023

Commits on May 13, 2023

Commits on May 14, 2023

Commits on May 15, 2023

fix get_num_physical_cores() (ggerganov#1436 )

zrm
and
slaren
authored

Commits on May 17, 2023

Commits on May 18, 2023

Commits on May 20, 2023

Commits on May 21, 2023

Commits on May 22, 2023

OpenCL Token Generation Acceleration (ggerganov#1459 )

authored

Commits on May 23, 2023

Fix handling of "invalid property" when creating OpenCL command queue (ggerganov#1565 )
mthuurne
authored

Commits on May 25, 2023

cuda : performance optimizations (ggerganov#1530 )
JohannesGaessler
authored

Commits on May 26, 2023

Some improvements to loading the session with --prompt-cache (ggerganov#1550 )
KerfuffleV2
authored

Commits on May 30, 2023

OpenLLaMA 3B support (ggerganov#1588 )

SlyEcho
and
FNsi
authored

Commits on Jun 4, 2023

Commits on Jun 5, 2023

Commits on Jun 6, 2023

Commits on Jun 8, 2023

Commits on Jun 10, 2023

Commits on Jun 14, 2023

CUDA full GPU acceleration, KV cache in VRAM (ggerganov#1827 )
JohannesGaessler
authored

Commits on Jun 15, 2023

Commits on Jun 16, 2023

Commits on Jun 17, 2023

Commits on Jun 18, 2023

Commits on Jun 19, 2023