feat(android): enable runtime repacking for Q4_0 quantization on aarch64 #105

a-ghorbani · 2025-01-06T09:20:14Z

This PR adds -DLM_GGML_USE_CPU_AARCH64 compile definition to Android CMake build, which in turn enables runtime tensor repacking optimization for Q4_0 quantization on ARM64.

The screenshot from PocketPal's benchmarking before/after setting -DLM_GGML_USE_CPU_AARCH64:

feat(android): enable runtime repacking for Q4_0 quantization on aarch64

0f71287

jhen0409 approved these changes Jan 7, 2025

View reviewed changes

jhen0409 merged commit 758157b into mybigday:main Jan 7, 2025
3 of 4 checks passed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

feat(android): enable runtime repacking for Q4_0 quantization on aarch64 #105

feat(android): enable runtime repacking for Q4_0 quantization on aarch64 #105

a-ghorbani commented Jan 6, 2025

feat(android): enable runtime repacking for Q4_0 quantization on aarch64 #105

feat(android): enable runtime repacking for Q4_0 quantization on aarch64 #105

Conversation

a-ghorbani commented Jan 6, 2025