跑不太大的模型, 比如 Llama 3.1 8B
https://huggingface.co/lmstudio-community/Meta-Llama-3.1-8B-Instruct-GGUF/blob/main/Meta-Llama-3.1-8B-Instruct-Q8_0.gguf
这个模型 16G 内存的丐版也能跑起来。