Fediverse search system

Fediver

beta version

【LLMの量子化】の検索結果


調べてみたらLLMの量子化かなりお手軽にできるっぽいので試してる
4bit量子化するとだいぶ推論が高速になるな