مجاني+

الوصف

Ultra-fast LLM inference — 300+ tokens/second with open-source models

الوسوم

fastinferenceopen-source

كيفية الاستخدام

مجاني مع ترقيات. Groq هي أداة مجانية أكثر.