🔎
Más
Especiales
Filtros

#inference

Todas las noticias etiquetadas como #inference en Pulso. Reescritas con asistencia de IA a partir de fuentes públicas.

Show HN: MinLlama – Inferencia de Llama en ~100 líneas de NumPy vía github.com
★ Destacada · Dev hace 3 h

Show HN: MinLlama – Inferencia de Llama en ~100 líneas de NumPy

Se construyó minLlama para una implementación de Llama fácil de entender y hackear para investigación sobre compresión de caché KV.

La inflexión de la inferencia IA vía latent.space

La inflexión de la inferencia

La era de la inferencia crece

· 2 min Leer →