El pasado 24 de Agosto de 2023, Meta presentó al mundo ‘Code Llama’, una avanzada familia de Modelos de Lenguaje (conocidos como LLMs por sus siglas en inglés) diseñados para transformar el panorama de la programación. Impulsado por la inteligencia artificial, Code Llama no solo interpreta lenguaje natural y código con facilidad, sino que también genera, corrige y completa código superando a ChatGPT-3.5. Desde ingenieriadeprompts.ai, te contamos todo sobre esta nueva herramienta.
¿Qué es y por qué tenés que conocer a Code Llama?
Code Llama no es solo un modelo de lenguaje más; es una familia de modelos diseñada específicamente para la programación. La idea es que pueda acelerar y eficientizar los flujos de trabajo de los desarrolladores actuales y, al mismo tiempo, simplificar el proceso de aprendizaje para los novatos en programación.
Algunas de sus capacidades específicas son:
- Generación de código: A partir de instrucciones en lenguaje natural o en código.
- Compleción de código: Puede completar fragmentos de código existentes, lo que es especialmente útil en entornos de desarrollo en tiempo real.
- Debugging: Asistencia en la identificación y corrección de errores en el código.
- Soporte Multilenguaje: Admite una variedad de lenguajes de programación populares, incluidos Python, C++, Java, PHP, Typescript (Javascript), C#, y Bash.
¿Cómo funciona Code Llama?
Code Llama está construido sobre Llama 2, una versión general del LLM de Meta. Ha sido reentrenado mediante fine-tuning con conjuntos de datos específicos de código, permitiéndole tener una especialización en generación y análisis de código.
Dependiendo de las necesidades técnicas, Code Llama ofrece modelos de distintos tamaños: 7B, 13B y 34B. Por ejemplo, el modelo de 7B es ideal para operar con una sola GPU, asegurando respuestas rápidas. Mientras que el modelo de 34B, aunque más demandante en recursos, promete una asistencia de programación de alta precisión debido a su profunda capacidad analítica.
Adicionalmente, existen variantes de “Code Llama” adaptadas para propósitos específicos. Estas son:
- Code Llama Básico: Modelo original con especialización en código.
- Code Llama – Python: Se afinó adicionalmente con código de Python, convirtiéndolo en una herramienta altamente especializada para este lenguaje en particular.
- Code Llama – Instruct: Optimizado para entender instrucciones en lenguaje natural, permitiendo una interacción más fluida y precisa con los usuarios.
CodeLlama vs ChatGPT
En términos de rendimiento, Code Llama destaca entre la mayoría de los LLMs, situándose por encima de ChatGPT-3.5 y acercándose a la capacidad de ChatGPT-4. (podés ver la tabla con el benchmarking completo acá). Estos son los resultados en uno de los tests de programación más conocidos:
- ChatGPT-4 — 67.0
- CodeLlama-python — 53.7
- ChatGPT-3.5 — 48.1
En definitiva, ChatGPT-4 sigue encabezando en performance. Sin embargo, es importante notar que Code Llama es un modelo completamente gratuito, por lo que se convierte en una gran opción tanto para uso personal como comercial.
¿Cómo acceder a Code Llama?
La filosofía abierta de Meta ha permitido que Code Llama se ofrezca con un código abierto y acceso gratuito para usos comerciales y de investigación. Según palabras de Meta: “Creemos firmemente que la transparencia es crucial en el desarrollo de modelos de inteligencia artificial, particularmente en la esfera generativa donde los avances son constantes”.
Para acceder a Code Llama:
- Revisá el repositorio oficial de GitHub.
- Explora Hugging Face y su librería de transformers
- O si prefieres, prueba la demo online de Hugging Face sin instalaciones locales.
Aprender más
Si querés aprender más sobre Code Llama junto a su arquitectura, uso, y otras tecnicidades, te recomendamos leer el paper original de la investigación publicado por Meta. Esperamos este artículo te haya motivado a probar Code Llama!
PD: La imagen de este artículo fue creada con Midjourney, una IA que convierte texto a imagen. Qué te pareció?