Meta ha anunciado la disponibilidad de Llama 2 en la plataforma de Hugging Face. Llama 2 es una colección de modelos de texto generativos pre-entrenados y ajustados, que van desde los 7 mil millones hasta los 70 mil millones de parámetros. Ahora, los usuarios pueden acceder a este modelo de lenguaje a través de Hugging Face después de haber obtenido el acceso por parte de Meta.
Para obtener acceso a Llama 2 en Hugging Face, se debe completar un formulario después de haber aceptado los términos de la licencia y la política de uso aceptable en el sitio web de Meta. El proceso de solicitud será procesado en 1-2 días.
Es importante tener en cuenta que la dirección de correo electrónico asociada a la cuenta de Hugging Face debe coincidir con la dirección de correo electrónico proporcionada en el sitio web de Meta. De lo contrario, la solicitud no será aprobada.
Llama 2 es un modelo del lenguaje desarrollado por Meta, que ha sido públicamente lanzado como parte de la familia de modelos de lenguaje de gran escala (LLMs). Estos modelos, denominados Llama-2-Chat, han sido optimizados para casos de uso de diálogo. En las pruebas realizadas, los modelos Llama-2-Chat superan a los modelos de chat de código abierto en la mayoría de los benchmarks, y en nuestras evaluaciones humanas en términos de utilidad y seguridad, se encuentran a la par con algunos modelos cerrados populares, como ChatGPT y PaLM.
Llama 2 viene en diferentes tamaños de parámetros, que incluyen 7 mil millones, 13 mil millones y 70 mil millones, y ofrece tanto variaciones pre-entrenadas como ajustadas. Los modelos de entrada están diseñados para recibir texto como entrada y los modelos de salida generan texto como salida.
El modelo Llama 2 se basa en una arquitectura de transformador optimizada y es un modelo de lenguaje autoregresivo. Se ha utilizado un enfoque de ajuste supervisado (SFT) y aprendizaje por refuerzo con retroalimentación humana (RLHF) para alinear el modelo con las preferencias humanas en términos de utilidad y seguridad.
El entrenamiento de Llama 2 se realizó utilizando una combinación de datos disponibles públicamente en línea. La versión de 70 mil millones de parámetros utilizó Grouped-Query Attention (GQA) para mejorar la escalabilidad de la inferencia.
El modelo Llama 2 ha sido entrenado entre enero de 2023 y julio de 2023. Es importante destacar que esta versión es un modelo estático entrenado en un conjunto de datos sin conexión. Futuras versiones del modelo ajustado serán lanzadas a medida que se mejore la seguridad del modelo con la retroalimentación de la comunidad.
El uso de este modelo está gobernado por la licencia de Meta. Para descargar los pesos del modelo y el tokenizador, es necesario visitar el sitio web y aceptar la licencia antes de solicitar el acceso.
Llama 2 tiene aplicaciones comerciales y de investigación en inglés. Los modelos ajustados están diseñados para casos de uso de chat de asistentes virtuales, mientras que los modelos pre-entrenados pueden adaptarse para una variedad de tareas de generación de lenguaje natural.
Meta ha utilizado bibliotecas de entrenamiento personalizadas, su Research Super Cluster y clústeres de producción para el pre-entrenamiento. El ajuste, la anotación y la evaluación también se realizaron en servicios de computación en la nube de terceros.
En términos de sostenibilidad, el pre-entrenamiento de Llama 2 utilizó un total acumulado de 3.3 millones de horas de GPU en hardware de tipo A100-80GB, con emisiones estimadas de 539 tCO2eq. Estas emisiones se han compensado en su totalidad a través del programa de sostenibilidad de Meta.
La disponibilidad de Llama 2 en Hugging Face representa una oportunidad emocionante para explorar y utilizar este modelo de lenguaje revolucionario. Con sus diversas capacidades y el respaldo de la comunidad de código abierto, Llama 2 allanará el camino para nuevas aplicaciones en el campo de la generación de texto y el procesamiento del lenguaje natural.
Para obtener más información y acceder a Llama 2 en Hugging Face, visita el siguiente enlace: https://ai.meta.com/resources/models-and-libraries/llama-downloads