Meta anunció que es de código abierto su modelo de lenguaje grande LLaMA 2, haciéndolo gratis para uso comercial y de investigación y enfrentando cara a cara con el uso gratuito de OpenAI GPT-4, que alimenta herramientas como ChatGPT y Microsoft Bing.
Meta anunció el movimiento como parte del evento Inspire de Microsoft, señalando su apoyo a Azure y Windows y una asociación “creciente” entre las dos compañías. Al mismo tiempo, Microsoft reveló más detalles sobre las herramientas de IA integradas en su plataforma 360 y cuánto costarán. Qualcomm también anunciado está trabajando con Meta para llevar LLaMa a computadoras portátiles, teléfonos y auriculares a partir de 2024 en adelante para aplicaciones con inteligencia artificial que funcionan sin depender de servicios en la nube.
El comunicado de prensa de Meta explica la decisión de abrir LLaMA como una forma de dar a las empresas, nuevas empresas e investigadores acceso a más herramientas de IA, lo que permite la experimentación como comunidad. De acuerdo con Meta, LLaMa 2 recibió capacitación en un 40 por ciento más de datos en comparación con LLaMa 1, que incluye información de “fuentes de datos en línea disponibles públicamente.” También dice que “supera” a otros LLM como Falcon y MPT cuando se trata de razonamiento, codificación, competencia y pruebas de conocimiento.
Al abrir LLaMA, Meta dijo que quiere mejorar la seguridad y la transparencia. La compañía dijo que el modelo LLaMA 2 ha sido “rojo-teamed,” o probado para su seguridad por “generando indicaciones de confrontación para facilitar el ajuste del modelo,” tanto interna como externamente. Meta también revela cómo se evalúan y modifican los modelos. El LLaMa 2 de código abierto estará disponible a través de la plataforma Azure de Microsoft. Meta dijo que LLaMA también estará disponible a través de AWS, Hugging Face y otros proveedores.
Creemos que un enfoque abierto es el correcto para el desarrollo de los modelos de IA actuales, especialmente aquellos en el espacio generativo donde la tecnología avanza rápidamente, dijo Meta en un comunicado. “Abrir el acceso a los modelos de IA actuales significa que una generación de desarrolladores e investigadores pueden hacer una prueba de esfuerzo, identificando y resolviendo problemas rápidamente, como comunidad.”
Mientras Meta anunció por primera vez su modelo LLaMA en febrero, se filtró en 4chan solo unos días después. Ahora que más personas tienen acceso a LLaMA 2, estamos obligados a ver nuevas herramientas impulsadas por IA basadas en el modelo. Meta dice que recibió más de 100,000 solicitudes de los investigadores para usar su primer modelo, pero él LLaMA 2 de código abierto probablemente tendrá un alcance mucho mayor.