Meta aspira a transformar la IA con el uso comercial de modelos de lenguaje de código abierto

En un desafío a gigantes tecnológicos como Google y OpenAI, Meta Platforms Inc. tiene planes audaces para su próxima versión de LLaMA, un modelo de lenguaje de gran escala (LLM) de código abierto. Según personas con conocimiento directo de la situación, Meta desea que esta tecnología esté disponible para uso comercial, una movida que podría tener serias implicaciones para desarrolladores de IA y empresas que están adoptando cada vez más esta tecnología.

El director general de Meta, Mark Zuckerberg, y su equipo quieren que otras empresas utilicen y se beneficien libremente del nuevo software de inteligencia artificial que Meta está desarrollando. Esta decisión no solo podría provocar una vorágine entre los desarrolladores de IA ansiosos por alternativas al software propietario vendido por competidores como Google y OpenAI, sino que también beneficiaría indirectamente el propio desarrollo de IA de Meta.

El movimiento audaz de Meta, reportado por primera vez por el medio de noticias tecnológicas The Information, representaría una vasta salida de los modelos de lenguaje de código cerrado actualmente en uso comercial, como el Bard de Google y el ChatGPT de OpenAI. Esta movida podría generar un efecto dominó de adopción generalizada por parte de empresas en busca de una alternativa de IA más versátil y asequible.

Además, los beneficios de este movimiento no estarían limitados a las empresas que adopten modelos de código abierto. Si un número creciente de desarrolladores se inclina hacia el ecosistema de IA de código abierto de Meta, la propia Meta se beneficiaría de la experiencia de innumerables ingenieros de IA en todo el mundo que contribuyen a mejorar sus modelos centrales.

El plan de Meta de lanzar un modelo de código abierto amigable para el uso comercial no es del todo inesperado. La empresa lanzó previamente un LLM de código abierto muy capaz, conocido como LLaMA, en febrero de 2023. Aunque inicialmente se otorgó licencia para uso de investigación y se distribuyó a un grupo selecto de usuarios, el código de LLaMA se filtró en el panorama tecnológico general y ha servido de base para numerosos nuevos modelos de IA de código abierto desarrollados sobre su tecnología central.

Estos modelos de código abierto están cerrando rápidamente la brecha con sus homólogos de código cerrado. El modelo Vicuna LLM, construido sobre el modelo fundamental de LLaMA, llamó la atención por su afirmación de entregar el 90% de la calidad de ChatGPT en marzo. El ingeniero de Google AI, Luke Sernau, destacó el rápido progreso de Vicuna en un memorándum interno filtrado, afirmando que la ventaja de Google y OpenAI con los modelos de código cerrado era inexistente a medida que los modelos de código abierto continuaban haciendo avances rápidos y sustanciales.

En este contexto, Meta está redoblando su compromiso con una estrategia de código abierto y publica regularmente investigaciones y códigos en el espacio público, en un momento en que Google y OpenAI han cerrado gran parte de sus investigaciones.

Cuando se le preguntó esta semana si el rápido avance de la IA podría representar una amenaza para la humanidad, el jefe de IA de Meta, Yan LeCun, desestimó tal noción como «absurdamente ridícula». En lugar de temer a la IA, Meta está adoptando y promoviendo su desarrollo de una manera que podría cambiar el panorama de la IA tal como lo conocemos.

Scroll al inicio