En los últimos meses, el auge de las inteligencias artificiales ha ido en aumento. La importancia de este tipo de herramientas en diferentes campos es cada vez más evidente y las posibilidades de competencia a través de ella para las empresas amplían los horizontes. Esta es la razón por la que, en la carrera por la IA, ninguna big tech quiere quedarse atrás, mucho menos luego del lanzamiento de ChatGPT y Google Bard. Lo anterior se refleja en la reciente presentación LlaMa, IA de Meta ─liderada por Mark Zuckerberg─. Su nombre es el acrónimo de Large Language Model Meta AI. En este artículo de Futuro Eléctrico te contaremos todo al respecto, así que no esperemos más y vamos por ello.
Tabla de contenidos
¿Qué es LlaMa, la IA de Meta?
Recientemente, el mundo ha sido testigo de importantes esfuerzos por la inteligencia artificial. OpenAi puso bajo el reflector al chatbot conversacional ChatGPT; Microsoft anunció la integración de este a Bing y Google respondió con la presentación de Bard, basado en el modelo lingüístico LaMDA. Esto fue lo que llevó a Meta a impulsar el desarrollo de nuevas tecnologías que, además, podrán integrarse en sus productos, como bien lo explicó Zuckerberg en una publicación:
Estamos explorando experiencias con texto (como chat en WhatsApp y Messenger), con imágenes (como filtros creativos de Instagram y formatos de anuncios), y con vídeo y experiencias multimodales. Tenemos mucho trabajo fundacional que hacer antes de llegar a las experiencias realmente futuristas, pero estoy emocionado por todas las cosas nuevas que construiremos a lo largo del camino.
Dentro de los avances tecnológicos de la empresa, la presentación de su modelo de IA con procesamiento de lenguaje natural es uno de los más importantes. Este recibe, como mencionamos anteriormente, el nombre de LlaMa. Este modelo de lenguaje grande busca generar texto, tener conversaciones, resolver problemas vinculados a las matemáticas y las ciencias y resumir materiales escritos. Es por ello por lo que estará disponible con una licencia no comercial que sea empleada exclusivamente para la investigación académica, industrial, civil y gubernamental.
Por el momento, LlaMa es un proyecto investigativo en desarrollo que sigue en entrenamiento.
¿Cómo funciona LlaMa?
Este modelo de lenguaje tendrá la capacidad de llegar a los 65 mil millones de parámetros. Funciona a través de la generación de texto recursiva, tomando secuencias de palabras como entradas y prediciendo la siguiente.
Según sus creadores, LlaMa está entrenada con texto en 20 idiomas diferentes, aunque concentra su funcionamiento en alfabetos latinos y cirílicos. Además, esta IA se basa en datos públicos y tiene la capacidad de ser reentrenada de acuerdo con casos de usos específicos, lo cuál la hace mucho más accesible y versátil en comparación con sus competidores.
LlaMa estará disponible en varios tamaños, los cuales se determinarán por la cantidad de tokens o piezas de palabras con las que fueron entrenados.
Versiones de LLaMa
LLaMa 13B
La primera versión de este generador de lenguaje IA recibió el nombre de LLaMA-13B. Fue presentado como un modelo de investigación, que permitiría democratizar el acceso a la información. En su momento, salió al mercado con una licencia no comercial y con el objetivo de permitirles a los científicos, sociedad civil, entidades gubernamentales, entre otros, realizar las investigaciones necesarias para resolver problemas de los modelos de lenguaje IA. Además, desde Meta comunicaron que esta versión era más potente que el GPT-3 de OpenAI.
LLaMa 65B
Esta es la segunda versión de LLaMa IA de Meta, su principal característica es que prometía ser una competencia directa de Chinchilla70B de DeepMind y PaLM 540B de Google. Este modelo es compatible con los principios de open-sourcing, además de que utiliza principalmente datos públicos. Sin embargo, al igual que otros modelos lingüísticos con IA, esta segunda versión es bastante propensa a compartir información falsa o inexacta. Algo, además, que destacaron desde Meta es que desarrolladores externos lo pueden examinar con relativa facilidad en busca de fallos de seguridad.
LLaMa 3
Ahora tenemos la nueva versión: LLaMa 3. Al igual que en sus versiones anteriores, tiene licencia comunitaria o código abierto que permite que otros desarrolladores accedan a ella. Sus datos de almacenamiento también son bastante potentes y es que posee un conjunto de datos de entrenamiento siete veces mayor que LLaMa 65B. Del mismo modo, tiene dos modelos distintos de capacidad computacional, uno con 8.000 millones de parámetros (8B), y otro con 70.000 millones de parámetros (70B). Y esperan lanzar otro modelo, aun con más alcance, dotada de 400.000 millones de parámetros (400B). ¡Esto es totalmente increíble!
LLaMa 3 estará disponible en su versión web, donde con el paso de los días, veremos su integración. Además, se espera que este modelo llegue a Facebook, Instagram y WhatsApp en forma de bot conversacional integrado. La mala noticia es que aún no está disponible en todos los países y solo se encontrará disponible en Estados Unidos, Australia, Canadá, Ghana, Jamaica, Malawi, Nueva Zelanda, Nigeria, Pakistán, Singapur, Sudáfrica, Uganda, Zambia y Zimbabwe.
LlaMa vs. ChatGPT
Aunque LlaMa y ChatGPT son modelos de lenguaje natural basados en inteligencia artificial que comparten ciertas similitudes, si es importante recalcar que también cuentan con diferencias significativas.
En primer lugar, dentro de los modelos de lenguaje grandes, LlaMa es pequeño. Este tiene un rango de tamaño que va desde los 7B hasta los 65 B, lo que se traduce en 7 mil millones a 65 mil millones de parámetros. Por otro lado, ChatGPT alcanza los 175 GB, es decir, 175.000 millones de parámetros. Este último es, entonces, un modelo de lenguaje mucho más grande y potente.
Ahora bien, ambos modelos basan su funcionamiento en la generación de texto recursiva, utilizando secuencia de palabras como entrada. La diferencia en este punto radica en que LlaMa, como se dijo en el apartado anterior, puede ser reentrenado con mayor facilidad, para ajustarlo a casos de uso específicos.
Por otro lado, la creación de Meta se concentra en el uso de datos públicos, mientras que la de OpenAi lo hace en datos privados. Esto lleva a que el primero sea mucho más accesible y versátil.
¿Cuáles son las cosas por mejorar para LlaMa?
Por el momento, y como sucede con todas las inteligencias artificiales actuales, LlaMa, la IA de Meta, presenta algunos inconvenientes y desafíos.
En primer lugar, el sesgo sigue siendo un factor determinante. Esto porque el modelo sigue reflejando prejuicios y desigualdades propias de la sociedad en la que funciona. Para solucionar este inconveniente, es fundamental que el modelo se entrene con datos más diversos y que se hagan revisiones exhaustivas que permitan detectar y corregir la problemática.
Por otro lado, es fundamental solucionar la aparición de comentarios tóxicos. Ellos llevan a la creación de contenido ofensivo o perjudicial. De la mano con ello, las alucinaciones se constituyen como otro de los grandes problemas. Ellas implican la generación de información que no es verdadera o realista, conduciendo hacia la toma de decisiones equivocadas.
Palabras finales
Sin duda alguna, el proyecto resulta bastante ambicioso. Aunque su creador asegura que será un proceso lento y complicado, LlaMa representa el poder de la tecnología actual y la necesidad de responder a las preocupaciones más latentes de la humanidad. Por ello, Meta se enfocará en perfeccionarla y lograr así experiencias realmente futuristas.