LLM, que se refiere a «Large Language Models» (Modelos de Lenguaje Grandes), es una categoría de modelos de procesamiento de lenguaje natural que son notablemente grandes en términos de parámetros. Estos modelos han demostrado ser altamente efectivos en una variedad de tareas relacionadas con el lenguaje, desde la generación de texto hasta la comprensión y traducción del lenguaje.
La relación entre LLM y la IA generativa es que los LLMs pueden ser usados como modelos generativos. Cuando entrenas un LLM como Llama, Bard o GPT-4, le estás enseñando a generar texto basándose en una amplia gama de ejemplos previos. Una vez entrenado, puedes proporcionarle un fragmento de texto (a menudo llamado «prompt«) y el modelo generará una continuación de ese texto de manera coherente.
Por ejemplo, si proporcionas el comienzo de una historia o una pregunta, el LLM puede continuar la historia o responder a la pregunta, generando contenido nuevo en el proceso. Esto es lo que hace que los LLM sean «generativos».
El crecimiento y la popularidad de los LLM en los últimos años es un testimonio del poder de la IA generativa y del avance que la comunidad de investigación ha logrado en el ámbito del procesamiento de lenguaje natural.