No hay duda, 2024 será el año de las Inteligencias Artificiales y los modelos de lenguaje generativo. ¿Y cuál es el primer nombre que me viene a la cabeza cuando hablamos de estas tecnologías? Claramente el de ChatGPT. Sin embargo, la creación de OpenAI, basada en el LLM ( Large Language Model ) GPT, no es la única solución de este tipo disponible en el mercado. Google, por ejemplo, lanzó el proyecto Bard mientras que xAI de Elon Musk está ocupada con su Grok.
En cualquier caso, no todas las plataformas basadas en IA son propiedad de grandes empresas o son propiedad de ellas. También existen alternativas gratuitas y abiertas, publicadas bajo una licencia Open Source que disfrutan de un mayor nivel de independencia. Pronto veremos cuáles, pero primero centrémonos en las ventajas de su uso.
¿Por qué utilizar alternativas de código abierto a ChatGPT?
Un proyecto Open Source está asociado a una licencia "permisiva" que permite a cualquier persona con las habilidades necesarias estudiar, modificar, adoptar y redistribuir el código fuente de una aplicación. Esto también le permite contribuir voluntariamente al desarrollo del proyecto en sí, con un alto grado de libertad en el cumplimiento de los términos de la licencia. Esta es, por tanto, una primera ventaja, porque las alternativas de código abierto a ChatGPT se implementan en el contexto de comunidades interesadas en su mejora y seguridad más que en una lógica de lucro.
Otra ventaja, de la que ya hemos hablado en parte, radica en que no hay grandes empresas detrás de estas soluciones. Esto significa que no tienes que someterte a sus políticas y cláusulas contractuales que muchas veces son de carácter puramente comercial. El código abierto también garantiza una mayor transparencia y se conocen las formas en que se tratan los datos procesados por los modelos. También hay un mayor grado de personalización y adaptación a las necesidades individuales y mayores oportunidades de ahorro en términos de inversión. Esto sin tener en cuenta que referirse a una única plataforma, especialmente si es propietaria, crea una condición de dependencia que es por naturaleza negativa.
Entonces, ¿cuáles son las mejores alternativas de código abierto a ChatGPT? Hemos seleccionado 8 de los más populares y completos. La lista propuesta a continuación no pretende ser exhaustiva sino más bien un punto de partida para elegir la solución más adecuada para su proyecto.
ColossalChat
ColossalChat es un chatbot estilo ChatGPT que representa la implementación del proyecto Colossal-AI. El modelo generativo básico es Coati (ColossalAI Talking Intelligence), un LLM formado utilizando la técnica de aprendizaje automáticoRLHF (Reinforcement Learning from Human Feedback). Gracias a él, el aprendizaje automático se optimiza a través del feedback formulado por humanos que evalúan su desempeño. De esta forma es posible comprobar en tiempo real que el nivel de desarrollo alcanzado es el adecuado a los objetivos planteados (comprensión de las indicaciones, precisión de las respuestas, capacidad de expresarse en lenguaje natural).
Vicuna
Vicuña (o en su totalidad Vicuña-13B) es un modelo Open Source entrenado a través del tuning de LLaMA (Meta) y las conversaciones compartidas por los usuarios a través de ShareGPT, una extensión para el Navegador web Google Chrome que le permite hacer que las indicaciones y respuestas obtenidas estén disponibles durante las interacciones con la plataforma OpenAI. El resultado de la formación fue un servicio que logra garantizar un nivel de calidad de aproximadamente el 90% en comparación con ChatGPT y Google Bard. Entonces sus resultados serían incluso mejores que los del LLaMA.
HuggingChat
Hugging Face ofrece una amplia gama de modelos, conjuntos de datos y herramientas previamente entrenados relacionados con tecnologías de inteligencia artificial para ayudar a los desarrolladores a integrar modelos de aprendizaje automático en sus aplicaciones. Esta es una solución ampliamente utilizada por las comunidades de investigación y más allá para acelerar la implementación de servicios centrados en IA. HuggingChat , el chatbot que ofrece el proyecto, permite seleccionar el modelo a utilizar (el predeterminado es una de las variantes de Mistral AI) y admite la generación de resultados también a través de búsquedas web.
OpenChatKit
Entre las alternativas gratuitas y abiertas a ChatGPT también encontramos OpenChatKit basado en el modelo RedPajama 7B Chat. Este último fue entrenado sobre la base de 7 mil millones de parámetros con el objetivo de desarrollar habilidades de razonamiento lógico y consecuente, apoyar conversaciones en múltiples sesiones y adquirir conocimientos útiles para devolver respuestas a las indicaciones de los usuarios. El chatbot es capaz de crear resúmenes de textos de gran tamaño, generar tablas a partir de los datos proporcionados como entrada, clasificar tareas y mantener una sensación de contexto durante un diálogo. La fase de desarrollo actual del proyecto se centra principalmente en habilidades de codificación y conocimientos factuales destinados a la resolución de problemas.
H2oGPT
Otro proyecto que condujo a la creación de un chatbot basado en IA es H2oGPT. Si deseas interactuar con la plataforma puedes hacerlo desde esta página, no es necesario registrarte. Entre las características del servicio se encuentra el soporte para una gran variedad de modelos, desde LLaMa2 hasta Mistral AI, desde Falcon hasta Vicuña pasando por WizardLM. Se admiten todos los sistemas operativos de escritorio más utilizados, incluido Linux, y el repositorio también proporciona instaladores para Windows y macOS. H2oGPT es compatible con la API Server Proxy de OpenAI y la API del cliente Python.
GPT4All
GPT4All fue creado para "democratizar" ChatGPT y los LLM en general que, como se anticipó, a menudo están vinculados a iniciativas comerciales orientadas al Código Cerrado. La principal ventaja de esta propuesta radica en que se puede ejecutar localmente, utilizando el hardware de una computadora con configuración tipo consumidor. No se requiere la disponibilidad de una GPU de alto rendimiento y ni siquiera se requiere una conexión a Internet. Además del inevitable repositorio en GitHub, también están disponibles instaladores para Windows, macOS y Linux (Ubuntu). La plataforma se puede utilizar para la generación automática de código fuente, redacción de correos electrónicos, redacción de documentos y su interpretación con resumen.
Baize
Baize es un modelo de chat personalizable y su nombre proviene de una criatura mitológica del folclore chino. Curiosidad aparte, se trata de una plataforma entrenada mediante LoRA (Low-Rank Adaptation) que tiene la ventaja de reducir el número de parámetros necesarios para el entrenamiento. Simplificándolo y haciéndolo más eficiente en algunos casos. Al igual que con otros proyectos del mismo tipo, es posible chatear con el chatbot desde una página de Hugging Face. La interfaz de usuario permite configurar los valores de parámetros como el número máximo de tokens y la temperatura, es decir, el grado de probabilidad/aleatoriedad en la elección de esta última.
Koala
Pasando a un proyecto más orientado a la investigación académica, cabe mencionar a Koala. Un chatbot entrenado ajustando el modelo LLaMA utilizando datos de diálogo recopilados de la Web y conjuntos de datos públicos. Este detalle lo diferencia de otras iniciativas del mismo tipo como ChatGPT, Bard, Bing Chat y Claude, que utilizan conjuntos de datos propietarios acompañados de anotaciones humanas. Los resultados del proceso de formación habrían puesto de relieve que Koala es capaz de responder eficazmente a una gran variedad de preguntas formuladas por los usuarios. Generando respuestas de salida que suelen ser más precisas que las del modelo Stanford Alpaca y al menos iguales a las de ChatGPT en más de la mitad de los casos.
Conclusiones
ChatGPT es el chatbot de IA más popular entre las soluciones basadas en modelos de lenguaje. Sin embargo, este es un proyecto vinculado a un LLM propietario y de código cerrado. En este análisis en profundidad hemos presentado 10 alternativas de Código Abierto, no todas las tecnologías de Inteligencia Artificial Generativa están bajo el control de grandes empresas o sujetas a lógicas comerciales.