Cuando OpenAI empezó muy pocas personas creían que simplemente agregando toneladas de datos y poder de cómputo sería suficiente para construir sistemas inteligentes. Incluso hasta hace poco, la mayoría de los investigadores en Inteligencia Artificial pensaban que la inteligencia seguiría siendo una quimera por varias décadas más.

Sin embargo, GPT-4 fue sorprendentemente fácil de construir…

Esta es una de las muchas razones por las que la tecnología de OpenAI no se considera exclusiva o irrepetibles. Después de todo cualquiera podría hacer lo mismo, ¿verdad?

El hecho de que GPT-4 fuera fácil de construir no significa que lo es en un sentido absoluto. Lo sorprendente es que la construcción de GPT-4 se ha parecido mucho a la de los famosos ya software como servicio (SaaS), eso sí, sin requerir toneladas de nuevos avances en investigación y desarrollo.

Sin embargo, el software SaaS ordinario sigue siendo bastante difícil de construir y bastante exclusivo por lo que normalmente se considera único e irrepetible. Casi todas las compañías de SaaS pueden llegar a márgenes brutos del 50-80%, lo cual no es algo que se vería si fueran tecnologías tipo comodities.

GPT-4 no requirió investigación innovadora, pero todo fue más complicado que simplemente comprar toneladas de GPUs y escrutar Internet de arriba hacia abajo y luego presionar el botón “ejecutar”.

Se necesitan cientos de pequeñas decisiones, trucos y trampas técnicas para hacer que GPT-4 funcione tan bien como lo hace. Aunque OpenAI es bastante privada en sus comunicaciones, hay algunas pistas de lo que han hecho que serán difíciles de replicar, revisemos tres de ellas a continuación:

Aprendizaje por refuerzo a través de retroalimentación humana:

OpenAI ha conformado un equipo de personas que proporciona continuamente ejemplos de resultados deseables o esperados al modelo que han construido y clasifican el resultado final “calculado” por dicho modelo.

No es fácil reclutar un gran grupo de personas para hacer este tipo de trabajo y además construir la infraestructura para que puedan hacer este trabajo de manera efectiva e incorporar finalmente los datos al modelo.

Irónicamente, una de las partes que hacen única a OpenAI es este complicado sistema humano que han creado para ayudar a mejorar su Inteligencia Artificial. 

Incorporación de retroalimentación de los usuarios:

Más de 100 millones de personas han iniciado sesión en ChatGPT e interactuado con él al menos una vez. Cada interacción con ChatGPT proporciona más datos a OpenAI para usarlos en mejorar su modelo. 

Filtrado de datos:

GPT-4 no se basa simplemente en un volcado ingenuo de todo el contenido en internet. Se trabaja mucho para filtrar los datos antes de entrenar con ellos, tal como lo menciona OpenAI en su blog para GPT-4.

Todo esto es para intentar eliminar el sesgo del modelo tanto como sea posible, y no incluir nuevas limitaciones conceptuales al realizar el filtrado. 

Hay cientos de pequeñas decisiones y piezas de conocimiento digamos tribal que OpenAI ha construido a lo largo del tiempo sobre cómo hacer esto bien. Al igual que hace cualquier compañía de software complejo han innovado en un nuevo dominio, creando sus propios componentes y metodologías para hacerlos convivir o evolucionarlos apropiadamente.

En resumen, aunque construir modelos de IA de alta calidad no es fácil, OpenAI ha logrado hacerlo con GPT-4 y ha creado una tecnología bastante única gracias a la complejidad con la que han lidiado y el trabajo especializado requerido para construirlo.

Por otro lado, aunque existen modelos de IA de código abierto que pueden ser comparables en calidad a GPT-4, no es tan fácil utilizarlos como solución gratuita para el consumidor o por las empresas debido a la falta de interfaces de usuario apropiadas y de mecanismos de integración confiables.

En conclusión, el diseño, implementación y mantenimiento de modelos de IA de alta calidad es un proceso complejo que requiere un trabajo duro y continuo. Finalmente, aunque los modelos de código abierto pueden ser comparables en calidad a los modelos propietarios, hay muchos otros temas necesarios e imprescindibles para llegar al nivel OpenAI y su producto GPT-4.


Síguenos en LinkedIn

Ver contenido de industrias y tendencias en nuestra página de LinkedIn.