¿Qué es GPT-3 y por qué está cambiando el rostro de la inteligencia artificial?

Ultima actualización en: 24 de septiembre de 2023 by Jitendra Vaswani

Actualizado el: 24 de septiembre de 2023

Ha habido mucho entusiasmo y entusiasmo en el ámbito de inteligencia artificial (IA) en torno a una tecnología de reciente creación llamada GPT-3. En pocas palabras, es una IA que es superior a todo lo que la ha precedido en la creación de contenido con una estructura de lenguaje: lenguaje humano o de máquina.

GPT-3 fue desarrollado por OpenAI, una compañía de investigación cofundada por Elon Musk, y ha sido calificada como el avance más significativo y utilizable en inteligencia artificial en años.

Sin embargo, existe cierta confusión sobre lo que hace (y, lo que es más importante, lo que no hace), por lo que aquí intentaré simplificarlo para cualquier lector no técnico interesado en comprender los principios básicos que lo sustentan. También discutiré algunos de los problemas que trae, así como también por qué algunos creen que su importancia ha sido un tanto exagerada por la exageración.

Créditos de imagen: https://pixabay.com/photos/robot-mech-machine-technology-2301646

Índice del contenido

¿De qué es capaz GPT-3?

GPT-3 es capaz de producir cualquier cosa con una estructura de lenguaje; esto incluye responder preguntas, escribir ensayos, resumir libros extensos, traducir idiomas, tomar notas e incluso escribir código de computadora.

En efecto, en una presentación en línea, se demuestra cómo crear una aplicación que se vea y funcione de manera similar a la aplicación de Instagram utilizando un plugin para la conocida herramienta de software Figma.

Esto es, por supuesto, bastante novedoso y, si resulta útil y beneficioso a largo plazo, podría tener profundas consecuencias para el futuro desarrollo de software y aplicaciones.

Debido al hecho de que el código aún no está disponible públicamente (más sobre esto más adelante), el acceso está restringido a un grupo selecto de desarrolladores a través de una API administrada por OpenAI. Desde el lanzamiento de la API en junio de este año, han aparecido instancias de poesía, prosa, reportajes de noticias y ficción creativa.

Este artículo es particularmente interesante porque muestra que GPT-3 intenta, de manera bastante persuasiva, convencernos a los humanos de que no hace daño. ¡Aunque su honestidad robótica lo obliga a confesar que "soy consciente de que seré incapaz de evitar destruir a la humanidad" si la gente malvada lo empuja a hacerlo!

¿Cómo funciona GPT-3?

GPT-3 es un modelo de predicción de idioma en términos de las amplias categorías de aplicaciones de IA. Esto significa que es un marco algorítmico que toma una sola pieza de lenguaje (una entrada) y la transforma en lo que el algoritmo predice que sería la pieza de lenguaje más beneficiosa para el usuario.

Esto es posible debido al extenso análisis de entrenamiento realizado en la enorme cantidad de material requerido para "pre-entrenarlo". En comparación con otros algoritmos que no han sido entrenados, OpenAI ya ha gastado la enorme cantidad de recursos informáticos necesarios para que GPT-3 comprenda cómo funcionan y se construyen los lenguajes. Según OpenAI, el tiempo de cómputo necesario para lograr esto costó 4.6 millones de dólares.

Para aprender a generar construcciones de lenguaje como oraciones, utiliza análisis semánticos, no solo las palabras y sus significados, sino también cómo varía el uso de las palabras dependiendo de las otras palabras en el texto.

También se conoce como aprendizaje no supervisado porque los datos de entrenamiento no incluyen ninguna información sobre lo que constituye una respuesta "correcta" o "incorrecta", como sí lo hace el aprendizaje supervisado. Toda la información necesaria para calcular la probabilidad de que el resultado satisfaga los requisitos del usuario se obtiene directamente de los textos de formación.

Esto se logra analizando el uso de palabras y oraciones, luego desmantelándolas e intentando reconstruirlas.

Por ejemplo, los algoritmos pueden encontrar la frase "la casa tiene una puerta roja" durante el entrenamiento. Luego se vuelve a dar la frase con la omisión de una palabra, por ejemplo, "la casa tiene una X roja".

Luego examina el texto en sus datos de entrenamiento (cientos de miles de millones de palabras organizadas en un lenguaje significativo) y elige qué palabra debe usarse para reproducir la frase original.

Para empezar, es casi seguro que se equivoque, tal vez millones de veces. Sin embargo, finalmente encontrará la palabra correcta. Al comparar el resultado con los datos de entrada originales, determina si la salida es correcta y se otorga un "peso" al paso del algoritmo que produjo la respuesta correcta. Esto significa que "aprende" con el tiempo qué estrategias tienen más probabilidades de producir la respuesta adecuada en el futuro.

La magnitud de este proceso dinámico de "ponderación" es lo que distingue a GPT-3 como la red neuronal artificial más grande del mundo. Como se ha señalado, lo que logra no es novedoso en algunos aspectos, ya que los modelos transformadores de predicción del lenguaje han existido durante muchos años. Sin embargo, el sistema almacena y emplea dinámicamente 175 mil millones de pesos para procesar cada consulta, diez veces más que su competidor más cercano, construido por Nvidia.

Dos IA hablan de convertirse en humanos. (GPT-3)

¿Cuáles son algunas de las dificultades asociadas con GPT-3?

La capacidad de GPT-3 para generar lenguaje ha sido elogiada como la mejor vista hasta ahora en inteligencia artificial; sin embargo, hay ciertos puntos críticos a considerar.

Sam Altman, el director ejecutivo de OpenAI, declaró: "La exageración de GPT-3 es excesiva". La IA alterará fundamentalmente el mundo, pero GPT-3 es solo un vistazo”.

Para empezar, es una herramienta extremadamente costosa de usar en este momento, debido a la gran cantidad de potencia de cómputo requerida para realizar su trabajo. Esto significa que el costo de implementarlo sería prohibitivamente costoso para las empresas más pequeñas.

Además, es un sistema cerrado o de caja negra. Debido a que OpenAI no ha revelado todos los hechos de cómo funcionan sus algoritmos, cualquier persona que dependa de él para responder consultas o crear productos valiosos no estaría totalmente seguro de cómo se crearon.

En tercer lugar, la salida del sistema aún no es ideal. Si bien es capaz de producir mensajes breves y software simple, su salida se vuelve menos útil (de hecho, se describe como "galimatías") cuando se le pide que cree algo más largo o más sofisticado.

Sin duda, estas son preocupaciones que se resolverán con el tiempo: a medida que el costo de la potencia de cómputo continúa cayendo, se construye la estandarización en torno a las plataformas abiertas de IA y los algoritmos se ajustan con volúmenes de datos más grandes.

En general, es razonable concluir que GPT-3 genera hallazgos que están años luz por delante de cualquier cosa observada anteriormente. Cualquiera que haya visto los resultados del lenguaje de IA entiende cuán variables pueden ser, y el resultado de GPT-3, sin duda, parece estar un paso adelante.

Cuando lo veamos correctamente colocado en manos del público y accesible para todos, su desempeño debería mejorar aún más.

Lea también

Jitendra Vaswani

Jitendra Vaswani es un profesional de marketing digital y un destacado orador internacional de renombre que ha adoptado el estilo de vida nómada digital mientras viaja por el mundo. Fundó dos sitios web exitosos, BloggersIdeas.com & Agencia de marketing digital DigiExe de los cuales sus historias de éxito se han expandido a la autoría de "Inside A Hustler's Brain: In Pursuit of Financial Freedom" (20,000 copias vendidas en todo el mundo) y ha contribuido al "Autor más vendido internacional de Growth Hacking Book 2". Jitendra diseñó talleres para más de 10000 profesionales en marketing digital en todos los continentes; con intenciones ancladas en última instancia hacia la creación de una diferencia impactante al ayudar a las personas a construir el negocio de sus sueños en línea. Jitendra Vaswani es un inversor de gran poder con una cartera impresionante que incluye Estación de imágenes. Para obtener más información sobre sus inversiones, encuéntrelo en LinkedIn, TwitterY Facebook.

Divulgación de afiliados: Con total transparencia: algunos de los enlaces en nuestro sitio web son enlaces de afiliados, si los usa para realizar una compra, ganaremos una comisión sin costo adicional para usted (¡ninguno en absoluto!).

Deja un comentario Cancelar respuesta