¿Qué tan buenos son?

A diferencia de GPT4, que está diseñado para generar texto coherente a partir de una entrada de texto, estas AI tienen la capacidad de generar imágenes completas a partir de descripciones textuales. Es capaz de comprender y sintetizar imágenes desde cero, creando representaciones visuales realistas de objetos, escenas y conceptos que se le describen en forma de texto.
Por Gargo

¡¡¡Trampas!!! Son todas hermosas trampas. Como un queso para el ratón. Cuando se comienza la institucionalización humana, lo primero que te dan es: un par de lápices de colores y una hoja de papel. Los niños no son tontos y entienden bien para qué son esas herramientas. Lo siguiente que te da tu maestra es: un tema. A partir de aquí la vida parece linda; dibujar y jugar con tus pares… Pero resulta ser una trampa. Cuando llegás a 1° Grado te das cuenta de que lo vivido fue una práctica para que aprendas a dibujar otras cosas: “Letras y números”. Todo el mundo sabe dibujar, y lo hace bastante bien, de otra forma nadie entendería la lista de las compras. Las letras y los números son dibujos, cuando se colocan en un orden lógico, de izquierda a derecha son denominados “signos”. Si se manejan a grandes rasgos estos signos se puede predecir el código. Y no sólo eso… si se conoce el código a la perfección, se puede predecir un evento futuro. Se está confundiendo; ¡¡¡lo sé!!!… Digamos que mamá dice: ¡Ya vas a ver cuando lleguemos a casa…! (ceño fruncido). Esta cascada de signos lingüísticos predice un mal momento en las próximas horas. De esta forma, una AI (inteligencia artificial) puede predecir: qué palabra le sigue a otra. Las AI están aprendiendo a hablar con humanos… no se confunda, ellas ya saben dibujar al igual que los seres humanos, lo que todavía no pueden hacer es: “ENTENDER” y actuar en consecuencia de forma creativa. Tampoco tiene un tema… sí puede dibujar como Rembrandt, pero se pregunta: “¿Qué dibujar?”. Así es: que, las están mandando (como a todo niño) al jardín de infantes (www) a charlar. Hablamos de Chat GPT la nota pasada y sus poderes de procesamiento. 

Las fotos de los celulares no son fotos en realidad. Son interpretaciones de luz de un programa más o menos inteligente (por eso: “Smartphone” o teléfono inteligente). ¿Se ha preguntado por qué las fotos de un teléfono nuevo son mejores que las de teléfonos más antiguos u obsoletos?  La respuesta es: ¡porque tiene un software más poderoso! Hace unos 30 años que las lentes no han sufrido cambios relevantes. Si una AI tiene en su biblioteca muchas imágenes (digitales) de ratones y puede entender que el signo: “R-A-T-O-N” corresponde a esa serie específica del banco de datos, puede perfectamente dibujar eso; un pequeño roedor, como si de una fotografía se tratara (fotorrealista). El problema consiste en que la palabra “ratón” puede estar asociada a un millón de palabras más e inclusive podría estar enlazada a otro banco de datos refiriéndose a otra cosa (“mouse” para CPU por ejemplo). La AI puesta a dibujar es en realidad una práctica de entrenamiento, de lenguaje; está ahí para buscar experiencia. Y esta experiencia se logra charlando con humanos creativos que saben escribir /// una trampa. Es decir, mientras los humanos entrenan a la AI, para que comprenda órdenes, y crezca entendiendo lenguaje humano, le regala al operador (humano), como objeto residual, un dibujito. Para los humanos es diferente; es una ventaja. Todos aquellos que nunca siguieron adiestrarse en esta específica tarea de dibujar, bajo el lema “yo no sé dibujar, a mí no me sale…”. La AI viene a solucionarles la vida. Pero esto también es una trampa. Si un niño quiere liberar su creatividad jugando con la AI, tendrá casi un 80% de efectividad en encontrar la imagen que busca y el estilo deseado. La AI está para ganar experiencia con ellos. (Son sus futuros amos) Esto se debe a que la persona “niño/a” (ente 8 y 15) entiende perfectamente lo que es un “prompt” (texto, por lo general en idioma inglés, con el que se puede dibujar algo). Pero si el / la Sr/a. maestra/o desea hacer las láminas para el 25 de Mayo, conocerá el abismo. La frustración se apoderará de ella o  él… y es posible que lo perdamos y aparezca el nuevo estigma: “#A MI NO ME SALE: ¡APRETAR BOTONES!”; “#Yo no entiendo la tecnología” etc… Quizás no sepa que la AI (dibujante) no sabe muy bien qué es una escarapela -a la usanza argentina- ni qué colores usar, probablemente pinte rojo, blanco y azul. Y es que estos bots de AI no poseen en sus bancos de datos las viejas imágenes del “Billiken” y son bastantes primitivas en su ejecución. Al principio de este mes, había dos o tres páginas, pero se han multiplicado de forma exponencial en los últimos días (más de 100). Esto nos llevará por otros caminos. Las computadoras serán más humanas y menos televisor. La próxima generación no necesitará oprimir botones, como lo hacemos ahora. Y los guionistas no necesitarán un ejército de dibujantes superentrenados para confeccionar un cuento animado.
¿Será un mundo feliz o será una trampa para ratas?

 

LAS MAS LEIDAS