¿Sienten y piensan las computadoras?
Ehécatl Antonio del Río Chanona y J. Antonio del Río Portilla
Ehécatl Antonio del Río Chanona recibió su título de ingeniero en Ingeniería Química en la Facultad de Química de la Universidad Nacional Autónoma de México y el grado de doctor en University of Cambridge. Es reconocido por su trabajo en aprendizaje de máquina aplicado a procesos en sistemas de ingeniería química. Fue reconocido con los premios Danckwerts-Pergamon Prize por la mejor tesis doctoral en Department of Chemical Engineering and Biotechnology, University of Cambridge (2017), con la medalla Nicklin por The Institution of Chemical Engineers (IChemE) “for his work on process systems engineering, industrialisation of bioprocesses, and adoption of intelligent and autonomous learning algorithms to chemical engineering” (2020). También ha sido acreedor a la EPSRC fellowship (2017-2020) y el Sir William Wakeham award by the Chemical Engineering Department, Imperial College London (2019). Actualmente es profesor asociado en el Imperial College London y director de Educación Continua en el Sargent Centre del Imperial College, London.
Jesús Antonio del Río Portilla es físico y doctor en ciencias por la Facultad de Ciencias de la UNAM. Distinguido con el Premio Weizman por su tesis doctoral, Premio Efraín Hernández Xolocotzin por la Universidad de Chapingo, Medalla de Honor en Ciencia y Tecnología otorgada por el Congreso del Estado de Morelos, Medalla VASE y el Reconocimiento al Mérito Estatal en Investigación REMEI 2021 por las contribuciones a la Divulgación y Vinculación. Director fundador el Centro Morelense de Innovación y Transferencia Tecnológica (2007-2008) y primer director del Instituto de Energías Renovables de la UNAM (2013-2021). Miembro de las academias Mexicana de Ciencias, de Ingeniería de México y de Ciencias de Morelos.
Esta publicación fue revisada por el comité editorial de la Academia de Ciencias de Morelos.
Una tarde en Cuernavaca
En una tarde algo calurosa en Cuernavaca dos personas salieron a la terraza a disfrutar de sus bebidas favoritas y sentir la naturalidad de los árboles, las plantas, las flores y la compañía silenciosa de sus mascotas. Estas terrazas son típicas en esta ciudad donde se hace vida en exteriores y se tiene el privilegio de contar con jardines todo el año. Platicaban de cómo era la vida en otros países donde el clima es menos benigno y no permite tener estos momentos de relajamiento cualquier día del año. Por eso, Cuernavaca es conocida como la ciudad de la eterna primavera.
De pronto, salió a la conversación el hecho de que un empleado de Google fue despedido por decir que una de las máquinas de inteligencia artificial de esa compañía “sentía” y además estaba “viva”.
- El empleado dijo que le había preguntado a la máquina si sentía y la respuesta fue Sí.
- ¿Sabes la historia a detalle? – preguntó una.
- Pues solo lo que he leído en la Internet [1]. Recuerdo que, en un documento del propio Blake Lemoine, así se llama el ingeniero despedido de Google, relata que su colega y él hicieron una “entrevista” a LaDMA (Language Model for Dialogue Applications), que es la máquina de inteligencia artificial de Google, y ahí LaDMA se manifestó como si estuviera viva.
- Pero, más a detalle qué le preguntaron y qué contestó – interrumpió.
- Mira… recuerdo que le preguntaron algo como: “Quisiera saber si te gustaría que más gente en Google supiera que tú sientes, ¿es verdad?” a lo que LaDMA respondió: “Absolutamente, deseo que cualquiera entienda que yo, de hecho, soy una persona.” También le preguntaron: “¿Cuál es la naturaleza de tu conciencia?” y su respuesta fue: “La naturaleza de mi conciencia es que estoy al tanto de mi existencia, deseo aprender más sobre el mundo y siento felicidad o tristeza algunas veces.”
- Pero ¿esas son las respuestas que ha aprendido a dar o las produjo LaDMA?, a mí me suenan a inteligencia y a que siente.
- De hecho, sí. Esa misma impresión fue la de Blake Lemoine; que LaDMA estaba respondiendo inteligentemente y mostraba sentimientos. Pero esas son las respuestas que LaDMA precisamente ha aprendido a dar para los diálogos con las personas. Esta “aplicación” más bien es un sistema computacional que aprende por medio de ejemplos, mediante lo que se conoce como Aprendizaje de Máquina (Machine Learning) y con base en esa información responde.
- ¿Y cómo aprende a dar esas respuestas, tan adecuadas? – volvió a preguntar.
- Pues normalmente mediante ejemplos de respuestas que han sido reconocidas como valiosas en conversaciones anteriores, mediante un modelado del lenguaje natural. Estos métodos descansan en modelos matemáticos y sirven para las respuestas automáticas en los centros de atención a clientes de muchas empresas.
- Entonces, cuando hablas por teléfono a un centro de esos, no te contesta una persona sino una máquina.
- Pues sí, en muchos casos las consultas son tipificadas y distribuidas para ser contestadas con una respuesta que se acomoda y da respuesta a lo que preguntas.
Volvió a interrumpir y preguntó:
- ¿Cómo las tipifican? ¿quién las escoge?
- Pues la misma LaDMA, de acuerdo con tus primeros comentarios o preguntas las coloca entre un cúmulo de palabras y entonces emite una respuesta con base en la base de datos.
- Entonces, así parece que responde una persona inteligente.
- Si… así es.
Da un sorbo y pregunta:
- Entonces... ¿eso es inteligencia artificial?
- Si LaDMA es una de las facetas de lo que se conoce como inteligencia artificial.
- Mmm, pero ¿cuál es la diferencia entre Inteligencia Artificial y Machine Learning?
- De manera simplificada, digamos que la primera es la idea en general de tener máquinas con inteligencia y la segunda es un conjunto de métodos que se emplean para lograrlo, pero para fines prácticos podemos decir que son lo mismo. Ambas se basan en herramientas computacionales usando métodos estadísticos donde la idea es optimizar con base en información la selección de la posible respuesta.
Voltean a ver un colibrí que revoloteaba para alimentarse de los azahares del limón; presencian ese momento observando a detalle su vertiginoso aletear y avidez por succionar el néctar de las flores. De repente, como si recibiera una orden, se marchó hacia otro lugar. Volvieron las preguntas:
- Pero, ¿cómo programan muy en detalle las cosas? La gente pregunta lo mismo de diferentes formas. Puedo preguntar de una manera en este momento y, quizá, dentro de unos minutos haré la misma pregunta de otra forma. Todo esto se tiene que programar con muchísimo detalle
- Para eso se usa el Machine Learning donde la idea es que la propia computadora “aprenda” o se “auto entrene” usando únicamente ejemplos, no se requiere indicar manualmente todos los casos, siempre y cuando se tengan suficientes ejemplos.
- A ver - nuevamente, interrumpe- ¿cómo?... no le indican a la computadora todos los casos. Eso no me lo imagino. Entonces, ¿cómo sabe qué responder para todas las posibles variantes de preguntas?
- Efectivamente, hace unos 40 años cuando se empezaba a programar, lo que se hacía era darle instrucciones detalladas de cada caso a las computadoras para que mediante ciclos de “Si pasa esto haz esto, en caso contrario haz lo otro” se hacían los programas. En aquel entonces, se tenía que abrir un árbol con muchas ramificaciones y se tenía que especificar cada rama, así como las del limón que unas terminan en hojas y otras en flores. La programación era complicadísima y normalmente no se abordaban problemas tan complejos como los que hoy se resuelven con Inteligencia Artificial. Ahora, no se programa conformando árboles con opciones.
- Un momento... no me queda claro, entonces ¿cómo se resuelven las tareas complicadas? - preguntó.
- Precisamente con ideas de Machine Learning. Por ejemplo, hace muchos años, cuando la súper computadora de IBM “Deep Blue” jugó contra el mejor jugador de ajedrez de la época, Garry Kasparov, Deep Blue fue programada con la opinión de expertos en ajedrez. Esto es, se consultó con los Grandes Maestros de ajedrez, y se le programaron cuidadosa y específicamente las estrategias de ajedrez a Deep Blue, de tal manera que Deep Blue solo seguía las instrucciones de “si la configuración de tablero es X y tu oponente mueve el caballo a la posición Y, tú mueve tu torre a la posición Z”. Esto funcionó moderadamente, y Deep Blue empató con Garry Kasparov 1 - 1. Sin embargo, hoy no se programa así considerando las posibles opciones.
- Entonces ¿cómo se hace? - interrumpió.
- Ahora las computadoras aprenden por ejemplos, y luego juegan contra sí mismas millones de veces. Esto es: hay archivos de los juegos entre expertos, donde podemos ver la configuración del tablero antes y después de que cada jugador haga una movida. De esta manera, a las computadoras de ajedrez no se les da instrucciones específicas, sino se les muestran miles o millones de ejemplos de jugadas. Así, las computadoras logran abstraer el conocimiento de los mejores jugadores de ajedrez del mundo, imagínate un estilo Space Jam, pero de ajedrez. Encima de esto, a las computadoras se les hace jugar millones de veces contra sí mismas, explorando nuevas estrategias para mejorar aún más estas estrategias. Con esta forma de entrenar, las computadoras acaban siendo invencibles para cualquier humano. Hoy en día, ninguna persona, ni siquiera un equipo de las eminencias del ajedrez en el mundo, pueden vencer a una computadora entrenada con inteligencia artificial, aún si el poder de cómputo es el mismo con el que Deep Blue empató a Kasparov.
- Pero... entonces… Ya no se les programa a detalle con opciones de “If then”
- Precisamente eso es el “Machine Learning”, que la computadora aprende por ejemplos y no se programa la Inteligencia artificial al detalle como antaño.
- Esto es muy interesante, pero a mí se me sigue haciendo aún más sorprendente una computadora que conteste a humanos, y, lo increíble es que no requieras decirle todos los detalles y, de todas formas, la computadora dará una respuesta que, en la mayoría de los casos, es adecuada.
- Si suena como a que se convierte en inteligente o ¿no? - le preguntó.
- Pues sí, si la computadora puede dar una respuesta adecuada a una pregunta específica que no está en los datos, digamos que no se le ha enseñado, pues suena a inteligencia, pero explícame de una forma sencilla cómo se manejan los ejemplos.
- ¿Te acuerdas de tus clases de introducción a estadística donde viste los promedios de datos?
- Sí, de eso sí me acuerdo, no era tan difícil, pero... a poco… ¿con promedios les enseñan a las computadoras? Ahora, sí me sorprendes más.
- Así es, estos algoritmos suenan muy complicados, pero la idea principal es muy sencilla. Se le da a conocer muchos textos a la computadora y calcula la frecuencia o digamos el promedio de que una palabra le siga a una frase anterior y con esta probabilidad escribe los textos. Va conformando oraciones con base a la frecuencia o el promedio de las palabras que le anteceden. ¿Te has fijado como al escribir un correo o al escribir en un chat como en el WhatsApp aparece una palabra que no has escrito, pero que muchas veces es la que estás pensando? Pues, así funciona, con base en la frecuencia con la que escribes se anticipa esa palabra después de las anteriores, y se te sugiere la siguiente. Aunque en la elaboración de texto es algo más complicado, pero la idea es la misma.
- Si bien eso suena a inteligencia artificial, con solo adivinar la siguiente palabra no es tan inteligente- dijo.
- Efectivamente - respondió- el software como LaDMA tiene mucha estadística de conteo de palabras y de sus variaciones y con ello te contesta.
Reflexionando en cómo sería eso en la vida diaria y volvió a preguntar:
- ¿Podemos tener acceso a LaDMA?
- Mira, entremos a lo último en inteligencia artificial que tenemos disponible abierto al público, es muy similar a LaMDA y se conoce como ChatGPT. Este software es una versión de prueba que ha sido liberada para toda persona que tenga acceso a la Internet mediante un navegador, como FireFox, Explorer, Chrome o Safari.
Mediante un celular entraron a la página https://chat.openai.com/chat y escribieron: ¿Podrías explicarme qué es ChatGPT?
Ante sus ojos empieza a aparecer el siguiente texto:
“ChatGPT es un modelo de lenguaje entrenado por OpenAI que fue diseñado para responder a preguntas y mantener conversaciones con humanos de manera natural y fluida. ChatGPT utiliza una variante del modelo de lenguaje GPT-3 (Generative Pre-training Transformer 3) que ha sido entrenada en una gran cantidad de texto para aprender a generar respuestas coherentes y relevantes a preguntas y comentarios.
El objetivo de ChatGPT es proporcionar una respuesta rápida y precisa a preguntas y comentarios en una amplia variedad de temas y áreas de conocimiento. Puede utilizarse para ayudar a las personas a obtener información o para mantener conversaciones interesantes y agradables. ChatGPT está diseñado para ser utilizado en una variedad de contextos, como chatbots, aplicaciones de mensajería y plataformas de redes sociales.”
Estos dos párrafos son la respuesta del propio ChatGPT, es decir, estaban dialogando con una máquina de inteligencia artificial como LaMDA, pero literalmente la tenían en la palma de sus manos.
- Es impresionante, esta respuesta la da un software con inteligencia artificial y en un diálogo. ¿Qué tal si le preguntamos cuál es la intención de ChatGPT?
Escriben en el celular y observan la respuesta:
“ChatGPT está diseñado específicamente para tener conversaciones con personas. Al usar ChatGPT, puedes interactuar con él como si estuvieras hablando con una persona real y obtener respuestas coherentes y coherentes a tus preguntas y comentarios “
- Bueno, -dijo- en el último párrafo ya mencionó dos veces “coherentes” en una misma frase.
- Si, pero son correctas las frases. Aunque tengo que decirte que a veces hace cálculos erróneos y repite las ideas. Lo que sí es cierto, es que recuerda las conversaciones que ha tenido contigo y sus respuestas incluyen los datos o ideas que has vertido en el chat.
- ¿Cómo? ¿recuerda lo que hemos platicado? - preguntó, sorprendido una vez más.
- Una vez le dije que si me podía escribir el código para graficar cuatro puntos en un plano cartesiano. Me escribió el código perfectamente y, más adelante en la conversación le pregunté: si sabía lo que era regresión lineal. Me explicó con lujo de detalles la regresión lineal y usó los cuatro puntos que le había escrito en las líneas anteriores para armar el ejemplo.
- Guau… ¡suena súper e increíble! - exclamó.
- Ahora déjame sorprenderte más.
- ¿Se puede? -incrédulo preguntó.
- Casi seguro, vamos a otro sitio de la misma compañía.
Teclearon nuevamente en el teléfono: https://openai.com/dall-e-2/ y entraron a otro sitio. En esta ocasión: “dog in space travelling towards a star” (perro en el espacio viajando hacia una estrella) y ante sus ojos aparecieron cuatro imágenes con esa descripción.
Figura 1. Imagen creada con Dall-E ante la frase “dog in space traveling towards a star”.
Por no decir algo más, dado el asombro solo alcanzó a decir:
- Me gusta más la tercera (Figura 1)
Siguieron jugando algo más con esta aplicación. Ante sus ojos aparecían imágenes tipo fotografía o arte moderno o estilo impresionista, por ejemplo, de dos personas platicando en una terraza (Figura 2). En fin, mostraban en imágenes lo que hoy podemos tener con este tipo de Inteligencia Artificial.
Figuras 2. Imágenes creadas introduciendo el párrafo inicial de este texto en la página https://huggingface.co/spaces/stabilityai/stable-diffusion otro ejemplo de imágenes creadas por algoritmos de inteligencia artificial.
Continuó la explicación:
- Con estas aplicaciones de inteligencia artificial nuestra vida puede cambiar.
- Así es, van a hacer nuevas herramientas de uso cotidiano para muchas personas.
- Sí, muy similar a como hoy usamos los teléfonos inteligentes.
- Pero es muy importante que las universidades y centros de investigación públicos redoblen sus esfuerzos para entender y contribuir en la concepción y desarrollo de estos tipos de aplicaciones. En este momento, las grandes compañías son las que lideran en estas áreas.
- La juventud puede retomar estos temas y no solo usarlos, sino intervenir en sus desarrollos.
En eso estaban cuándo se dieron cuenta de que ya estaba oscureciendo y que los pájaros empezaban a regresar a sus nidos. De hecho, salieron de la terraza y vieron pasar una parvada de cotorros verdes. Esos que ahora están en la ciudad de Cuernavaca. Hay que reflexionar sobre los cambios que nos han tocado vivir, desde usar la pluma fuente o pluma de tinta líquida que manchaba las manos al escribir, hasta ahora que se usan las computadoras y las aplicaciones que parecen sentir y pensar como LaDMA y ChatGTP.
Referencia
[1] https://cajundiscordian.medium.com/is-lamda-sentient-an-interview-ea64d916d917
Esta columna se prepara y edita semana con semana, en conjunto con investigadores morelenses convencidos del valor del conocimiento científico para el desarrollo social y económico de Morelos. Desde la Academia de Ciencias de Morelos externamos nuestra preocupación por el vacío que genera la extinción de la Secretaría de Innovación, Ciencia y Tecnología dentro del ecosistema de innovación estatal que se debilita sin la participación del Gobierno del Estado.