
Her (2013, Spike Jonze), película en la que un hombre se enamora de su sistema operativo. Imagen tomada de la página de Unocero.
En la película Her (2013), Theodore se enamora de su sistema operativo, el cual, además de tener la voz sugerente de Scarlett Johansson, llega a conocer a Theodore mejor que nadie y aprende a reconocer inmediatamente su estado de ánimo. No es la primera vez que en una película de ciencia ficción una computadora adquiere conciencia y se enreda en una complicada relación con humanos, pero el filme llevó a Youyou Wu, una estudiante de posgrado en Cambridge, a preguntarse si las computadoras que tenemos hoy en día podrían descifrar nuestra personalidad a partir de nuestra actividad en Internet. Así, Youyou Wu y colaboradores de las universidades de Cambridge y Stanford se dieron a la tarea de estudiar la forma en que datos obtenidos de Facebook pueden utilizarse para que una computadora aprenda sobre nuestra personalidad. Lo sorprendente es que, con el modelo que propusieron, la computadora “aprendió” tan bien que, al hacer predicciones sobre la personalidad de un individuo, obtuvo mejores resultados que los colegas, los amigos y la familia de la persona en turno.
Todo parece indicar que sí: tu computadora podría conocerte mejor que tu familia, tus amigos y (con suficiente datos) que tu cónyuge.
Youyou Wu, cuyas líneas de investigación incluyen comparar la habilidad de humanos y de computadoras para analizar y predecir la personalidad, motivaciones y habilidades de otras personas. Fotografía tomada de la página de Linkedin.
¿Cómo se llevó a cabo el estudio? Para describir la personalidad de un individuo, el estudio utilizó el Modelo de los cinco factores (Big Five Personality), que analiza la personalidad como la composición de cinco características: openness (apertura a nuevas experiencias), conscientiousness (responsabilidad), extroversion (extraversión), agreeableness (amabilidad) y neuroticism (inestabilidad emocional). Este modelo se utiliza con frecuencia en psicología (puedes encontrar tu perfil respondiendo un test en la página de internet). En el estudio realizado, los investigadores seleccionaron 86 220 voluntarios y les pidieron que contestaran un test de personalidad basado en el modelo anteriormente mencionado. Después, dividiendo a los voluntarios en dos grupos, los investigadores utilizaron los resultados de los tests y el perfil de Facebook del primer grupo para “entrenar” a una computadora, con el fin de encontrar la relación entre la personalidad de cada individuo y los me gusta dados por la persona en Facebook. Posteriormente, para cada persona del segundo grupo, se obtuvo una predicción sobre 10 rasgos de su personalidad, hecha por (1) la computadora entrenada y (2) amigos, colegas y familiares de la persona. Y sí: la computadora obtuvo mejores resultados. Mientras más me gusta se habían usado como datos de entrada para la computadora, su predicción resultó mejor: con sólo 10 me gusta, su predicción era mejor que la de los colegas de la persona en turno, con 70 me gusta la predicción era mejor que la de los amigos y, con más de 150, la predicción era mejor que la de la familia. A los únicos que no pudo superar, en algunos casos, fue a los cónyuges. ¿Cómo “aprende” una computadora? Utilizar los me gusta en Facebook para inferir características de una persona es una idea que, intuitivamente, tiene sentido. Quienes utilizamos Facebook, mostramos constantemente nuestra aprobación a músicos, organizaciones, personalidades o eventos mediante nuestros me gusta. Hacer inferencias a partir de esa información es algo que todos hemos hecho: conoces a alguien que te gusta, observas su perfil en Facebook y te formas una imagen de la persona a partir de lo que encuentras ahí . Pero ¿cómo entrenas a una computadora para que haga algo similar? Grosso modo, una vez que se tienen datos sobre me gusta y rasgos en la personalidad, se puede encontrar una correlación entre ciertos elementos. Por ejemplo, los autores del estudio mencionan que encontraron una relación entre me gusta para meditación y David Bowie, y una personalidad liberal, con más apertura en las artes; un me gusta para Wikipedia, en el otro extremo, se relacionaba con personalidades más tímidas y reservadas. Identificar estas relaciones no es tan sencillo, pero existen modelos y algoritmos en el área de Aprendizaje Automático (Machine Learning) que permiten encontrar esta información. ¿Para qué podría servir todo esto? Identificar automáticamente ciertos rasgos en la personalidad de alguien, sin necesidad de haber interactuado, podría ser útil, por ejemplo, a la hora de contratar personal, o de orientar a las personas para elegir una carrera. Aunque las personas somos bastante buenas identificando rasgos en la personalidad de otros, la evaluación que hacemos puede llevar consigo muchos sesgos; tenemos tendencia, por ejemplo, a proyectar rasgos positivos en las personas que nos caen bien o a olvidar detalles que no son tan recientes. En contraste, una computadora puede usar con más objetividad cada pieza de información disponible, sin ponderarla con emociones, prejuicios o referencias culturales, y ahí radica su ventaja. De hecho, algo sorprendente en el estudio realizado es que la computadora fue capaz de hacer algunas predicciones sobre decisiones cotidianas con mayor exactitud que la persona misma. Por otro lado, el uso de este tipo de modelos - y de todos los datos que pueden encontrarse en la red sobre una persona - viene acompañado de una serie de preguntas éticas y de la necesidad de crear mecanismos para que el uso de toda esta tecnología de verdad permita mejorar nuestras vidas (y con suerte sólo eso). De los datos en crudo al conocimiento El caso aquí descrito es sólo un ejemplo de cómo pueden transformarse simples datos (como los me gusta de Facebook) en conocimiento. En una sociedad en la que los datos abundan, esta transformación se vuelve una necesidad – y una ventaja para quienes la logran. Algunos de los campos más activos en este momento en ciencias computacionales se relacionan con encontrar patrones en grandes volúmenes de información; los logros hasta el momento son sorprendentes, desde la detección de fraudes hasta el mejoramiento de diagnósticos médicos, y, ¡contengan el aliento!, parece que apenas estamos comenzando.