Categorías
PSICÓPATA

Mentir con píxeles

Leer en 16 minutos.

Este texto fue lamido por 86 almas esta semana.

La imagen que ves en las noticias de televisión podría ser falsa: un montaje fabricado con nuevas tecnologías de manipulación de vídeo.

El año pasado, Steven Livingston, profesor de Comunicación Política en la Universidad George Washington, sorprendió a los participantes en una conferencia sobre Geopolítica. Se debatió el papel de los satélites en la transmisión de imágenes. No presentó ninguna evidencia de nuevas movilizaciones militares o pandemias globales. En cambio, mostró un vídeo de la patinadora Katarina Witt durante una competición de patinaje en 1998.

En el clip, Katarina se desliza con gracia sobre el hielo durante unos 20 segundos. Luego viene lo que quizás sea una de las repeticiones de imágenes más inusuales jamás vistas. El fondo era el mismo y los movimientos de la cámara eran los mismos. En realidad, la imagen era idéntica a la original en todos los sentidos excepto quizás en el más importante: Katarina había desaparecido, junto con todos los signos de ella. En su lugar estaba exactamente lo que uno esperaría si Katarina nunca hubiera estado allí: el hielo, las paredes del ring y la multitud.

Gran cosa, dirás. Después de todo, hace más de medio siglo, el equipo de Stalin, el dictador soviético, ya eliminó de las fotografías a personalidades que no eran del agrado del gobierno. Y hace diecisiete años, Woody Allen realizó una gran cantidad de deformaciones de la realidad en la película Zelig, donde aparece junto a figuras del pasado como Adolf Hitler y los presidentes estadounidenses Calvin Coolidge y Herbert Hoover. También en películas como Forrest Gump y Mere Coincidence, la distorsión de la realidad se ha convertido en algo habitual.

Lo que diferencia –y mucho– la demostración con Katarina Witt es que la tecnología utilizada para “prácticamente excluir” al patinador ahora se puede aplicar en tiempo real, en vivo, incluso mientras la cámara graba la escena y al mismo tiempo la transmite. público. En la fracción de segundo entre fotogramas de vídeo, cualquier persona u objeto que se mueva en primer plano se puede eliminar y los objetos que no están allí se pueden insertar y parecer reales. “Plasticidad de píxeles”, así se llama Livingston a esta técnica. Las implicaciones para los asistentes a la conferencia sobre geopolítica e imágenes de satélite dieron que pensar: las fotografías mostradas pueden no ser necesariamente las que realmente tomó la cámara electrónica del satélite.
Pero las ramificaciones de esta nueva tecnología van más allá de las imágenes de satélite. A medida que la manipulación en vivo se vuelva más práctica, la credibilidad de todos los videos se volverá tan sospechosa como las fotografías soviéticas de la Guerra Fría. El problema tiene sus raíces en la naturaleza del vídeo moderno. Vivo o no, está formado por píxeles y, como dice Liningsotn, los píxeles se pueden cambiar.

Los ejemplos más conocidos de manipulación de vídeo en tiempo real hasta la fecha son las “inserciones virtuales” en retransmisiones deportivas profesionales. El 30 de enero de este año, casi una sexta parte de la humanidad en más de 180 países vio una línea naranja trazada repetidamente sobre el campo de fútbol americano durante la transmisión del Super Bowl. Princeton Video Imaging (PVI) en Lawerenceville, Nueva Jersey, creó esa línea, la grabó en una computadora y la insertó en la transmisión en vivo. Para ayudar a determinar dónde insertar los píxeles naranjas, varias de las cámaras del juego estaban equipadas con sensores que rastreaban las posiciones espaciales y los niveles de aumento de las cámaras. A la ilusión de realidad se sumó la capacidad del sistema PVI para garantizar que los jugadores y jueces ocultaran la línea virtual cuando sus cuerpos la cruzaban.

Incluso las retransmisiones televisivas en directo pueden manipularse ahora con “inserciones virtuales”

En los Estados Unidos la primavera y el verano pasados, mientras PVI y rivales como Sport-vision de Nueva York transmitían productos de inserción virtual, incluidos anuncios simulados en las paredes detrás de los bateadores de béisbol de las grandes ligas, un equipo de ingenieros de Sarnoff Corporation, de Princeton, Nueva Jersey, voló al Centro de Operaciones de la Coalición Aliada de la OTAN, Vicenza, Italia. Su misión: transformar su tecnología experimental de procesamiento de vídeo de una herramienta experimental de procesamiento de vídeo a una herramienta operativa para localizar y apuntar rápidamente a vehículos militares serbios en Kosovo. El proyecto se llamó Tiger, acrónimo en inglés que corresponde a “fijación de objetivos mediante georregistro de imágenes”. “Nosso objetivo era poder disparar munição guiada com precisão através de veículos militares sérvios – basta marcar as coordenadas e a coisa vai:, explica Michaels Hansen, um jovem e agitado aficionado por equipamentos da Sarnoff que acha difícil acreditar que estava ajudando a fazer uma guerra el año pasado.

En comparación con el trabajo del PVI, la tarea técnica de los militares era más difícil y lo que estaba en juego era mucho mayor. En lugar de alterar las retransmisiones de fútbol, ​​el equipo Tigre manipuló la transmisión de vídeo en directo desde un Predator, un avión de reconocimiento no tripulado que volaba a 450 metros de altura sobre los campos de batalla de Kosovo. En lugar de superponer líneas virtuales o anuncios en escenas deportivas, la tarea consistía en colocar imágenes de Kosovo "georregistradas" en tiempo real sobre las escenas correspondientes transmitidas en vivo desde la cámara de vídeo del Predator. Las imágenes del terreno habían sido previamente capturadas con fotografía aérea y almacenadas digitalmente. El sistema Tiger, que detectaba automáticamente objetos en movimiento en el fondo, podía proporcionar casi instantáneamente a los oficiales de artillería las coordenadas de cualquier equipo serbio en el campo de visión del Predator. Esta fue una hazaña muy técnica, ya que el Predator se movía y su ángulo de visión cambiaba constantemente. Incluso entonces, esas vistas tuvieron que alinearse y registrarse electrónicamente con la imagen almacenada en menos de una trigésima parte de segundo (para igualar la velocidad de fotogramas de la grabación de vídeo).

En principio, los objetivos podrían haberse dirigido directamente a armas guiadas con precisión. "En realidad no estábamos haciendo eso en las Fuerzas Aliadas", señala Hansen. "Simplemente les decíamos a los oficiales tiradores exactamente dónde estaban los objetivos serbios y luego ellos indicaban a los aviones que los alcanzaran". De esta manera, los tomadores de decisiones humanos podrían evitar decisiones erróneas tomadas por máquinas defectuosas. Según la Agencia de Proyectos de Investigación Avanzada de Defensa, la tecnología Tiger se utilizó ampliamente en las últimas tres semanas de la operación en Kosovo, durante las cuales “entre el 80% y el 90% de los objetivos en movimiento fueron alcanzados”.

Hasta entonces, la manipulación de vídeo en tiempo real estaba al alcance sólo de organizaciones tecnológicamente sofisticadas, como las cadenas de televisión y el ejército. Pero los desarrolladores de la tecnología dicen que se está volviendo lo suficientemente simple y barata como para difundirla a lo largo y ancho del mundo. Y esto ha llevado a algunos observadores a preguntarse si la manipulación de vídeos en tiempo real erosionará la confianza del público en las imágenes televisivas, incluso cuando se transmitan en noticieros. “La idea de ver para creer puede volverse inválida”, afirma Norman Winarsky, vicepresidente corporativo de tecnología de la información de Sarnoff. "Es posible que no sepas en qué confiar".

Ya se está produciendo una forma burda de manipulación de vídeos en la comunidad de imágenes satelitales. La publicación semanal Space News informó a principios de este año que el gobierno indio publica imágenes de sus satélites de detección remota sólo después de que las instalaciones de defensa hayan sido “eliminadas”. En este caso no hay manipulación en tiempo real y es abierto, como el marcador de tinta de un censor. Pero los píxeles son flexibles. Ahora es perfectamente posible insertar conjuntos de píxeles en imágenes de satélite que los intérpretes de datos podrían identificar como batallones de tanques, aviones de guerra, lugares de entierro, filas de refugiados o vacas muertas que, según los activistas, fueron víctimas de un accidente biotécnico.

Una cinta de demostración proporcionada por PVI refuerza este punto en el entorno prosaico de un aparcamiento suburbano. La escena parece común, salvo por un detalle inquietante: entre los camiones y minivans hay varios tanques estacionados y un monstruo armado conduciendo de manera desconcertante. Imaginemos una cinta de tanques paquistaníes virtuales cruzando la frontera india presentada en las noticias como auténtica, y podremos sentir el tipo de problemas que pueden provocar las imágenes falsas.
Los proveedores comerciales de servicios de inserción virtual están demasiado centrados en nuevas oportunidades de marketing como para preocuparse mucho por la geopolítica. Tienen los ojos puestos en mercados mucho más rentables. De repente, estos enormes espacios de programación entre comerciales –es decir, el programa real– quedan disponibles para miles de millones de dólares en publicidad en horario estelar. La cinta de demostración de PVI, por ejemplo, incluye una escena en la que aparece (virtualmente, por supuesto) una caja de Microsoft Windows en la estantería del estudio de Frasier Crane. Este tipo de colocación de productos podría volverse cada vez más importante a medida que las nuevas tecnologías de grabación de video, como TiVo y RePlayTV, brinden a los espectadores más poder para editar comerciales.

Dennis Wilkinson, un experto en marketing amante de los deportes que se convirtió en director ejecutivo de PVI hace aproximadamente un año, no podría estar más feliz con esto. Los ojos de Wilkinson se iluminan cuando describe el futuro (cercano) en el que la tecnología de inserción virtual llevará los anuncios a extremos de personalización. Combinada con servicios de extracción de datos (a través de los cuales se pueden rastrear y analizar los gustos individuales y los patrones de consumo de navegadores), la inserción virtual abre la posibilidad de entregar anuncios personalizados y dirigidos a través de líneas telefónicas o cables a usuarios de la web o espectadores de televisión por cable. Digamos que a usted le gusta Pepsi, pero a su vecino de al lado le gusta Coca-Cola y a su vecino de enfrente le gusta Seven Up, el tipo de datos que es fácil de recopilar a través de los registros de pago de los supermercados. Será posible ajustar la imagen de los refrescos en la señal de transmisión para llegar a cada uno de ustedes con su marca preferida.

A sólo 15 minutos de PVI, Winarsky de Sarnoff también está radiante, no tanto por ganar cuota de mercado, sino por el poder transformador de la tecnología. Sarnoff tiene una historia distinguida en este campo: la compañía desciende de RCA Laboratories, que comenzó a innovar en tecnología de televisión a principios de la década de 40 y sacó a la luz una gran cantidad de tecnologías de medios. Los televisores de tubo en color, las pantallas de cristal líquido y la televisión de alta definición provinieron, al menos en parte, de RCA. Sarnoff exhibe cinco premios Emmy técnicos en su recepción.

La capacidad de manipular datos de vídeo en tiempo real, afirma Winarsky, tiene tanto potencial como algunos de sus predecesores. "Ahora que puedes cambiar el vídeo en tiempo real, has cambiado el mundo", afirma. Esto puede sonar pomposo, pero después de ver el vídeo de Katarina Witt, el discurso de Winarsky sobre “cambiar el mundo” pierde algo de su tono exagerado.

Eliminar personas u objetos en vídeo en vivo, o insertar personas u objetos previamente grabados en escenas en vivo es solo el comienzo de todos los trucos que estamos haciendo posibles. Gran parte de cualquier vídeo que se haya grabado se está convirtiendo en imágenes prediseñadas que los productores pueden esculpir digitalmente en la historia que quieren contar, dice Eric Haseltine, vicepresidente senior de I+D de Walt Disney Imagineering en Glendale, California. Con tecnologías adicionales de manipulación de vídeo, los actores previamente grabados pueden decir y hacer cosas que en realidad nunca han hecho o dicho. "Puedes hacer que actores muertos protagonicen películas completamente nuevas", dice Haseltine.

Las imágenes contemporáneas, incluidas grabaciones de actores muertos, existen desde hace muchos años. Pero el ilusionismo de Hollywood –que, por ejemplo, incluyó a John Wayne en un anuncio de televisión– requirió un difícil trabajo de postproducción fotograma a fotograma, realizado por técnicos especializados. Ahora hay una gran diferencia, afirma Haseltine. "Lo que antes tomaba 1 hora (por fotograma de vídeo) ahora se puede hacer en una sexagésima de segundo". Esta espectacular aceleración significa que la manipulación se puede realizar en tiempo real, instantáneamente, mientras la cámara graba o transmite. John Wayne, Fred Astaire o Saddam Hussein no sólo pueden insertarse virtualmente en anuncios preproducidos, sino que también podrían insertarse, por ejemplo, en la transmisión en vivo de un programa de televisión.

La combinación de la inserción virtual en tiempo real con técnicas de postproducción existentes y emergentes abre un mundo de oportunidades de manipulación. Considere la tecnología Video Rewrite, desarrollada por Interval Corporation y UC Berkeley y demostrada por primera vez hace tres años. Con sólo unos minutos de vídeo de alguien hablando, su sistema captura y almacena un conjunto de imágenes fijas de vídeo, de modo que el área de la boca de la persona parece moverse al decir diferentes conjuntos de sonidos. A partir de la biblioteca resultante de “visemes” es posible retratar a la persona como si dijera cualquier cosa con la que los productores soñaron, incluidas expresiones que el individuo nunca usaría, ni siquiera muerto.

En una aplicación de prueba, el científico informático Tim Bregler, ahora en la Universidad de Stanford, y sus colegas digitalizaron 2 minutos de una grabación de dominio público del presidente estadounidense John F. Kennedy hablando durante la crisis de los misiles cubanos en 1962. Utilizando la biblioteca de "visemas", los investigadores Creó "animaciones" de la boca de Kennedy diciendo cosas que nunca dijo, incluido "Nunca conocí a Forrest Gump". Con tecnología de este tipo, en principio, los activistas podrían en un futuro cercano orquestar transmisiones por Internet de sus adversarios diciendo cosas que podrían hacer que la persona más recta y honorable parezca el máximo sinvergüenza.

Haseltine cree que las técnicas de manipulación de vídeo se llevarán rápidamente a su extremo lógico: "Puedo predecir con absoluta certeza", afirma, "que una persona sentada frente a un ordenador podrá escribir el guión de un vídeo, dibujar los personajes y "Haz la iluminación, el vestuario, todas las actuaciones, los diálogos y la postproducción, distribuye ese vídeo a través de una red de banda ancha, todo en una computadora portátil, y los espectadores no notarán la diferencia".

Trucos que hoy requieren un sistema de 80.000 dólares pronto podrían estar en las tiendas en una cámara de vídeo comercial
Hasta ahora, las aplicaciones más extendidas de manipulación de vídeo en tiempo real se han producido en áreas benignas como los deportes y el entretenimiento. Sin embargo, el año pasado, la tecnología comenzó a extenderse más allá de estos lugares, para aplicaciones que ya han causado cierta preocupación. El otoño pasado, por ejemplo, CBS contrató a PVI para colocar virtualmente el logotipo familiar de la cadena en toda la ciudad de Nueva York en edificios, vallas publicitarias, fuentes y otros lugares, durante la transmisión de The Early Show de la cadena. El New York Times publicó en enero un artículo en primera plana en el que cuestionaba la ética periodística existente a la hora de alterar la apariencia de algo que realmente está ahí.

La combinación de inserción virtual en tiempo real, cibertíteres, regrabación de vídeo y otras tecnologías de manipulación de vídeo con una infraestructura de medios de comunicación que transmite instantáneamente vídeos de noticias en todo el mundo tiene preocupados a algunos analistas. "Imagínese si usted es el gobierno de un país hipotético que quiere más asistencia financiera internacional", dice Livingston de la Universidad George Washington. "Podrías enviar vídeos de una zona remota con gente hambrienta y es posible que nunca hubiera sucedido", afirma.

Haseltine está de acuerdo. “Me sorprende que todavía no hayamos visto vídeos falsos”, dice antes de retroceder un poco: “Tal vez sí. ¿Quién lo sabría?

Es exactamente el tipo de escenario que se desarrolla en la película Mere Coincidence de 1988, en la que un alto asesor presidencial conspira con un productor de Hollywood para transmitir una guerra prácticamente escenificada entre Estados Unidos y Albania para desviar la atención de un escándalo de corrupción presidencial. Haseltine y otros se preguntan cuándo la realidad imitará al arte que imita la realidad.

La importancia de la cuestión no hará más que intensificarse a medida que la tecnología se vuelva más accesible. Lo que ahora requiere una máquina de 80.000 dólares del tamaño de un refrigerador pequeño pronto se encontrará en tableros del tamaño de la palma de la mano (y, en última instancia, en un solo chip) que cabrá en una grabadora de vídeo comercial, según Winarsky. "Esto estará disponible en las tiendas de electrónica", afirma. Los equipos de consumo para la inserción virtual probablemente requerirán una cámara de vídeo con una tarjeta o chip especial para el procesamiento de imágenes. Este hardware recibirá señales de los sensores de imagen electrónicos de la cámara y las convertirá en una forma que pueda analizarse y manipularse en una computadora con el software adecuado, algo idéntico a lo que se hace con Adobe Photoshop y otros programas para "limpiar" archivos de imágenes digitales. Un usuario doméstico podría, por ejemplo, insertar a familiares ausentes en las imágenes de la última reunión familiar, o eliminar a extraños que prefieran no aparecer en la escena, llevando revisiones históricas al estilo soviético directamente al entorno doméstico.

En EE.UU., los expertos ya debaten sobre los riesgos del uso político de las nuevas técnicas de vídeo

Si se combina la posible erosión de la confianza en la autenticidad de los reportajes en vivo con el llamado “efecto CNN”, se crea el escenario para que la falsificación mueva al mundo de diferentes maneras. Livingston describe el efecto CNN como la capacidad de los medios de comunicación de ir más allá de simplemente informar lo que sucede para influir verdaderamente en los tomadores de decisiones cuando examinan el ejército, la asistencia internacional y otros temas nacionales e internacionales. “El efecto CNN es real”, afirma James Currie, profesor de ciencias políticas en la Universidad de Defensa Nacional en Fort McNair, Washington. "Cada oficina del Pentágono a la que uno va tiene un televisor con CNN". Y eso significa, afirma, que un gobierno, un grupo terrorista o una ONG podrían poner en marcha acontecimientos geopolíticos en pocas horas, a partir de la credibilidad lograda gracias a la distribución de un vídeo bien elaborado.

Con experiencia como reservista del ejército, miembro de un personal con altos privilegios de confidencialidad en el Comité de Inteligencia del Senado y como oficial de enlace legislativo para el Secretario del Ejército, Currie ha visto de cerca la toma de decisiones políticas y gubernamentales. Está convencido de que la manipulación de vídeos en tiempo real estará, o ya está, en manos de las comunidades militares y de inteligencia. Y, aunque todavía no hay evidencia de que alguna organización haya utilizado técnicas de manipulación de vídeos, en tiempo real o no, con fines políticos o militares, sí es capaz de identificar escenarios de desinformación. Por ejemplo, dice, basta pensar en el impacto de un vídeo fabricado que parece mostrar a Saddam Hussein “vertiendo whisky escocés en un vaso y tomando un gran trago. Podrías transmitirlo en la televisión de Medio Oriente y eso socavaría totalmente su credibilidad ante las audiencias islámicas”.

Sin embargo, a pesar de todas las reacciones emocionales, algunos expertos todavía no están convencidos de que la manipulación de vídeos en tiempo real represente una verdadera amenaza, sin importar cuán buena sea la tecnología. John Pike, analista de la comunidad de inteligencia de la Federación de Científicos Estadounidenses en Washington, D.C., dice que los riesgos son simplemente demasiado grandes para que los gobiernos u organizaciones serias sean sorprendidos tratando de engañar al público. Y para aquellas organizaciones que estén dispuestas a correr el riesgo de hacerlo, dice Pike, los periodistas – sabiendo lo que la tecnología puede hacer – estarán cada vez más atentos.

"Si alguna organización de derechos humanos apareciera en CNN con un vídeo, particularmente una organización con la que no estuvieran familiarizadas, creo que (CNN) lo consideraría radiactivo", dice Pike. Lo mismo ocurre con las organizaciones no gubernamentales (ONG). “Ningún director responsable de una organización seria autorizaría este tipo de cosas. Y despedirían, en el acto, a cualquiera que sorprendiera haciéndolo. La moneda de cambio de las ONG políticas es “decimos la verdad”.

Incluso personas más reflexivas como Pike, sin embargo, admiten que los medios tienen un talón de Aquiles: Internet. "El problema no es tanto la capacidad de falsificar vídeos en CNN, sino la posibilidad de ponerlos online", afirma. Esto se debe a que la mayor parte del contenido de Internet no está filtrado. "Podría interferir con el proceso de producción de noticias, donde no se reproduciría el informe original, pero se informaría lo que se informó", dice Pike. Un procedimiento de este tipo podría dar lugar, en cascada, a un efecto CNN. "No hay duda de que este tipo de experimentos eventualmente se realizarán", afirma Pike.

El problema, dice Livingston, es que unas pocas experiencias pueden ser suficientes para que la gente cuestione para siempre la autenticidad del vídeo. Esto podría tener enormes repercusiones para las operaciones militares, de inteligencia y de noticias. Podría surgir una consecuencia sociológica irónica: un retorno a una mayor dependencia de la comunicación cara a cara sin intermediarios. Mientras tanto, sin embargo, habrá algunos giros interesantes a medida que los píxeles se vuelvan aún más flexibles.

por Ivan Amato – Publicado originalmente en la revista Info Exame No. 175 – Octubre/2000

Deja un comentario

Traducir "