Episodio 3: Big Data – Dime por dónde navegas

Locutora: Voces en red, un Podcast de NIC Argentina

Moderadora: La idea de este formato es discutir las temáticas de agenda que nosotros, que somos parte de la comunidad de Internet, conocemos como de Gobernanza de Internet.

Bienvenidos al tercer episodio de Voces en Red, hoy estaremos hablando sobre Bid Data junto a Walter Sosa Escudero. 

Bueno Walter, bienvenido a Voces en Red es una enorme alegría que puedas estar con nosotros en este episodio.

Walter: Muchas Gracias por la invitación. 

Moderadora: Cuando hablamos de Big Data, en general se lo piensa como un concepto disruptivo, como algo nuevo, que se lo puede abordar de diferentes disciplinas. Dada esta complejidad que tenemos a la hora de abordar este concepto ¿Cómo crees que podríamos definirlo?

Walter: El problema con intentar dar la definición de Big Data ahora es que es un fenómeno que, como decías, es disruptivo. Entonces uno, no querría comprometerse con una definición que va a querer cambiar dentro de meses, dentro de semanas. Pero, apostando una definición, yo te diría que Big Data tiene que ver con este fenómeno de datos masivos producidos por interactuar espontáneamente con cosas que están interconectadas, que pueden ser dispositivos electrónicos como teléfonos celulares, GPS, sensores, también el uso de las redes sociales, de Internet y de Tarjetas de Crédito. En definitiva el fenómeno Big Data tiene que ver con dos cosas, uno con la proliferación de datos y otra es con los métodos algoritmos que se utilizan para estudiarlos y analizarlos. 

Locutora: Walter Sosa Escudero, se especializa en econometría y estadística aplicada a cuestiones sociales. También es director del Departamento de Economía de la Universidad de San Andrés y autor del libro “Big Data: breve manual para conocer la ciencia de datos”.

Moderador: Especialmente en una etapa en donde ya en Internet el debate no es la velocidad de la comunicación si no también la densidad como decís vos IoT también genera un cambio importante en temas como Inteligencia Artificial, Machine Learning, y demás, generan todo un ecosistema en el debate que no se puede ver Big Data por separado, si no que se ve Big Data en el marco de todo esto y cómo empezar a procesar grandes volúmenes de información en modelos diferentes. 

Walter: Sí, tiene que ver..., la palabra Big Data suena a lo que la traducción sugiere de una manera bastante obvia que son "muchos datos" pero hay dos cosas que son importantes con respecto al fenómeno Big Data. Primero que no es una contraposición a un fenómeno de Small Data, no es que antes teníamos menos datos y ahora tenemos más. Porque esa visión, a mi juicio, es simplista sugiere que entonces si tenemos más, estamos mejor y, para que eso sea cierto, tenemos que tener más de los mismos datos que teníamos antes. Y el fenómeno de Big Data es un fenómeno muy distinto al fenómeno anterior que vamos a caracterizar como Small Data. O sea, en definitiva una encuesta en Twitter, una encuesta en redes sociales en general, no es una encuesta estándar con más observaciones, es una encuesta completamente distinta. Más bien que si tenemos la palabra Big Data usémosla, pero me parece que cosas como New Data o Ride Data son un poco más interesantes. O sea, es el fenómeno de los datos, de muchos datos, pero también tiene que ver con el tipo de datos y, como decíamos recién, con la forma de analizarlos.

Moderadora: La interpretación ¿no? que se hace también de esos datos. 

Walter: Sí, además el tipo de..., vamos a llamarlo "algoritmo" por falta de mejor nombre ¿no? Pero métodos computacionales matemáticos que se utilizan para hacer sentido los datos. El punto es que cuando va a la esencia ni los datos ni los algoritmos son un fenómeno nuevo. Esta no es la primera revolución de datos y, perdón por desilusionar a alguien, tal vez ni siquiera sea la más importante. Insisto, la revolución genética en su momento generó una explosión de datos, la revolución de la opinión publica. En su momento, hace muchísimos años la revolución de la astrofísica, generaron auténticas revoluciones de datos. O sea, fue una revolución de datos en su momento lo que permitió descubrir fenómenos trascendentes como la órbita elíptica de los planetas. Entonces, la pregunta es ¿estamos descubriendo algo que les parece al movimiento orbital de los planetas? Si la respuesta es "Sí", esta es una revolución de datos. Pero en definitiva esta no es la primer revolución de datos y algoritmos. Cuando uno mira la historia de la ciencia al largo plazo ya hubo otras revoluciones y, perdón que establezca la duda, tal vez mas importantes que esta, no lo sabemos todavía.

Moderador: Sí, yo creo que en definitiva cada una de las cosas que van ocurriendo van generando cambios. Inclusive es interesante lo que planteas en términos de los mecanismos, los métodos, o las formas de analizar la información. Porque también uno podría decir: el procesamiento paralelo, el procesamiento de alto desempeño, la súper computadora, también trajo la posibilidad de procesar grandes volúmenes de datos pero cuando hablamos de Big Data estamos hablando de algo diferente. ¿Por qué estamos hablando de algo diferente? 

Walter: Estamos hablando de algo diferente porque Big Data muestra lo que la gente o quiere mostrar, o no hace mucho para impedir que se vea. Entonces, cuando yo te digo la definición un poco conjetural de Big Data subrayo una palabra que es la palabra "espontaneo". Insisto, en una encuesta de estas que todavía ocurren por teléfono de línea o un experimento científico no hay nada de espontaneo. En una encuesta científicamente diseñada hay un diseño experimental, en un experimento hay un protocolo, o sea que es la antítesis de lo espontaneo. O sea cuando a vos te llaman para responder una encuesta, te preguntan "bueno, estamos haciendo una encuesta, usted tiene tanta edad, está en condiciones de responder la encuesta", entonces uno tiene que decir "Sí, sí, sí" "no, no" varias veces  pero cuando yo vine acá, esta mañana a este Podcast, puse en Waze por donde venir y me trajo más o menos, y yo generé una parva de información, es como si hubiese respondido no sé, 300 encuestas y nadie me preguntó si yo quería responder una encuesta, yo lo hice en forma pasiva. Eso tiene una ventaja y una desventaja. La ventaja es que genera en forma prácticamente gratuita, prácticamente gratuita (repite) un montón de datos, un montón de datos (remarca) en mi caso de, no sé, por dónde vine, a qué hora me levante, cuál era el tráfico, mi edad, antes de venir acá fui a tomar un café. Entonces hay un montón de información que yo generé acerca de cierto fenómeno y de una manera un tanto pasiva. No es que nadie me preguntó si yo quería responder una encuesta, si no que en términos "pasivos"  yo no me opuse. El hecho de que yo tenga el celular prendido arriba de la mesa significa que yo "accedí" a responder una especie de mega encuesta en tiempo continuo. Eso es una ventaja ¿dónde está la desventaja? Que la interacción es espontanea, entonces Big Data es un fenómeno de datos masivos que están mediados por la decisión pasiva o activa de interactuar con algo que esta interconectado. Y eso no es trivial ¿qué significa eso? Que los datos de las personas que decidieron no interactuar con cosas yo no los puedo observar nunca. O sea, los datos de las personas que deciden no usar una autopista porque es cara, porque es lenta, porque es insegura yo no lo puedo ver. Los datos de las personas que decidieron no tener el celular prendido yo no los puedo ver. Entonces, en definitiva un error que comete mucha gente es pensar que Big Data nos deja cada vez más cerca del largo derroteo de tener todos los datos  y por lo que yo te acabo de decir, nunca vamos a tener todos los datos. Tenemos un montón de datos que son súper útiles y muy relevantes de acciones que están mediadas por la decisión de usar algo y eso, automáticamente, nos imposibilita ver los datos de la gente que no toma esa decisión. Eso explica por qué, explica como si fuese relevante explicarlo, porque encuestas megas masivas en las redes sociales fracasan estrepitosamente. Porque están mediadas por la decisión de: a) usar la red social, b) responder la encuesta. Entonces eso es algo así como la criptonita de las encuestas. Una encuesta bien hecha no tiene que estar mediada por nada.

Moderador: De cualquier forma ahí hay, en el caso del ejemplo de Waze, hay que pensar que no es alguien que toma la decisión de contestar una encuesta sino de utilizar una herramienta.

Walter: Exactamente.

Moderador: Y la pregunta es ¿hasta dónde se anonimiza esa información? o de alguna forma sabe perfectamente quién es el que la está usando y si se le preguntó que alguien pueda usar información de esa. Por ejemplo, a través de Waze sabes de dónde salís, a dónde llegas, y en términos prácticos sabes dónde está tu casa, dónde está el trabajo, cuál es tu rutina, etc. y hasta dónde está anonimizada esa información.

Walter: Sí, lo cual también es importante lo que decís porque es otra forma de ver que esto rompe un protocolo científico. Insisto, en una encuesta la esencia de la encuesta científica es que sea anónima ¿no? es lo que se llama "secreto estadístico" y la esencia de un experimento es que quien es el sujeto experimental no importa, lo que importa es que le diste una droga o no le diste una droga, no importa cómo se llama o cosas que sean independientes a lo que vos querés medir. Entonces, uno de los grandes problemas que tienen los datos de Big Data es que no son datos de más de lo mismo. Eso te pone barreras que son, además de funcionales, las encuestas no están hechas al azar, si no que además tampoco está claro que esas encuestas sean realmente anónimas, y si yo percibiese que una encuesta no es anónima o no la respondo o respondo lo que tenés ganas de escuchar. No sé si es peor la respuesta sesgada o la no respuesta. 

Moderadora: Walter, siguiendo un poco con lo que vos venias diciendo recién acerca de los datos que están, las encuestas, que pasa con aquellos datos que no están, los datos que no conocemos. Esa información que no puede predecirse por el momento. Hay, como decías, volumen de  datos espontáneos se generan, no sé si decirlo, políticas publicas pero si se generan discursos, o se forman verdades, pero ¿y esos datos que no están? ¿Qué es lo que sucede con esa información que no puede predecirse? 

Walter: Es una buena pregunta, dejame entrarle por dos lados. Primero que la ciencia del conocimiento tiene mucha experiencia en predecir los datos que no existen. De hecho, lo que intenta ser un experimento científico es eso. Es intentar predecir los datos que no existen. Hay una parte que es bastante fácil de predecir y una parte que es difícil y una parte que es imposible. Insisto, cualquier mecanismo de recomendación en Netflix, en Amazón, en lo que sea, lo que hace es intentar rellenar un hueco: Mirá, yo no te conozco pero conozco acciones que están al lado de las acciones que vos tomaste y personas que están al lado tuyo, que se yo, amigos, gente que tiene tu edad, tus gustos, y además que ha hecho cosas parecidas a las que vos hiciste, y a partir de ahí te recomiendo, no sé, una nueva película, un nuevo producto, esa es la parte fácil de predecir. En definitiva, justamente una..., parte de lo que llama la atención de la revolución de los algoritmos, es que pueden predecir muy sorprendentemente bien ciertas cosas. Insisto, las más de las veces los algoritmos le pegan a lo que uno querría hacer, querría comprar, querría ver. Con los algoritmos lamentablemente pasa una cosa parecida a lo que pasa con los mozos de un restaurant o con los referí de fútbol, que uno se acuerda de ellos cuando hacen mal su trabajo, entonces vos te acordás de Waze cuando te predice un camino malo.

Moderadora: Claro.

Walter: No te gusta un sistema de recomendación cuando te hace ver una serie que a vos no te va a gustar pero vos no tendés a recordar las veces que Amazon te sugirió algo que querías comprar una película que querés ver o cuando sacaste las manos del gmail y sigue escribiendo exactamente lo que vos ibas a escribir entonces vos tendés a recordar aquello que no te gustó pero en definitiva hay cierto aspecto del comportamiento humano que es hiper predecible. Eso convive con ciertos aspectos del compartimiento humano que es muy difícil de predecir y con ciertos aspectos del compartimiento humano que son imposibles de predecir. Entonces, yo creo que esto de predecir no predecir los datos faltantes es más una cuestión de grado. O sea este fenómeno de Machine Learning, Big Data, funciona muy bien para la parte que es fácil de predecir pero no deberíamos tener demasiadas expectativas en la parte que es imposible de predecir, ya no difícil. Insisto, todavía es medio tonto esto, pero mientras hablamos yo cuando me preguntan estas cosas digo para charlas para 300 personas con todos los datos, con todos los algoritmos ahora es más fácil predecir cuánto va a estar el dólar de acá a una semana o más difícil. Es exactamente igual porque el dólar o el comportamiento del precio de activo financiero está sujeto a una aleatoriedad que no tiene nada que ver con los complejo o con la falta de datos sino que está sujeto a una interacción o sea, está sujeto a que alguien quiera comprar, alguien quiera vender, entonces no es que ahora con respecto a la inhabilidad de predecir el precio del dólar estamos mejor que hace 3 años. Otros fenómenos son un poquitito más fáciles de predecir por ejemplo el clima. Resulta que ahora estamos  bastante mejor en términos de predecir clima en el corto plazo. O sea,  que es lo que va a pasar durante un día. En definitiva, el tipo de complejidad que hay detrás de predecir el clima es muy distinta al tipo de complejidad que hay detrás de predecir fenómenos sociales. Por eso es que mi postura es un tanto intermedia. 

Moderadora: Un híbrido, claro.

Walter: Vamos a ir mucho mejor con respecto a ese tipo de fenómenos que son esencialmente predecibles pero no deberíamos tener demasiada fe en mejorar la capacidad productiva de fenómenos que están armados para que no se puedan predecir. 

Moderador: Un poco vinculado a esto, tiene que ver lo que es la ciencia de datos, ¿no? data science. Y en eso efectivamente antes, bueno antes no, normalmente cuando uno quiere hacer un análisis científico, o lo que sea, efectivamente planifica perfectamente qué es lo que quiere hacer pero de alguna forma por parta de herramientas, hay muchas cosas que era muy difícil llegar y era tal vez un planteo exclusivamente teórico con lo  cual efectivamente tal como lo planteas con herramientas tipo Machine Learning, redes neuronales, etc., cosas que antes no se podían hacer ahora a nivel científico se pueden llegar a cosas muy interesantes no? y esa es tal vez la diferencia que planteás con aspectos más sociales.
W: Sí, el fenómeno de este..., en usar un término como ciencia de datos hay dos cosas. Hay una que es ponerle un nombre nuevo a algo viejo. Insisto, la estadística ya existía, el análisis matemático, la computación ya existía y mucha gente que tiene una visión pesimista de esto dice "Bueno la ciencia de datos es un nombre nuevo para una cosa vieja" como que estamos inventando una palabra nueva para el agua tibia, ¿no? Pero hay algo que vos decís que es importante. Antes de la revolución de los datos y de los algoritmos de los últimos 15 años vamos a decirle el análisis científico de datos era un..., el análisis de cosas que tuviesen que ver con datos era bastante llevada a la práctica a través de compartimientos estancos. Estaban las ideas, la  persona que procesaba datos, la persona que estudiaba datos, la persona que estudiaba modelos, como si fuese una especie de factoría en donde se van pasando el problema de un grupo al otro. Entones había una división de roles. Estaba el experto en marketing, el experto en comunicación, el experto en estadística, el experto en procesamiento de datos, que tenían que pasarse el problema entre sí. Si la ciencia de datos existe. Y acá es donde yo tengo una postura un poco más optimista, o sea si realmente la ciencia de datos existe como algo distinto a lo que había, tiene que ver con lo que decíamos recientemente como proceso integrador. O sea muy posiblemente, el estudio moderno de datos requiera, estrategias muy interactivas o sea difícilmente una persona de marketing pueda aprender algo de datos si no entiende un poquitito cómo funciona la lógica de los datos. Pero una persona que sabe mucho de datos y mucho de computación pero no sabe nada de marketing v a enfrentar a los datos sin una pregunta sólida y los datos y los métodos tienen la maldita costumbre de cuando vos no tenés una pregunta clara te dicen lo que  vos tenés ganas de escuchar. Entonces en definitiva si la ciencia de datos existe es como proceso iterativo o sea es muy difícil últimamente llevar a cabo un análisis de datos moderno sin que haya un proceso que interactúe mucho entre distintas disciplinas. Antes no había mucho dialogo entre esas disciplinas, había muy poca gente que sabía de estadística, muy poca gente que sabía de computación y en definitiva lo que requiere ese dato moderno es gente que tenga una visión mucho más panóptica.

Moderadora: Que pueda haber interdisciplina entre las áreas que pueda haber como canales de diálogo y conversación constantemente. 

Walter: Sí, es lo que vos estás diciendo. Sin entrar en jueguitos de palabra, ¿no? yo creo que el  término multidisciplinario se ha abusado y muchas veces se ha convertido en un eufemismo para nivelar para abajo. O sea, ¿qué tienen para hablar un matemático y un politólogo? bueno, nivelemos para abajo. ¿Está bien? Y lamentablemente muchas veces lo multidisciplinario o la palabra multidisciplinario se ha utilizado como una trampa para decir nivelemos para abajo. Y de vuelta, sin entrar en jueguitos de palabras, me parece que lo que demanda el análisis de datos moderno es una actitud más que multidisciplinaria, interdisciplinaria. O sea que tienda puentes no que construya lo que está en el medio. O sea no se trata hablando en términos patéticamente modernos de rellenar la grieta, sino de construir puentes entre. O sea es un matemático que pueda apreciar que en el marketing o en la política hay tanto complejidad como en los algoritmos y también una persona que piensa en términos de marketing o de sociología o de política que entienda que hay algo de la complejidad de los algoritmos que no es necesariamente técnica. Entonces  me parece que lo que se trata recientemente no es tanto de que un politólogo estudie computación o de que un matemático estudie política sino que encuentre una forma de nivelar para arriba y no para abajo. Ese es un  desafío mucho más sofisticado que el desafío de la multidisciplinaridad. 

Moderador: De acuerdo, siempre hay que nivelar para arriba y en esa lógica el problema es que en términos generales solo hablando de ciencias básicas los físicos, los químicos, los matemáticos, los biólogos, con suerte podían trabajar con temas matemáticos, estadísticos, y entendían algo de computación pero nunca iban a meterse en temas de redes neuronales, en Machine Learning y en esos temas y justamente es ahí donde es interesante la interrelación de las diferentes áreas ¿no?

Walter: Sí, todo requiere un esfuerzo. Yo no lo querría resumir en aprender a programar porque eso es parte de un plan, ¿no? A mí me parece que el desafío de las ciencias de datos moderna a nivel  de existen solo los sector académicos ni públicos ni privados sino que yo te diría el quehacer cotidiano, es más que nada entender la complejidad que va más allá de la disciplina que uno maneja. O sea, insisto, a mi juicio, y sin ser necesariamente demagógico hay tanta complejidad en una red neuronal como en un proceso político. O sea lo simplista es decir Bueno, es otro tipo de complejidad o no hay complejidad. O sea insisto, la forma más simple de liderar con la complejidad es negarla, ¿no? O usar eufemismo, yo que se una cosa que frustra mucho. Una cosa que frustra mucho a la gente que viene de las ciencias duras es meterte en una empresa y decir ah pero no me quieren dar los datos que burocracia. Bueno, la burocracia es un proceso complejo que tiene que ver con que muchas veces un gerente o un político tienen muchos objetivos y vos tenés uno solo. Entonces quizás en pos de la eficiencia vos estas dispuesto a hacer ciertas cosas que no en pos de la transparencia. O es pos de yo que se la privacidad. Entonces un político o gerente de la empresa tiene muchos objetivos y quizás vos como analista tenés uno solo.

Moderadora: Claro.
 
Walter: Entonces quizás es problema que tiene un político o un burócrata, en el sentido peyorativo, un problema que tiene esa persona en darte datos es que quizás necesita proteger la privacidad y quizás en pos de la eficiencia estaría dispuesto a darte datos pero no en términos de otro valor ético. Entonces como todo aquel que haya pasado por una empresa o una institución publica sabe que la gestión tiene múltiples objetivos. Entonces entender esa complejidad, o sea como es lidiar con dos objetivos que parecen contradictorios es algo que a mucha gente que viene de las ciencias duras le cuesta un poco y tiene a ningunearlo, tienden a decir bueno son unos idiotas, no me quieren dar los datos, no no para requiere un proceso complejo, requiere proceso político, requiere una negociación y esas cosas tienen a mi juicio, mi honesta opinión, tanta complejidad como el más sutil de los procesos matemáticos y algorítmicos.

Moderadora: Perfecto, si aparte lo que vos decís , en muchas personas al desconocer ciertos contextos hay muchos opinologos y que van dejando sentencia de determinadas situaciones sin llegar a tener la profundidad o el conocimiento total de la situación y a veces eso también hace que no se pueda visualizar la complejidad de determinados procesos. Y esto nos lleva un poco hacia otro punto de eje de dialogo que teníamos pensado, tanto con Julian como con Walter, veníamos hablando de esta complejidad de los procesos actuales y si lo llevamos a los sectores más chicos, ¿no? Los adolescentes o los chicos un poco más púber que los adolescentes también que ya nacieron quizás con otra estructura con otras prácticas, muy diferente a quienes tuvimos ese híbrido de transformación de estos últimos 15 años, como bien decías vos Walter. Hay estudios internacionales que hablan de que hay 75% de adolescentes entre 13 y 17 años que usan las redes sociales para informarse, principalmente a través de canal Youtube, Twitter, Instagram. Quizás corrieron un poco sus prácticas de donde informarse quizás esto es verdad que son en los centros urbanos y tendríamos que evaluar que pasa afuera de los centros urbanos pero ¿cómo se puede trabajar o cómo pensás que se debería trabajar junto a estos adolescentes, jóvenes y la familia también para más allá de tener un uso instrumental de estas tecnologías y estas posibilidades que hoy tenés al acceso para hacer un uso crítico? Me parece que esto también es un punto importante también de esta famosa brecha digital que siempre hablamos en cuanto a la conectividad el tema del uso crítico de la tecnología. No sé qué opinión tenés o cómo podríamos trabajar desde ese lugar.

Walter: Es una muy buena pregunta. A ver, yo escribí un libro que se llama Big Data entonces mi impresión es que mucha gente tiende a futbolizar las discusiones y espera que yo habiendo escrito y yo trabajo en estadística, trabajo en métodos y la respuesta que yo tiendo a dar cuando me hacen esta pregunta un poco sorprende, pero tenés que trabajar con el complemento de la técnica, no con la técnica. ¿Qué quiero decir con esto?  Mucha gente me hace está pregunta esperando que yo diga no, tenemos que trabajar más en robótica, tenemos que trabajar en Machine Learning.

Moderadora: Que hagas un plan, básicamente. (Risas)

Walter: Es cierto, que me parece que hace falta una formación más algorítmica, más probabilística, pero por más que suene a hippie de década del 70 hace falta una educación humanística. Insisto esta no es la primera vez, volvemos a lo que decíamos antes, esta no es la primera vez que la tecnología nos enfrenta a nuestros valores morales. Insisto, después la historia de la tecnología en particular, de lo que pasó con la revolución industrial. Una cosa que decía Julián es que todavía no sabemos bien a qué nos enfrenta esto. No sabemos hasta qué punto ciertas cosas son predecibles o impredecibles. Entonces, el problema de pensar que significa hacer un uso responsable de la tecnología, que significa saber qué cosas caen dentro de nuestro ámbito personal, y qué cosas van a caer dentro de un ámbito institucional, léase quien nos va a proteger de esto, quién va a velar por estas cosas, es un problema tan viejo como las sociedades. Insisto, la existencia del estado del derecho tiene que ver con bueno mirá, estas cosas exceden nuestras actividades personales y preferimos confiar en una institución como el Estado, como las leyes, como el sistema educativo, para que nos protejan o para que nos informen acerca de esto es bueno o esto es malo. Misteriosamente, yo ok, la gente espera que diga no hay que meter robótica en clase, pero ayer bromeamos por Twitter por una nota que yo di en un diario en Uruguay, decía mirá, puesto a elegir las disciplinas del futuro voy por el derecho, la moral y la ética ¿bien? o sea, voy por las disciplinas que nos han servido durante miles de años para decidir esto es bueno o esto es malo. Te pongo ejemplos, insisto, en algún momento cuando empieza la revolución genética, que está detrás de muchísimos avances en medicina, la primer tensión que hubo es bueno, pero vamos a generar clones, hay que pararlo esto, esto no tiene límite, y no eliminamos la genética, sino que lo que hicimos volver inteligentemente creando protocolos, creando regulaciones. Misma cosa con los remedios, misma cosa con los rayos X. En definitiva, cuando nos enfrentamos a que la tecnología nos interpela, lo que hicimos no es adoptar una visión más tecnológica, no salimos a aprender cómo funcionan los rayos X ni cómo funciona la genética, o sea, lo hemos hecho pero también nos hemos puesto a mirar el derecho, nos hemos puesto a mirar la moral, o nos hemos puesto a mirar la historia. Entonces yo, de vuelta, insisto soy un poquito recurrente me parece que hay que reforzarlo todo. Un chico de 15 años yo lo pondría a hacer cosas de robótica, de tecnología pero también lo haría pensar en Platón, en Sócrates. Lo haría pensar en problemas que esa gente ya pensó entonces ¿Por qué tenemos que pensarlo de vuelta? o sea ¿Por qué tenemos que volver a pensar cosas que ya pensamos? Entonces yo creo que, si es a los efectos de ganar plata no sé si un curso de derecho de dos meses te va a permitir ganar dinero, pero como formación humana me parece que estudiar derecho, estudiar moral, estudiar historia "herramientas" tan valiosas como estudiar robótica o informática, estoy convencido de eso. 

Moderadora: Hablabas también, tuve la oportunidad de leer la entrevista, sobre el tema, justamente de la velocidad en que ocurren los procesos actuales al margen de todas estas complejidades, quizás ahí también..., lo complejo y lo veloz que son todos los procesos y estas cuestiones que tienen que ver con la historia, la ética y los marcos regulatorios que a veces no tienen..., van como corriendo un poquito de atrás en relación a las complejidades que hay que enfrentar. Ahí vos decías que quizás haya que hacer reglas en más corto plazo y que se vayan actualizando a medida que los procesos vayan ocurriendo. Si quisieras explayar un poquito más esa idea, me pareció interesante traerla.

Walter: Sí, es el gran problema que tiene el derecho decir yo soy un experto en eso, pero fijate que el problema que tiene el derecho justamente es que regular es costoso. Requiere armar un acuerdo, requiere entender por qué uno quiere regular y cómo regular. Es un proceso que la gente que hace, los juristas entienden muy bien y eso explica en parte por qué va por detrás, porque uno no quiere ni regular para después desregular, ni tampoco regular para tener que cambiar la regulación porque ha cambiado la tecnología. Entonces, el derecho la tiene muy complicada, muy complicada (repite) porque la necesidad de regular existe, existe por cuestiones de privacidad, de ética, pero el problema es cómo regular una tecnología que está cambiando. En definitiva no es un problema para nada simple, insisto, es super complejo pero de ahí no se deduce que no hay que regular, lo que se deduce es que hay que buscar una forma inteligente de regular. Eso implica..., no podés regular una tecnología si no la conocés ¿bien? Pero tampoco la regulación surge de la tecnología. Para regular sobre genética tenés que entender de genética, para regular sobre telecomunicaciones tenés que entender sobre la parte dura de las telecomunicaciones pero también tenés que entender cómo funciona aquello que estas regulando que no tiene nada que ver con la cuestión tecnológica. En definitiva se ha vuelto muy sofisticado intentar regular cosas que están intervenidas por una tecnología que va cambiando, es un gran problema ese.

Moderador: Y además de entender a la tecnología hay que entender cuál es el impacto en el ciudadano, en las personas y tal vez pensar también si la regulación es la única solución o hay que pensar en otras cosas. La regulación es fundamental pero también a veces, autorregulación u otros mecanismos también son interesantes especialmente para no generar trabas a la innovación, devuelta no es que la per se alcanza y entonces no hay que hacer nada, hay que regular, hay que cuidar al ciudadano, hay que pensarlo pero inclusive tal vez, buscando modelos más participativos, ¿no?

Walter: Sí, fijate una cosa que decís que es super importante que es la autorregulación. La autorregulación, cuando es deseable, es algo que pasa por el sistema educativo. Insisto, en parte, no sé, exponer a alguien gratuitamente en las redes sociales tiene, o sea, los costos de hacer eso, en parte son costos morales. Pasa en parte por entender qué estoy ganando, qué estoy perdiendo por violar ese tipo de normas sociales. Y las normas sociales son complejas de entender, son las más complejas de entender, y para eso está el sistema educativo, insisto de vuelta con la pregunta ¿qué hacíamos antes, no? Todo esto requiere fortalecer el sistema educativo, pero no desde un punto de vista tecnológico si no, de los dos puntos de vista. Porque, insisto cuanto la gente más sea capaz de autorregularse quizás se hace más irrelevante, como decías recién, la necesidad de crear instituciones o reglas ¿no?. Insisto, más bien que si vos quisieses..., si no te gustan los accidentes aéreos lo más trivial es prohibir los aviones. Si no te gusta el costado negativo de los algoritmos lo más trivial es prohibir los algoritmos. Pero volvemos a lo que decíamos antes, hay enormes ventajas de viajar en avión, hay enormes ventajas de usar los algoritmos, entonces yo creo que..., me parece que se trata de encontrar un punto intermedio que son los puntos más difíciles de todos. O sea, yo no querría que se prohíban los aviones pero no querría que esté liberado por completo el hecho de volar, de ejercer la medicina o si vamos al caso de interactuar con las redes sociales. En definitiva es un problema tremendamente sofisticado que lo que, como decía Julián recientemente,  no es un problema que hay que pasárselo a otro vos regulame y yo te digo si la regulación me gusta o no o sea, en parte debería salir de la esencia de las personas no subirse a aviones que son peligrosos, no involucrarse en prácticas sociales que puedan ser dañinas para la sociedad. Para eso se requiere un control y un autocontrol, por eso es que es un problema muy complejo. 

Moderadora: Bueno, para ir cerrando el tema esta super apasionante y da para seguir debatiendo por mucho más tiempo, y seguramente trae nuevos puntos que iremos discutiendo en otro momento. Si tuviéramos que pensar, los invito a los dos a reflexionar conmigo en ¿qué desafíos tenemos por delante? ¿Cuáles piensan que son los desafíos más cercanos? Estuvimos hablando esto de la complejidad de los problemas, el tema de la autorregulación, el involucramiento de la sociedad en estas discusiones. ¿Cuáles piensan que pueden ser los desafíos a corto y largo plazo que tenemos por delante en materia de Big Data?

Walter: Dos desafíos. A mí me parece que en parte uno de los principales desafíos es para el sistema educativo, como decíamos recién, porque el sistema educativo tiene esta doble tensión de que, por un lado, quiere preservar y por otro lado quiere revolucionar. La esencia de un sistema educativo es intentar pasar en el tiempo cosas que vos querés que pasen en el tiempo. Pero también tenés que tener un ojo abierto a la naturaleza revolucionaria de las cosas. Entonces en definitiva el sistema educativo tiene una especie de gen conservador, que se pelea con un gen revolucionario. Entonces, el problema con Big Data, o con esta tecnología, como todavía no vimos el fin de la historia, no sabemos cuánto tiene de moda y cuanto tiene de revolución. Entonces, en definitiva, lo que le pasa al sistema educativo ahora es que está metido entre, por un lado, yo querría ser sensible, atento a cosas que están pasando pero tampoco un sistema educativo le gusta subirse a un carro de moda que después tiene que abandonar. Entonces, el gran desafío que tiene el sistema educativo es de esta revolución de datos y tecnologías intentar ver hacia adelante que no es moda. O sea, que es realmente un cambio que vino para quedarse porque cualquier revolución científica, cualquier revolución tecnológica fue percibida como una revolución luego de que ocurrió, no durante. O sea, en definitiva la naturaleza revolucionaria de las cosas es algo que ocurre más bien tirando después que ocurren no antes, y el sistema educativo siempre va un poquito por detrás pero no por lento, si no por cauto. Entonces, en definitiva el enorme desafío que tiene la tecnología como Big Data o como Machine Learning, Inteligencia Artificial es sacar la parte que está de moda y quedarse con la parte que tiene chance de ser una revolución. Si yo tuviese que resumirte un desafío es ese. No es un desafío del sistema educativo per se, es un desafío del sistema educativo de las personas. Insisto, yo sistema educativo le preguntaría a los científicos, a la gente que trabaja en esto, y todavía no estamos de acuerdo. Insisto, una característica que tiene cualquier revolución tecnológica es que la gente tiende a agrietarse. Lo que me pasa a mi cuando hablo de Big Data es que la gente tiende a percibir esto es una revolución, se acabó la ciencia, ahora hay que hacer datos porque los datos tienen la respuesta a todo. Y después esta la gente que dice mira que es otro parripollo, es otra cerveza artesanal, es una cancha de paddle. Esta no es la primera vez que aparece una tontera que tiene un nombre simpático y que dentro de 5 años nos vamos a matar de risa como ahora decir sigma de la búsqueda de la excelencia. La gente tiende a no ver las cosas en el medio. Justamente el gran desafío del sistema educativo es no "futbolizar" las discusiones. Big Data tiene una parte que es un componente realmente revolucionario como lo tuvo la genética en su momento, como lo tuvo la astro física, la evolución, pero también tiene un enorme componente de parripollo, de algo que "está de moda" y no puede ser cierto que vos te llenes de plata haciendo un cursito de Big Data en 4 meses, porque las cosas gratis...

Moderadora: Es más complejo.

Walter: ...no existieron ni van a existir. Pero en definitiva el sistema educativo tiene que decir cuánto tiene de innovación y cuánto tiene de moda pasajera y tomar esa decisión mientras el fenómeno ocurre es un enorme desafío. 

Moderador: De alguna forma las modas se construyen y hay que entender en realidad los diferentes procesos tecnológicos como innovadores y como procesos también que van evolucionando y se van integrando. Tal vez la gran apuesta es que el conjunto de la sociedad esté integrado también en todos estos procesos que todo el desarrollo científico no esté aislado y se crea como algo que está lejos del ciudadano que está integrado, que haya inclusión, etc. Creo que es un..., es la gran apuesta. 

Walter: Sí. A ver, no puedo estar más de acuerdo en que necesitás un sistema político empresarial científico de largo plazo al que vos puedas escuchar sinceramente qué es lo que opina. Insisto, a mi juicio, la razón de la existencia de un sistema científico sólido tiene que ver con eso. Una característica de un científico es que la ciencia por construcción es un fenómeno de mediano plazo a largo plazo. Justamente es la comunidad científica la que te va permitir tener una visión un poquitito menos cortoplacista de las cosas y que puede interactuar con el sistema educativo, como decía Julián es muy importante que existan formas honestas de hablar. O sea, lo primero que ocurre es que uno habla en términos futbolísticos de "Boca - River" pero la ciencia no es de "Boca - River". En la ciencia no hay visiones extremas. Lo interesante de la ciencia son todos los grises intermedios que están entre el blanco puro y el negro puro y eso es muy difícil porque a la gente la pone muy nerviosa hablar de gris. Tiende a decir que sos un flojo, no te jugás pero los científicos, y perdón que me ponga el sombrero de científico, los científicos no tenemos posturas firmes con respecto a nada. En todo caso tenemos posturas de mentes que estamos dispuestos a cambiarlas por los razonamientos o los datos. Entonces, en definitiva, el ojo de un científico es el ojo de un fotógrafo que está entrenado no para ver "negro" o "blanco" si no para ver todas las gamas de en el medio. Lo primero que haces cuando te entrenas como fotógrafo es intentar ver lo que está en el medio no ver lo que está en las puntas, y la misma cosa te pasa con la ciencia. Me parece que el desafío tiene que ver con lo que decía Julián con que los distintos sectores sean capaces de hablar y de escucharse sobre todo. 

Moderadora: Bueno, ha sido un gusto tenerlos a los dos. Gracias Walter por sumarte a nuestro Podcast, gracias Julián por estar acá en este episodio de Voces en Red, nos estaremos encontrando la próxima en otro episodio de Voces en Red. 


 

Te invitamos a escuchar el tercer episodio de “Voces en red” un espacio donde se reúnen referentes del ecosistema de Internet para conversar sobre temas de actualidad sobre la temática.

En este episodio, dialogamos con Walter Sosa Escudero, especialista en econometría y estadística aplicada a cuestiones sociales. Conversamos sobre el volumen de datos espontáneos que generamos constantemente y de manera pasiva, debatimos acerca de la necesidad de que los procesos se den de manera interdisciplinaria, analizamos la complejidad de realizar marcos regulatorios en relación a los datos y planteamos los desafíos que tiene por delante la educación y la Big Data en general.

Podés escuchar este episodio y los restantes de la colección en nuestro canal de Spotify o en tu plataforma de podcast preferida