Maria del Pilar Villamil, profesora ingeniería de sistemas y computacion, uniandes

LÍDER DEL PROYECTO

María del Pilar Villamil | Profesora Asociada del Departamento de Ingeniería de Sistemas y Computación, Universidad de los Andes. |  Ph.D. en Sistemas y Software del Instituto Politécnico Nacional de Grenoble | mavillam@uniandes.edu.co

Las transformaciones tecnológicas, la globalización de las audiencias y la democratización de los contenidos han mostrado la importancia de la ciencia de datos para tomar decisiones en la sociedad actual. La labor de los científicos de datos es fundamental en las organizaciones, pero su escasez impone un gran desafío.

Diciembre de 2021
Una manera fácil de entender qué es la ciencia de datos es pensarla como una carrera de automovilismo de Fórmula Uno. Un piloto corre en su monoplaza en un circuito establecido, mientras su equipo de ingenieros hace seguimiento, tanto a nivel visual como utilizando los datos generados por el acelerador y el pedal del freno para determinar cuándo y cuánto acelera; cuándo frena; cómo toma una curva; qué velocidad alcanza en las rectas; cómo rebasa a sus rivales; cuánto tarda en dar una vuelta. A partir de esa información que recibe, el grupo de ingenieros toma decisiones sobre cuándo el piloto debe entrar a pits; cuándo cambiar los neumáticos; cuándo reabastecer combustible o hacer ajustes mecánicos.

Pero no solo el equipo de ingenieros puede tomar decisiones con base en los datos que recibe del desempeño del auto en la carrera. El mismo piloto, en medio de la competencia –con base en los datos que le entrega su vehículo– también puede hacerlo. En otras palabras, los datos que reciben unos afuera de la pista y otro dentro de ella les permiten decidir de manera rápida, certera y efectiva. De la misma manera funciona la ciencia de datos en los distintos espacios de la vida actual.

Utilidad de los datos en el mundo contemporáneo

De acuerdo con María del Pilar Villamil, Profesora Asociada del Departamento de Ingeniería de Sistemas y Computación de la Universidad de los Andes y coordinadora del Programa Especializado en Ciencia de Datos, que ofrece la institución a través de Coursera, hoy el mundo tiene a su disposición 70 zettabytes de datos, y para 2025 se estima que esa cifra llegará a los 175 zettabytes, razón por la cual la utilidad y el conocimiento de esos datos se hace aún más relevantes en un presente caracterizado por las continuas y rápidas transformaciones tecnológicas, el avance digital, la competencia con nuevos actores en los distintos escenarios de la sociedad, la globalización de las audiencias y la rápida democratización de los contenidos.

“La ciencia de datos se hace entonces muy importante porque aporta para la comprensión de la vida en general. Y comprender la vida implica entender para tomar una serie de decisiones que se hace más difícil en un contexto de alta competitividad y de incertidumbre donde la intuición de los expertos no es suficiente, es necesario acompañarla de nuevos mecanismos para observar y analizar lo que está pasando cada minuto, casi en tiempo real, en un mundo cambiante donde no solo las decisiones estratégicas, sino también las operativas, requieren de este apoyo”, añade la profesora.

“Tomar decisiones es más difícil en un contexto de alta competitividad y de incertidumbre, donde la intuición de los expertos no es suficiente” María del Pilar Villamil, Profesora Asociada de Ingeniería de Sistemas y Computación

¿Qué hace un científico de datos?

De sacar el mayor provecho de los datos se encarga el científico de datos, quien, con base, precisamente, en el método científico, observa y recolecta datos, plantea experimentos e hipótesis a partir de las cuales saca conclusiones. En otras palabras, cuenta una historia a través de los datos, extrae una serie de patrones y desde allí entrega información para que se tomen decisiones que sean útiles para la sociedad en general.

La ciencia de datos usa técnicas que vienen del mundo de la estadística, de la ingeniería de información y del aprendizaje de máquina.

“El uso de estas técnicas permite entender mejor qué ocurrió, qué está ocurriendo, que va a ocurrir y qué quisiéramos que ocurriera, todo esto con el fin de proveer elementos que ayuden a tomar mejores decisiones, con argumentos y justificaciones soportadas en los datos con los que se ha trabajado. Llevar a cabo estas tareas requiere el uso de distintas herramientas para trabajar con los datos y de esta forma poderlos conocer, visualizar, explorar, organizar y aportar en el contexto de una organización. Unas de esas herramientas están orientadas a la programación, como son los lenguajes de programación – R o Phyton–, otras son ambientes para trabajar como científicos de datos –como Anaconda– desarrollados para poder manipular los datos y aportar en las necesidades de las organizaciones”, explica Villamil.

Hoy la ciencia de datos tiene dos grandes retos. El primero de ellos es la calidad de los datos, toda vez que son imperfectos, así como lo son sus procesos de captura, por lo que a la hora de tomar las decisiones con base en ellos la revisión de su calidad y confiabilidad es fundamental.

El otro desafío es cómo masificar el uso de la ciencia de datos en diferentes contextos; cómo lograr que esos datos estén más al alcance de los creadores, de los innovadores y de los tomadores de decisiones y, en consecuencia, contar con el talento humano suficiente que sepa trabajar con ellos. Existe una gran escasez de científicos de datos tanto en el sector público como en el sector privado. En el contexto mundial se estima que los puestos de trabajo actuales en este campo triplican la mano de obra disponible para ocupar esas vacantes.

Programa Especializado en Ciencia de Datos

 

 

Como respuesta a estos retos, nace el Programa Especializado en Ciencia de Datos que tiene como objetivo principal contribuir a la formación de científicos de datos, ofreciendo conocimientos sobre modelos descriptivos basados en estadística; modelos predictivos basados en aprendizaje de máquina y técnicas para integrar, explorar y preparar datos.

“Así, la apuesta de este programa especializado no solo es contribuir a la educación para la transformación digital, sino también potenciar la gestión de datos y cerrar la brecha de habilidades en ciencia de datos y las necesidades de las organizaciones para el manejo de los mismos, un primer paso en firme para desarrollar competencias que se requieren en esta área”, concluye la profesora.