El Manual para convertirte en Data Scientist: Con Jorge Perez, Sr. Data Scientist @ ROI DNA

por | Abr 16, 2019 | Podcast Episodes, Uncategorized | 0 Comentarios

Jorge Perez es un Ingeniero de Telecomunicaciones que tras pasar mas de 15 años trabajando en compañias como Siemens y Cisco decidio reinventarse y comenzar una nueva carrera como Data Scientist.

Esta es la historia de Jorge. Desde como evaluo su cambio de carrera, como escogio el Bootcamp de Galvanize para Data Scientists y las 10 maximas que lo ayudaron a empezar una nueva carrera.

Actualmente Jorge es Sr. Data Scientist en ROI DNA en Downtown San Francisco.

Notas del Show

Acabo de lanzar @LatinosWhoTech. La version en Ingles de Conexiones. Esta en iTunes, Spotify y Stitcher

Disculpas por la calidad del audio del episodio #31, hubo problemas con la via telefonica. Procurare arreglarlo para proximos episodios a distancia

Si tienes algun comentario para el podcast o quieres saludar puedes mandarme un correo a conexionespodcast@gmail.com

Los Puntos Clave del #32 :

27:06 – “El punto del data science es tomar decisiones de negocio basadas en el analisis de los datos. Si los datos no son accionables, estamos perdiendo el tiempo”

41:30 – “Los soft skills son importantisimos. Puedes tener el dashboard mas bonito del mundo, pero si no sabes como comunicar los resultados al CEO de la compañia, no te sirve de nada el analisis”.

44:48 – “Como data scientist, es clave saber manejar las expectativas de tus clientes. Es igual que una relacion, tienes que hacer lo que prometiste siempre.”

Partes del Episodio

Cold Open:

2:00 – 12:06 – El problema de La “Tutorialitis” y como superarlo. Como dejar de hacer muchos tutoriales sin profundizar en Data Science

15:06 – 20:02 – De Colombia a Silicon Valley

23:03 – 27:20 – La vida de mas de 10 años dentro de Cisco

27:20 – 30:38 – porque dejo una exitoso en Cisco para hacer un bootcamp de Data Science en Galvanize

30:38 – 31:48 – La definicion de Data Science: La Ciencia y Arte de combinar datos de diferentes fuentes, procesarlos e inferir soluciones que agreguen valor a alguien

41:45 – 46:04 – Los 3 tipos de Data Scientists , El Ingeniero de Datos (Data Engineer) que construye la conexion entre los datos y el motor de analysis, El Ingeniero de Machine Learning (Creadores de modelos), El Analista de Negocios que traduce los resultados de la data con los que toman los negocios

51:24 – La experiencia de hacer un Bootcamp de Data Science (Galvanize)

56:00 – 90:24 Las 10 Maximas del Data Scientist en detalle. Los principios que ayudaron a Jorge a estudiar data science y ser un profesional exitoso


Las 10 Maximas del Data Scientist

Aprendiendo Data Science:

1) Antes de embarcarte en el viaje de ser Data Science, tienes que AMAR, COMER y RESPIRAR datos. La pasion por estos es clave


2) No hace falta una Maestria o un PhD, si tienes el tiempo y la energia, hazlos pero hay otras avenidas para aprender


3) No trates de aprender TODO al mismo tiempo. No existe un “Body of Knowledge” de Data Science. Es un campo vastisimo con conectividad, programacion, visualizacion machine learning y un sin numero de disciplinas internas.


4) LA MAS IMPORTANTE: Ten cuidado de la “tutorialitis”. Esa mania de tomar cursos de diferentes fuentes sin profundizar en uno solo. Hay varias (puede decirse demasiadas) fuentes como Coursera, Udemy, Udacity, Kaggle. Escoge UN solo topico para estudiar con UNA SOLA fuente y practica este topico usando datos de la vida real.



5) Al convertirte en Data Scientist debes aceptar ser un estudiante de por vida de la disciplina. Tienes que aprender por el resto de tu carrera profesional de manera independiente. Lo que era relevante el año pasado, no lo sera este. Por ejemplo: Jupyter Notebook vs. Jupyter Lab

El Trabajo como Data Scientist

6) Escoge un Camino para Ti

-Data Engineer, Pipelines (Hadoop, Spark, DB)

-Machine Learning Engineer: Constructor de modelos, ML Scripting, Productos de Datos)

-Analista de Negocios: El puente entre ejecutivos y los otros data scientists, BI Tools, Vis Tools, SQL, Tableau

7) 80% De tu tiempo va a ser transformando, analizando y limpiando Datos. Para entender tus datos tienes que empaparte de estos

8) El Patrocinio Ejecutivo es un arma de doble filo:

Si, es ABSOLUMATEMENTE VITAL para que tus proyectos sean exitosos. Pero tambien es VITAL que como Data Scientists comuniques las expectativas a los ejecutivos. Un dashboard que toma 2 semanas en crear no puede ser hecho en 1 hora.

9) La data tiene que ser ACCIONABLE

  • Hacer un tablero de datos (dashboard) por que si, es una perdida de tiempo
  • Si no sacas data accionable de tu analisis = El proyecto fallo

10) Ten cuidado con el “Martillo Nuevo”. Aplicar una nueva herramienta en un proyecto significa TIEMPO y por ende DINERO. Muchos de los problemas de negocios que vas a ver no necesitan consolidad millones de fuentes de datos, un machine learning sofisticado o siquiera usar “deep learning”. No todas las compañias son Amazon, Facebook o Google.

BONUS: Singularity

88:00 – La vision de Jorge Perez sobre el Singularity y sobre “las maquinas que nos van a reemplazar”

[mc4wp_form id=»976″]

0 comentarios

Enviar un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Conexiones: Historias de Latinos en STEM

Un podcast hecho para todas las personas que quieran aprender mas sobre carreras en tecnología y ciencias (STEM).

Conversamos de manera informal con profesionales de startups y compañías de tecnología sobre sus historias y día a día. Desde NASA hasta Google.

Episodios nuevos cada 2 semanas.

Síguenos en IG @ConexionesPodcast