IA y Machine Learning · 2026

CV Harvard para Ingenieros/as de Machine Learning

Los reclutadores buscan modelos en producción, no notebooks de Kaggle — entrega inferencia medible, no una lista de frameworks.

Empezar mi CVgratis · sin login
Harvard Resume··~5 min

¿Cómo se hace un CV de Ingenieros/as de Machine Learning en formato Harvard?

A los Ingenieros de Machine Learning los contratan equipos de plataforma de ML, áreas de ciencia aplicada y equipos de producto que escanean tu CV buscando primero una cosa: ¿tus modelos llegaron a producción y movieron una métrica? La distancia entre el notebook de un científico de datos y el modelo servido de un MLE es justo lo que filtran los reclutadores en empresas como Mercado Libre, NVIDIA o cualquier serie B con un recomendador — pipelines de entrenamiento, latencia de serving, lift validado con A/B testing y costo de inferencia. El formato Harvard de una página te obliga a pasar de un muro de logos de frameworks a resultados medidos en puntos de AUC, milisegundos en p99 y dólares por millón de inferencias.

Qué buscan los recruiters

  • Modelos efectivamente en producción con métricas online: lift validado con A/B testing (CTR, conversión, retención), mejora de AUC/F1/precision@k, correlación offline-online
  • Ingeniería de serving y latencia: latencia de inferencia p99, throughput (QPS), utilización de GPU, cuantización/distilación, ONNX/TensorRT/Triton, batching
  • Profundidad en MLOps, no solo modelado: pipelines de entrenamiento (Kubeflow, Airflow, SageMaker), feature stores (Feast, Tecton), model registry, CI/CD de modelos, monitoreo de drift
  • Especificidad de framework y escala: PyTorch/TensorFlow/JAX, entrenamiento distribuido (DDP, FSDP, DeepSpeed), volumen de datos (TB), cantidad de parámetros, costo de entrenamiento ($/run)
  • Ingeniería de costo de inferencia: ahorro en $ por millón de predicciones, horas de GPU ahorradas vía batching/caché/distilación, ahorros con Spot/Inferentia/cuantización
  • Credenciales que habilitan el rol: maestría/doctorado en CS/ML/Estadística, publicaciones top (NeurIPS/ICML/CVPR), o modelos en producción con tráfico real en lugar de pedigrí

Secciones requeridas, en este orden

Empieza por modelos en producción, no por un muro de frameworks

  • Pon una sección de Experiencia compacta justo después de Educación; abre cada bullet con el resultado en producción (lift online, latencia reducida, costo ahorrado), no con 'usé PyTorch'
  • Indica el modelo y la escala dentro del bullet: 'fine-tuneé un LLM de 7B parámetros sobre 40M de tickets de soporte' le muestra al revisor el radio de impacto real al instante
  • Limita un bloque agrupado de 'Habilidades Técnicas' al pie — Modelado / MLOps / Serving / Datos — para que el ATS haga match sin una sopa de 25 ítems
  • Saca las medallas de Kaggle y proyectos nivel tutorial salvo que sean top-50 o realmente novedosos; los reclutadores descuentan competencias que nunca vieron tráfico de producción

Que Educación, investigación y certificaciones jueguen al estilo Harvard

  • Educación primero, una línea cada una: título, institución, año — incluye tesis o especialización (NLP, visión, RL) solo si conecta con el rol objetivo
  • Lista publicaciones revisadas por pares con venue y año (NeurIPS, ICML, EMNLP); un paper de primer autor en un venue top pesa más que la mayoría de las certificaciones
  • Agrega certificaciones cloud/ML (AWS ML Specialty, GCP Professional ML Engineer, TensorFlow Developer) bajo Educación con emisor y año — útiles para ATS, secundarias al trabajo en producción
  • Si vienes de ciencia de datos o de desarrollo, lidera con el primer modelo que llevaste de punta a punta del entrenamiento al serving

Una página, limpio para ATS, denso en métricas

  • Sin foto, sin fecha de nacimiento, sin barras de habilidad ni gráficos de radar — un AUC de 0,87 es un número, no una barra de progreso
  • Una sola columna, fuentes estándar, sin tablas ni cuadros de texto — los parsers ATS destrozan los CV de ML a varias columnas y pierden tus métricas
  • Escribe el término y luego la sigla una vez: 'Generación Aumentada por Recuperación (RAG)' para que hagan match ambas variantes
  • Orden cronológico inverso, bullets con verbo de acción (Entrené, Desplegué, Cuanticé, Validé con A/B) — cada línea lleva un modelo, una métrica, o se elimina

Ejemplo en formato Harvard

CV Harvard Ingeniero/a ML · Plantilla 2026
Harvard format · 1 página

Bullets fuertes vs débiles

Antes

Construí un modelo de machine learning para mejorar las recomendaciones.

Después

Llevé a producción un modelo de recuperación two-tower en PyTorch en el recomendador de la home, subiendo el CTR un 11,4% y el add-to-cart un 6,2% en un A/B test de 4 semanas sobre 8M de usuarios semanales; servido a p99 28ms con un runtime Triton + ONNX.

Nombra la arquitectura (recuperación two-tower), la métrica online de un A/B test real (CTR +11,4%), la escala (8M de usuarios) y el stack de serving con latencia (Triton, p99 28ms). El revisor infiere ML de producción en segundos.

Antes

Trabajé en reducir el costo de la inferencia de modelos.

Después

Bajé el costo de inferencia un 62% (USD 310K/año) destilando un modelo de 1,3B parámetros a 350M, cuantizando a INT8 con TensorRT y agregando batching dinámico — manteniendo la precisión dentro de 0,4 F1 del modelo teacher mientras subía el throughput de 140 a 520 QPS por GPU.

Dólares y porcentaje, las palancas exactas (distilación, INT8, batching dinámico) y el control (precisión dentro de 0,4 F1). Esto es madurez en serving, no un 'trabajé en costo' difuso.

Antes

Armé un pipeline para entrenar modelos.

Después

Construí un pipeline de entrenamiento de punta a punta en Kubeflow con un feature store Feast y monitoreo de drift automatizado, bajando el reentrenamiento de un proceso manual de 3 días a una corrida automática de 4 horas y detectando una caída de 9 puntos de precisión antes de que llegara a producción.

Nombra el stack de MLOps (Kubeflow, Feast), la ganancia de velocidad (3 días → 4 horas) y el beneficio de confiabilidad (detectó una caída de 9 puntos de precisión). Se lee como dominio real de plataforma, no como un notebook.

Antes

Hice fine-tuning de un modelo de lenguaje grande para el equipo de soporte.

Después

Hice fine-tuning de un LLM de 7B parámetros con LoRA sobre 40M de tickets de soporte anonimizados y lo desplegué tras una capa RAG, desviando el 34% de los tickets de Nivel 1 y bajando el tiempo medio de gestión de 8,5min a 3,2min, manteniendo la tasa de alucinación bajo 2% vía recuperación con grounding.

Tamaño y método del modelo (7B, LoRA), escala de datos (40M de tickets), el resultado de negocio (34% de desvío, tiempo de gestión reducido) y un control de calidad (alucinación bajo 2%). Disciplina de LLM en producción en una línea.

Errores comunes específicos

  • Listar modelos que solo corriste en un notebook. Los reclutadores filtran por tráfico de producción — si un modelo nunca sirvió a un usuario real ni movió una métrica, es un proyecto, no un logro.
  • Reportar solo métricas offline. 'Subí el AUC a 0,91' es débil sin el resultado online; acompaña el lift offline con la métrica de negocio validada en A/B test (CTR, conversión, retención).
  • Listar frameworks en vez de resultados ('con experiencia en PyTorch, TensorFlow, scikit-learn'). Cada bullet necesita un número: lift de AUC/F1, latencia p99, QPS o $ de costo de inferencia reducido.
  • Ocultar la escala y el costo. 'Entrené un modelo' no dice nada; '7B parámetros, 40M de ejemplos, USD 4K/run en 8×A100' le muestra al revisor tu footprint real.
  • Irte a dos páginas con ramos, cada entrada de Kaggle y herramientas en plan 'familiarizado con'. La disciplina Harvard es una página — si un bullet no tiene modelo ni métrica, es relleno, elimínalo.

Tu CV empieza aquí. Decides después si pagas.

Empezar mi CV

Preguntas frecuentes

¿Cómo demuestro que soy Ingeniero de ML y no solo científico de datos?
Enfatiza lo que pasa después del notebook: modelos que desplegaste a producción, el stack de serving (Triton, TorchServe, endpoints de SageMaker), latencia y throughput a escala, pipelines de entrenamiento (Kubeflow, Airflow) y resultados online validados con A/B testing. El científico de datos analiza; el MLE despliega y sirve. Abre cada bullet con un resultado en producción, no con una métrica offline, y nombra la infraestructura que fuiste dueño.
¿Necesito un doctorado o publicaciones top para pasar el filtro?
No. Un doctorado y un paper de primer autor en NeurIPS/ICML ayudan para tracks de research scientist, pero para roles aplicados de MLE los modelos en producción con tráfico real y lift medible pesan más que el pedigrí. Si tienes publicaciones, lístalas con venue y año; si no, lidera con modelos de punta a punta que entrenaste, desplegaste y validaste con A/B testing. Muchos MLEs fuertes tienen maestría o vienen de desarrollo de software.
¿Debo listar certificaciones como AWS ML Specialty o GCP Professional ML Engineer?
Ayudan con los filtros de ATS y equipos con mucho AWS/GCP, pero son secundarias al trabajo en producción. Pon las certificaciones cloud/ML vigentes bajo Educación con emisor y año. Un modelo en producción con lift validado en A/B test supera a tres certificaciones — no dejes que una lista de certs desplace tus logros de serving y pipelines.
¿Cómo cuantifico el trabajo de ML si los resultados son probabilísticos o los experimentos fallan?
Usa las métricas por las que se juzga el campo: offline (AUC, F1, precision@k, RMSE), online (lift de CTR/conversión/retención validado en A/B test), de sistemas (latencia p99, QPS, utilización de GPU) y de costo ($ por millón de inferencias, horas de GPU ahorradas). Para experimentos que no llegaron a producción, enmarca el aprendizaje o el control — ej. 'construí un harness de evaluación que detectó una regresión de 9 puntos de precisión antes del release'. Los revisores premian el rigor y el impacto, no solo los aciertos.

Recursos relacionados