Curaduría open-source · Python-first · en español

El catálogo

Nº20 · Análisis

NumPy

El cimiento numérico de Python: arrays rápidos y vectorizados.

Librería / frameworkIntroData Scientist·Data Engineerpython

¿Qué es?

NumPy introduce el ndarray (array N-dimensional), una estructura de datos homogénea y contigua en memoria que permite operar sobre millones de valores numéricos sin bucles Python explícitos. Es la base sobre la que se construye prácticamente todo el stack científico de Python: pandas, scikit-learn, SciPy, matplotlib y TensorFlow dependen de ella en su núcleo.

¿Para qué sirve?

  • Cálculo vectorizado: aplica operaciones aritméticas, lógicas y de agregación sobre arrays completos en una sola expresión, sin for loops — órdenes de magnitud más rápido que listas nativas.
  • Álgebra lineal y estadística: multiplicación de matrices, descomposición SVD, percentiles, medias, correlaciones — todo disponible en numpy.linalg y numpy.random.
  • Base del ecosistema: actúa como protocolo de intercambio de datos entre librerías (__array__ protocol); entender sus tipos (dtype) y formas (shape) es imprescindible para depurar problemas en pandas o scikit-learn.

¿Cuándo usarla / cuándo no?

Úsala cuando trabajes con datos numéricos homogéneos: señales, imágenes, matrices de pesos, resultados de simulaciones. Si necesitas operar a bajo nivel sobre números puros, NumPy es la herramienta correcta.

Piénsalo dos veces cuando tus datos sean tabulares con columnas nombradas de tipos mixtos: en ese caso pandas o Polars te dan una capa más expresiva encima de NumPy sin sacrificar velocidad. Tampoco sustituye a herramientas de procesamiento distribuido (Spark, Dask) cuando los datos no caben en memoria.

Empieza en 1 minuto

pip install numpy
import numpy as np

# Crear un array y operar de forma vectorizada
datos = np.array([1.0, 2.0, 3.0, 4.0, 5.0])

cuadrados = datos ** 2          # [1., 4., 9., 16., 25.]
media = datos.mean()            # 3.0
normalizado = (datos - media) / datos.std()

print(cuadrados)
print(normalizado)

Sin un solo for loop, cada operación actúa sobre el array completo. Consulta la documentación oficial para broadcasting, indexado avanzado y la referencia completa de la API.

Trivia rápida — pon a prueba lo que acabas de leer.

¿Qué tanto sabes de NumPy?

Documentación oficial

La fuente de verdad vive ahí. Acá orientamos; la profundidad la pones tú.

Abrir documentación oficial

Qué aprender después

Ver también

Nº20 · Actualizado 2026-06-08