Curaduría open-source · Python-first · en español

El catálogo

Nº11 · Procesamiento

dbt

Transforma datos en tu warehouse con SQL, como si fuera código de software.

Librería / frameworkIntroData Engineersql

¿Qué es?

dbt (data build tool) es la T de ELT: toma datos que ya están en tu warehouse y los transforma en modelos listos para analizar. Cada modelo es un archivo .sql versionado en git, con tests declarativos (unicidad, no nulos, relaciones) y documentación generada automáticamente. El resultado: un grafo de linaje (DAG) que muestra cómo fluye cada columna desde la fuente hasta el reporte.

¿Para qué sirve?

  • Organizar y versionar transformaciones SQL con la misma disciplina que código de software: revisiones en PR, historial, rollback.
  • Detectar problemas de calidad de datos con tests que corren en cada build antes de que el analista vea el dato.
  • Generar documentación y linaje automáticos: quién consume qué tabla y de dónde viene cada campo.

¿Cuándo usarla / cuándo no?

Úsala cuando el dato ya está en el warehouse (BigQuery, Snowflake, DuckDB, Redshift, Trino…) y quieres transformarlo con disciplina de ingeniería: modelos reutilizables en capas (staging → intermediate → mart), tests automáticos y linaje trazable.

Piénsalo dos veces si lo que necesitas es ingestión (mover datos desde fuentes externas al warehouse — eso es trabajo de Fivetran, Airbyte o un pipeline de Airflow) o procesamiento distribuido pesado fuera del warehouse (Spark, Flink). dbt solo actúa dentro del engine SQL del warehouse; no reemplaza un orquestador ni un motor de cómputo externo.

Empieza en 1 minuto

pip install dbt-core dbt-duckdb   # cambia el adapter según tu warehouse
dbt init mi_proyecto
cd mi_proyecto

Crea tu primer modelo en models/staging/stg_pedidos.sql:

-- models/staging/stg_pedidos.sql
select
    id_pedido,
    cliente_id,
    monto,
    fecha_pedido::date as fecha
from {{ source('raw', 'pedidos') }}
where monto > 0

Ejecuta:

dbt run          # compila y materializa los modelos en el warehouse
dbt test         # corre los tests de calidad de datos
dbt docs serve   # abre el catálogo con linaje en el navegador

Trivia rápida — pon a prueba lo que acabas de leer.

¿Qué tanto sabes de dbt?

Documentación oficial

La fuente de verdad vive ahí. Acá orientamos; la profundidad la pones tú.

Abrir documentación oficial

Qué aprender después

Ver también

Nº11 · Actualizado 2026-06-08