TĂŽt ou tard, l'analyste est confrontĂ© au problĂšme de l'organisation des donnĂ©es. Il y en a de plus en plus, la structure n'est plus transparente et les mĂȘmes requĂȘtes SQL doivent ĂȘtre réécrites plusieurs fois. Pour rĂ©soudre ce problĂšme, vous pouvez utiliser dbt - un outil qui ouvre une nouvelle approche de la transformation et de la modĂ©lisation des donnĂ©es. Sous la coupe se trouve une traduction de l'excellent article de David Crewitt sur ce qu'est la dbt et comment elle aide les analystes Ă faciliter leur travail.
dbt (data build tool) est un framework open source pour exĂ©cuter, tester et documenter des requĂȘtes SQL qui apporte un Ă©lĂ©ment d'ingĂ©nierie logicielle au processus d'analyse de donnĂ©es.
C'est un excellent élément de la boßte à outils paresseux pour vous aider à ne jamais vous répéter lors de l'analyse des données.
Remplacement d'une requĂȘte enregistrĂ©e
Chaque requĂȘte SQL mĂ©rite un bon accueil. Dans dbt, les requĂȘtes SQL sont structurĂ©es et organisĂ©es dans des dossiers de projet, de sorte que tous les membres de l'Ă©quipe savent toujours oĂč les trouver:

Chaque fois que vous devez exĂ©cuter des requĂȘtes, vous utilisez la commande dbt run.
Cette commande prend une collection de modÚles SQL dans le projet dbt et les met à jour dans la banque de données.

Simple mais efficace.
Cela signifie que vous n'avez plus besoin d'enregistrer des fragments de requĂȘtes SQL sur votre bureau ou ailleurs, comme un coffre au trĂ©sor.
â . - , .
dbt â , .
ref(â â)
dbt * * SQL-, {{ ref(âmodel nameâ) }}.
:

, . dbt , , :

/admin
/base
/join /
/math (, ) ( . .)
/visualization + , .
, .
« Google Analytics?»
base -> google-analytics.
« ?»
Math -> cohort-analysis.
SQL-. dbt â Monster Queriesâą, .
SQL
dbt SQL- : + JINJA.
SQL- .
, CASE 15 :
CASE WHEN x = y THEN z
WHEN 2x = 2y THEN 2z
--⊠.
â , :

dbt SQL .
dbt dbt_utils, .
, CIFL :
union_relations
get_column_values
JINJA
, : FOR, IF-THEN . .
dbt SQL-, JINJA.
, SQL- , .
, Google Analytics :
1 â2 â9.
2 â4 â11.
, « » .
dbt :

dbt , JINJA:

, , , , . «» .
dbt + Git
dbt + Git . «Pull Requests» «Issues». SQL- Slack/Notion/email.

:
SQL- , . â .
, . , .
SQL , .
SQL-
« ?» â .
dbt .
Fishtown Analytics (, dbt) dbt Cloud, hosted dbt .

dbt Cloud , .
, â $50 .
«»
« ?»
« ?»
â . :
, .
, , , , 100% , , .
, â , , , .
, : , Google BigQuery Google Data Studio.
dbt :
`dbt docs` , SQL .
dbt + .yml .
BigQuery:

Data Studio:

(Snowflake . .) (Looker . .) . , .
?
, , . , , .
dbt .

, - , dbt . JOIN , dbt .
, SQL- , dbt .
â BigQuery, Snowflake PostgreSQL â , SQL. BigQuery Snowflake Redshift BigQuery, SQL, .
dbt ! . dbt . dbt , ( , , MS SQL).
CIFL , , , .
dbt
Si vous ĂȘtes prĂȘt Ă vous attaquer Ă la mise en Ćuvre de la dbt dans votre Ă©quipe, les Ă©lĂ©ments suivants peuvent vous aider:
Cours gratuit " Premiers pas avec BigQuery SQL ", qui comprend une introduction à la modélisation de données avec dbt.
Le cours Build Your Data Agency récemment lancé pour une plongée plus approfondie dans l'analyse de données basée sur la dbt.