O trabalho de um cientista de dados é procurar soluções para os problemas do negócio utilizando como matéria prima, fatos e dados.

Cada etapa desse processo para geração de conhecimento, é de responsabilidade de um profissional do mundo da Ciência de Dados e podemos categoriza-los da seguinte forma:

· O Engenheiro de Dados é responsável por toda a coleta e armazenamento dos dados sejam eles estruturados ou não-estruturados. É muito comum que esse profissional utilize técnicas como web crawler e web scarpin para identificar e usar dados da Web, consulte APIs de redes sociais para coleta de dados além de utilizar ferramentas de Big Data como Hadoop e Spark e bancos de dados SQL;

· O Cientista de Dados é o responsável por transformar a informação em conhecimento. Para isso ele utiliza técnicas de Visualização de Dados, estatística e matemática, sempre com o objetivo de gerar insights e respostas adequadas aos problemas da organização;

· O Doutor dos Dados é o responsável por criar modelos de aprendizagem de máquina a fim de identificar padrões nos dados corporativos para guiar toda a empresa pelos dados, modelando softwares orientados por robôs, criando previsões e tendências auto ajustáveis e procurando padrões que revelem a melhor tomada de decisão frente à incerteza do mercado.

Portanto, quando encadeamos essas profissões utilizando as relações de interdependências existentes entre elas, temos a seguinte pirâmide:

 

Em qual grau de maturidade para tomada de decisão guiada pelos dados a sua companhia está?