O trabalho de um cientista de dados é procurar soluções para os problemas do negócio utilizando como matéria prima, fatos e dados.
Cada etapa desse processo para geração de conhecimento, é de responsabilidade de um profissional do mundo da Ciência de Dados e podemos categoriza-los da seguinte forma:
· O Engenheiro de Dados é responsável por toda a coleta e armazenamento dos dados sejam eles estruturados ou não-estruturados. É muito comum que esse profissional utilize técnicas como web crawler e web scarpin para identificar e usar dados da Web, consulte APIs de redes sociais para coleta de dados além de utilizar ferramentas de Big Data como Hadoop e Spark e bancos de dados SQL;
· O Cientista de Dados é o responsável por transformar a informação em conhecimento. Para isso ele utiliza técnicas de Visualização de Dados, estatística e matemática, sempre com o objetivo de gerar insights e respostas adequadas aos problemas da organização;
· O Doutor dos Dados é o responsável por criar modelos de aprendizagem de máquina a fim de identificar padrões nos dados corporativos para guiar toda a empresa pelos dados, modelando softwares orientados por robôs, criando previsões e tendências auto ajustáveis e procurando padrões que revelem a melhor tomada de decisão frente à incerteza do mercado.
Portanto, quando encadeamos essas profissões utilizando as relações de interdependências existentes entre elas, temos a seguinte pirâmide:
Em qual grau de maturidade para tomada de decisão guiada pelos dados a sua companhia está?