Diferenças entre um Cientista de dados e um Analista de dados

Jun 21 / Ref.: George Firican
Há um pouco de confusão sobre qual é a diferença entre um analista de dados e um cientista de dados.

Passei por mais de 100 descrições de cargos e devo ter lido mais de 50 artigos e white papers diferentes de fontes respeitáveis, incluindo universidades de primeira linha.

Eu achava que sabia qual era a diferença entre esses dois, mas deixe-me dizer o que ganhei pesquisando sobre o que os outros achavam que eram as diferenças.

Eu gostaria de prefaciar que não há um papel que seja melhor que o outro. O que eu gostaria que você tirasse deste artigo é como uma função ou outra faria mais sentido para as habilidades que você tem ou deseja adquirir e como você ficaria mais feliz em trabalhar. No final das contas, isso é o mais importante, não é?

Vamos abordar isso e abordar o ESCOPO, HABILIDADES, EDUCAÇÃO E EXPERIÊNCIA e EXPECTATIVAS DE SALÁRIO para um analista de dados e um cientista de dados e veremos qual é o certo para você.

O que aprendi com 100 descrições de cargos

Como mencionei, li mais de 100 descrições de cargos no LinkedIn.com, Indeed.com, Glassdoor.com e tudo o que pude encontrar no google. O que eu ganhei com isso? Confusão total!

Alguns estavam dizendo que o analista de dados lida com estruturas e sistemas de big data (nah, acho que não), ou que os cientistas de dados constroem pipelines de dados (não é esse o papel de um engenheiro de dados?), ou que os analistas de dados apenas limpar dados e criar relatórios (o quê?). Não há nada de errado com isso, precisamos de mais disso, mas não, não é exatamente isso que um analista de dados faz.

Alguns artigos e whitepapers tornaram as coisas ainda piores. Havia uma mistura total entre as responsabilidades de um cientista de dados, um analista de dados, um engenheiro de dados e até mesmo um programador de inteligência de negócios.

Havia também algumas fontes de dados que se sobrepunham quanto às responsabilidades e habilidades de um analista de dados versus um cientista de dados. Então, vamos começar a entender isso para que você possa ver qual papel seria mais adequado para você.

O escopo do trabalho de um analista de dados versus um cientista de dados

Diz-se que o escopo de um analista de dados é micro, pois geralmente trabalha com dados estáticos, portanto, um instantâneo desses dados e geralmente tende a ser dados estruturados. Limita-se a usar principalmente ferramentas e técnicas estatísticas, geralmente no domínio da análise descritiva.

O analista de dados analisa os dados para responder a perguntas específicas, como: “por que as vendas caíram em um determinado trimestre”, “por que uma campanha de marketing se saiu melhor em determinadas regiões”, “como o atrito interno afeta a receita”, “onde os gastos orçamentários devem ser aumentados para obter mais retorno sobre o investimento”, “qual é o número de leads que os esforços de vendas devem gerar para preencher o pipeline de vendas”, e assim por diante.

Essa função analisa dados estruturados, geralmente por meio de análises descritivas, para responder a perguntas geradas para uma melhor tomada de decisão de negócios

Por outro lado, o escopo do cientista de dados é considerado macro, pois eles trabalham mais com dados dinâmicos que podem mudar com frequência e quaisquer modelos e soluções que eles construíram precisam se adaptar rapidamente. Então, sim, eles são mais propensos a trabalhar com big data estruturado e não estruturado e que pode ter um alto volume, velocidade e variedade. O escopo do cientista de dados também pode envolver inteligência artificial, aprendizado de máquina e aprendizado profundo.

O cientista de dados, por meio da análise de dados, define novas questões e problemas de negócios que levam à inovação e, em seguida, descobre as soluções para esses problemas novos e desconhecidos. Ao contrário do analista de dados, o cientista de dados tende a já entender os requisitos da empresa para que ela possa formular novas questões que precisam ser abordadas. Essas questões às vezes podem ser abordadas por analistas de dados, a propósito.

O cientista de dados trabalha com dados estruturados e não estruturados e usa várias ferramentas e algoritmos de aprendizado de máquina para prever e classificar padrões nos dados e aumentar o desempenho e a precisão desses algoritmos. Então, mais sobre a análise preditiva e modelagem.

Alguma sobreposição de escopo de ambas as funções:

Ambas as funções tendem a fazer alguma limpeza de dados e transformação de dados - e provavelmente faz parte do trabalho que ambas as funções reclamam. A diferença é que um cientista de dados tende a trabalhar com dados mais complexos e dados brutos. A propósito, do ponto de vista da ciência de dados, isso pode se enquadrar na disputa de dados ou na manipulação de dados.

Ambos também apresentam e comunicam suas descobertas por meio do uso de visualização de dados e narrativa de dados. Existem fontes que afirmam que isso está mais no escopo de um papel do que no outro, mas acho que pertence a ambos.

As habilidades necessárias para um analista de dados vs um cientista de dados

O analista de dados precisa saber estatística e ter aptidão matemática, mas eu classificaria o nível dessa habilidade como intermediário. Como o analista de dados trabalha com dados estruturados, ele precisa entender bancos de dados relacionais e ter conhecimento de SQL e deve ser bem versado no uso do Excel (acredite ou não).

O cientista de dados precisa ter conhecimentos avançados de estatística e matemática. Pelo que descobri, a maioria dos cientistas de dados tende a gravitar em direção à matemática. Claro, existem superestrelas que se destacam em ambos. O cientista de dados também deve conhecer SQL, mas também NoSQL, como MongoDB e Cassandra, pois esses bancos de dados NoSQL têm a capacidade de manipular e dimensionar dados dinâmicos, big data.

Quanto às linguagens de programação, o analista de dados deve ter um conhecimento básico e o cientista de dados ter conhecimento avançado de Python, R, Julia (que é uma linguagem futura que está sendo apontada como sucessora do Python), às vezes SAS (que é comumente usado no setor bancário e financeiros), talvez até Jupyter Notebooks — que não é uma linguagem, mas um aplicativo da web que você pode usar para criar e compartilhar documentos que contêm código ao vivo, equações, visualizações para seus projetos de análise de dados e ciência de dados. Portanto, tudo isso realmente depende da empresa e do setor em que eles trabalhariam e do ambiente técnico que possuem.

Mais algumas coisas para adicionar ao cientista de dados, se seu foco estiver em aprendizado profundo, eles podem precisar conhecer estruturas específicas de aprendizado profundo (por exemplo: TensorFlow, PyTorch, Keras, Caffe) ou se seu foco estiver em inteligência artificial, eles podem precisa conhecer algumas ferramentas de auto machine learning (ex: AutoKeras, IBM Watson, DataRobot, Amazon's Lex).

Ambas as funções devem saber como utilizar ferramentas de visualização de dados (ex: Tableau, PowerBI e Qlik sendo as mais populares). Por fim, ambos devem ser bons na resolução de problemas e possuir habilidades de comunicação, incluindo narrativa de dados.

A educação e a experiência necessárias para um analista de dados versus um cientista de dados

Como mencionei, analisei mais de 100 descrições de cargos e os requisitos podem variar muito. Aqui estão alguns denominadores comuns, no entanto.

Os requisitos de um analista de dados são para um diploma de bacharel no mínimo, de preferência em um campo científico. E não é incomum ver que é desejável ter formação em estatística ou matemática.

Por outro lado, para um cientista de dados, na maioria dos casos, é necessário ter um mestrado, geralmente em matemática ou engenharia de software, aprendizado de máquina ou programação de computadores. Alguns até exigem um Ph.D.

Quanto aos anos de experiência como analista de dados, você pode passar com 2 anos de experiência anterior e como cientista de dados com 4 ou mais. Estes podem oscilar dependendo de quem está escrevendo a descrição do trabalho, mas achei que esses são os requisitos mínimos mais comuns.

As expectativas salariais de um analista de dados versus um cientista de dados

E como há uma diferença nas habilidades e experiência exigidas, bem como no escopo do trabalho, o mesmo pode ser dito para o salário de ambas as funções.

Em abril de 2021, o salário médio de um analista de dados nos EUA, de acordo com a Glassdoor, era de cerca de US$ 66 mil a US$ 67 mil por ano. Não deve ser surpresa, dado o escopo do trabalho do cientista de dados, que eles ganham significativamente mais dinheiro do que seus colegas analistas de dados. Novamente, o Glassdoor tem uma média de US$ 113 mil por ano.

Qual o papel certo para você? Analista de dados ou cientista de dados?

Em última análise, tudo se resume ao que você quer fazer e quais habilidades e experiências você deseja buscar. Embora uma função ganhe um salário mais alto e exija um conjunto de habilidades mais aprofundado, nenhuma delas pode existir sem a outra e ambas desempenham papéis essenciais para as organizações quando se trata de seus dados. Então, qual papel você acha que é certo para você?
Created with