Preciso saber matemática para aprender Ciência de Dados?

Disclaimer e spoiler: não é necessário fazer contas à mão ou decorar fórmulas

Estou fazendo uma especialização em matemática e estatística para ciência de dados e um dos pontos que foi levantado bem no começo é por que aprender matemática? Faz diferença na absorção do conhecimento? Como começar a pensar em aprender matemática para dados, seja análise ou ciência?

Brinquedos matemáticos que ajudam a entender conceitos de forma mais amigável

É fundamental aprender matemática em seu nível conceitual. Ou seja, não é preciso conseguir reproduzir sozinho os cálculos matemáticos. A matemática serve como ferramenta de abstração dos conteúdos complexos que abordamos nos conteúdos que utilizamos na análise e na ciência de dados. Um exemplo muito simples que ajuda a compreender o poder de abstração que a matemática traz: desenhe em um papel um elemento com uma dimensão. Você provavelmente desenhou uma reta, certo? Agora vamos desenhar um em duas dimensões. Você provavelmente desenhou um quadrado ou alguma figura sem profundidade. Agora vamos pensar em um elemento de três dimensões. Você provavelmente desenhou um cubo ou uma pirâmide.

Elemento com 4 dimensões

Agora, quando tentamos desenhar um elemento que tenha quatro ou cinco dimensões o exercício já exige bem mais tempo e reflexão — eu mesma não conseguiria desenhar sozinha. São nesses momentos que a matemática nos ajuda a abstrair. Isso é ainda mais relevante se levamos em conta que os algoritmos de aprendizado de máquina levam n dimensões, sendo n qualquer número.

Como estudantes ou profissionais de dados é importante conseguir expressar e interpretar ideias complexas de forma simplificada, clara, não ambígua e concisa em linguagem matemática. Tudo que aprendemos acima de três dimensões já é considerado um tensor e nessa linguagem fica viável de estudar os algoritmos que utilizamos.

Com devido estudo é possível até replicar manualmente um algoritmo de aprendizado de máquina, como algumas bibliotecas de Python bem famosas fazem, como a scikit-learn ou a gensim. É o meu objetivo no curso que estou fazendo, para conseguir replicar um modelo de Latent Dirichlet Allocation (quem sabe outros também).

Ficou interessado a aprender matemática e solidificar mais a sua base? Dentre os diversos assuntos, vou colocar uma lista de sugestão de estudos. Claro que não precisa saber a fundo cada um dos conceitos, mas quanto melhor for seu entendimento, mais fácil é o desenrolar dos entendimentos seguintes na área de dados.

  • Funções e Limites
  • Equações (em especial lineares)
  • Logaritmos e Logaritmos Naturais
  • Matrizes e Determinantes
  • Vetores e Espaço Vetorial
  • Derivadas e Integrais
“estude matemática, matemática e mais matemática” — Yann LeCun

Vou deixar aqui uma bibliografia que pode te ajudar caso a internet te falhe em algum momento de necessidade matemática.

Bons estudos matemáticos!

ela/dela | data analysis | entusiasta de data science e machine learning

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store