pessoa usando o MacBook Pro com caneta e prancheta no lado

Afinal, o que é Machine Learning e para que serve?

Entenda como funciona, quais os métodos e aplicações que levam máquinas a aprenderem sozinhas

Views: 459

Written by:

Se você nunca ouviu falar de Alan Turing, ouviu falar pelo menos da 2ª Guerra Mundial. O cientista britânico, famoso por construir uma máquina que decifrava o código Enigma, usado na comunicação criptografada entre forças nazistas, foi peça essencial para a vitória dos Aliados em 1945.

Tema do filme “O jogo da Imitação”, de 2014 (perdoem o spoiler acima, mas acho que todos sabemos como a Guerra terminou), o aparato inventado por ele e seu time acabou servindo de base para vários outros estudos. Por meio de um deles, o teste que de fato levou o nome de “O jogo da Imitação”, Turing buscava determinar a capacidade de uma máquina pensar como um humano.

Ele consistia em fazer uma pessoa interagir, apenas por texto, com um programa (o que chamaríamos de chatbot, hoje em dia), ao mesmo tempo que com outra pessoa. Se, com base nas respostas que recebesse, ela não conseguisse diferenciá-los, a máquina teria passado no teste.

Mas será que ganhar o Jogo da Imitação significava que essa tecnologia poderia mesmo raciocinar como nós? Ou, mais que isso, que ela seria capaz de aprender sozinha?

As descobertas de Turing eram bastante limitadas, mas serviram de inspiração para que, um ano depois, o estadunidense Marvin Minsky criasse o SNARC, a primeira rede neural artificial, que simulou um rato encontrando seu caminho por um labirinto. Já no final dos anos 50, o também norte-americano Arthur Samuel elaborou um sistema que conseguiu ganhar dele próprio em uma partida de damas.

Foi quando o Machine Learning surgiu como conceito: Samuel havia descoberto uma forma de garantir aos computadores a habilidade de aprender com base em padrões adquiridos, sem que precisassem ser reprogramados a cada tentativa.

Então é isso o Machine Learning?

Em termos gerais, sim. Mas para deixar ainda mais claro: o Machine Learning (ML) é a ciência que permite às máquinas aprender e agir como humanos, evoluindo de forma autônoma, se alimentando de dados recolhidos por meio de trocas com o mundo real.

Pode parecer o mesmo que Inteligência Artificial (IA), mas há diferenças essenciais:

A IA é a ciência capaz de mimetizar habilidades humanas.

O ML, por sua vez, é uma aplicação da IA; uma vertente dela. Seu foco é usar algoritmos e estatísticas para desenvolver programas que podem usar sua própria experiência como alavanca para melhoria, treinados para acessar informações dentro de um histórico de interações e instruções e usá-las para incrementar suas próprias habilidades automaticamente. Isso elimina a necessidade de intervenção humana para ajustar ações ou provocar melhores decisões.

O Machine Learning é especialmente adequado à condução de tarefas repetitivas, identificação de padrões e predição de resultados. Quando implantado de forma correta, pode ter decorrências extremamente benéficas não só para negócios (reduzindo custos, poupando tempo e encontrando novas fontes de receita, por exemplo), mas para a sociedade.

E onde entra a ciência de dados?

A ciência de dados é um termo amplo, que inclui diversas disciplinas — uma delas, o Machine Learning. O “Learning”, aqui, indica que os algoritmos aprendem com os dados disponíveis, que servem de instrumento para criar modelos e afinar parâmetros.

Mas os dados nem sempre vêm de máquinas ou processos mecânicos, e por isso a ciência de dados vai além do ML ou mesmo da Inteligência Artificial. Dados podem ser coletados manualmente, em pesquisas de pequena escala, por exemplo (o que também nos lembra que nem tudo é big data), e há todo um espectro de processamento de dados que, apesar de englobar, não são restritos a algoritmos e estatística.

celula que mostra a multidisciplinaridade da ciencia de dados

Em resumo: os termos se sobrepõem. Assim como engenheiros de Machine Learning devem ter conhecimento de outras disciplinas da ciência de dados, habilidades de Machine Learning são praticamente essenciais a cientistas de dados, sendo úteis principalmente no que diz respeito à capacidade de realizar predições.

Como funciona

Algoritmos de Machine Learning geralmente são categorizados em dois tipos principais: supervisionados e não-supervisionados.

Supervisionado

Imagine que você queira prever quando uma transação de cartão de crédito será fraudada, para, assim, evitá-la: para que seu algoritmo seja capaz de antecipar esse acontecimento, ele precisará entender qual é “a cara” desse resultado esperado (a fraude), para então aprender o padrão que leva até ele. Nesse caso, cria-se um modelo que tem como referência um exemplo rotulado — ou seja, a análise se inicia com base em um conjunto de dados já conhecido.

Algoritmos supervisionados aplicam o que foi aprendido no passado a novos dados, usando esses exemplos para prever eventos futuros. Isso quer dizer que, depois de suficientemente treinados, eles podem prover resultados-alvo para quaisquer novos conjuntos de entrada, além de comparar conjuntos de saída reais com os conjuntos de saída intencionados, para encontrar erros e modificar o modelo de acordo.

Não-supervisionado

Esse tipo de aprendizado nos permite abordar problemas onde não se tem ideia exata de qual deve ser o resultado esperado. Não há um exemplo de resposta para ser usado como referência: o modelo deve trabalhar sozinho para descobrir informações que podem não ser visíveis a olho nu, identificando padrões e processos complexos e tirando conclusões com base em dados sem rótulos.

Com isso, há menos testes ou modelos que possam garantir a precisão dos resultados. Em vez disso, os resultados são criados pela própria máquina. Um exemplo de aplicação: suponhamos que você tenha 10.000 perfis de clientes em um e-commerce e queira reagrupá-los de acordo com diferentes variáveis, como frequência de visitas, quantidade de produtos comprados ou ticket médio. Há, portanto, um conjunto de dados de entrada, mas o conjunto de dados de saída será gerado sem ter respostas pré-definidas como base — e, com essas estruturas identificadas pelo algoritmo, você poderá segmentá-los de acordo com seus objetivos de marketing, por exemplo.

Além deles, outros dois tipos merecem ser mencionados: algoritmos semi-supervisionados, que usam tanto dados rotulados quanto não-rotulados para treinamento; e o aprendizado por reforço, que utiliza tentativa e erro para alcançar os resultados mais compensatórios em um determinado contexto.

Na prática

É normal pensar que o Machine Learning é utilizado apenas para automação, mas ele está muito mais presente em nossas vidas do que pensamos. Ele é valioso principalmente porque é capaz de destacar padrões em diferentes formatos de dados que seriam imperceptíveis aos humanos, possibilitando inclusive repensar um modelo de negócios inteiro.

Vamos pegar um caso que o iPhone e o Facebook trouxeram para a nossa realidade, por exemplo: reconhecimento facial.

O processo envolve diversas etapas, desde identificar um rosto, simplificá-lo, codificá-lo matematicamente e cruzar com imagens de referência para encontrar uma correspondência. Claro que há fatores como posição da face, luz, cor, movimento e expressões que também devem ser levados em conta. Às vezes, a máquina vai encontrar desafios:

rosto de menina com aparelhos de reconhecimento facial

Mas quanto mais ela é treinada, mais preciso é o resultado, com tempo mais rápido de resposta. Não é à toa que, hoje em dia, o Facebook oferece a opção de marcar seus amigos no mesmo instante em que você sobe uma foto com eles.

Por conta dessa tecnologia, especificamente, é possível usar ML para inspecionar pessoas realizando testes, para fins de fiscalização; fazendo compras ou se movimentando por lojas, para otimizar esforços de merchandising; ou mesmo adentrando prédios e andando pelas ruas, para aumentar a segurança pública.

Mas o Machine Learning vai ainda além: é uma ferramenta que pode ser utilizada para resolver problemas e tomar decisões embasadas em uma ampla gama de assuntos, desde o diagnóstico de doenças até soluções para o aquecimento global.

O cientista ainda dita as regras

Alan Turing previu, décadas atrás, que a inteligência artificial superaria a inteligência humana até o ano 2000.

Não leve a mal, Turing: nossos computadores são muito avançados. Mas não importa quão sofisticada seja a máquina, sempre será necessária uma pessoa por trás dela. Alguém que não só as programe, como tire as conclusões relevantes.

_______________________________________________

Por isso, se você se interessou pela área, conheça o Bootcamp Intensivo em Data Science & Machine Learning for Business da Tera. Essa é uma formação desenhada para aplicar sua curiosidade nata a conhecimentos em tecnologia, negócios e análise de dados para identificar e resolver problemas no mundo de dados. Criado lado a lado com alguns dos melhores data scientists do mercado.

Afinal, o que é Machine Learning e para que serve?

by Kaique Paes tempo de leitura: 6 min
0