Como a Netflix utiliza a Ciência de Dados

Criar séries de sucesso tem muito mais a ver com análise e predição de dados do que você imagina

Views: 1509

Written by:

Todos conhecemos a adrenalina. Parece que nosso corpo é todo feito de metal e o sofá é o ímã mais poderoso que existe. Você esquece do aniversário da sua tia, de passear com seu cachorro, quiçá até de almoçar.

Tudo porque saiu a temporada da sua série preferida

Se você for consciente, vai esperar o fim de semana para começar a assisti-la. Mas são poucos os que têm essa disciplina — em geral a gente se engana dizendo “só um”, até se dar conta que são 3:40 da manhã e a reunião das 9:00 não terá uma discussão sobre seu personagem favorito de Stranger Things.

E enfim: “Ufa, terminou o episódio.”

animação de um notebook escrito netflix segurando uma rosa

Mas mal começaram os créditos e vem aquela contagem regressiva… 4, 3, 2, 1, e entra o capítulo seguinte. Forças para desligar? Não há. Já era. Você perdeu essa batalha assim que apertou play.

Como a Netflix faz isso?Simples. Muita análise e inteligência de dados e, claro, um ótimo time de Cientista de Dados.

Conhecendo o usuário

Já dizia Frank Underwood, personagem de House of Cards: “Decisões baseadas em emoções não são decisões”.

mulher sentada em uma mesa tomando uma taça de vinho

Ninguém sabe disso melhor que a Netflix. Tanto que a série foi a primeira produção original da empresa a ser criada totalmente com base em algoritmos. Sabia-se que ela seria um sucesso antes mesmo de as gravações começarem.

Por quê?

Porque o serviço de streaming sabe tudo sobre os gostos e comportamentos de seus mais de 130 milhões de assinantes. E ele faz isso compilando dados:

  • Sobre o que você assiste: qual gênero, por quanto tempo, em que dispositivos, datas, locais e horários, como você classifica os conteúdos, com que frequência você pausa, em que momentos para de assistir ou mesmo abandona de vez uma produção.
  • Sobre como você navega: que termos pesquisa, que trailers vê dentro da plataforma, como utiliza a barra de rolagem, em que você clica, quanto tempo leva para selecionar um filme ou série, o histórico e os cookies do seu browser.
  • Sobre quem você é: seu nome, e-mail, endereço, telefone, método de pagamento e região, além de dados demográficos comumente providos por fornecedores terceirizados.

Sim, pode parecer muito, mas não é nada que não seja padrão de uma empresa com uma área de dados extremamente bem estruturada.

Fora que, com isso em mãos, é possível cruzar inúmeras informações que permite à Netflix prover uma experiência customizada, de alta qualidade e criar entretenimento com grandeschances de agradar o público e gerar engajamento.

Análise de tendências

Suponhamos que, em meio a suas análises, a Netflix perceba que uma quantidade considerável de pessoas está assistindo fielmente a “Três é Demais” (originalmente chamada Full House), comédia altamente popular nos anos 80 e 90, cancelada após oito temporadas.

A partir dessa evidência, eles podem se aprofundar em algumas questões que envolvem a série: Qual a retenção que ela apresenta? Que porcentagem de espectadores completa todas as temporadas? Quanto tempo isso leva? Qual é o intervalo entre o fim de um episódio e o início de outro? Se a série é abandonada, em que momento isso acontece? E quais são os as particularidades do conteúdo que se relacionam a esses comportamentos?

Canto de um notebook com a tela do netflix

Se a conclusão dos dados for de que a série tem alto índice de aprovação e engajamento, cientistas podem então traçar tendências e probabilidades que orientam uma possível continuação — haveria enormes chances de que ela também seria assistida.

Começamos com uma suposição, mas foi o que aconteceu: Fuller House, a spinoff criada com quase todos os mesmos atores da série original, tem sido um sucesso e já foi renovada para sua quarta temporada.

Olho no futuro

O grande segredo, portanto, não é só a compilação, mas a predição de dados.

E isso, ninguém faz melhor que o Data Scientist.

Os cientistas de dados não se preocupam apenas em encontrar padrões, aplicar estatística avançada e modelos de machine learning para responder questões-chave de negócios, como também para gerar novas perguntas. É a figura responsável por olhar para frente — literalmente prevendo o futuro.

Portanto, além de criar algoritmos e lidar com um volume grande de dados, também se espera deles que tenham a capacidade de interpretar seus achados e inferir conclusões. Suas habilidades precisam ser avassaladoras não só do lado técnico: eles devem ser perspicazes também quanto à estratégia de negócios, fazendo com que os dados contem uma história coerente que sirva às necessidades da empresa.

Hoje, claro, a Netflix emprega vários deles. Mas em 2009, eles precisaram de uma ajudinha.

A empresa resolveu criar o Netflix Prize, que oferecia a recompensa de US$ 1 milhão ao grupo que criasse o algoritmo que melhor pudesse prever como clientes reagiriam a um filme com base em suas preferências e classificações prévias.

Houve um vencedor (e era 2009, mas o design grita 1998):

Printscreen do site netflix prize

O algoritmo não foi implementado integralmente, mas ofereceu ganhos de precisão e ajudou o Netflix a gerar US$1 bilhão por ano em valor por retenção de usuários.

Seis anos depois, eles tinham confiança suficiente para conceber uma série com base no que a ciência de dados os dizia.

O fenômeno que se tornou House of Cards só incentivou ainda mais que dados e criatividade continuassem em sintonia: hoje, conteúdos originais da Netflix têm taxas de sucesso na faixa dos 80%, enquanto outras produções do catálogo da plataforma mantêm uma média entre 30% e 40%.

Os cientistas de dados da Netflix conhecem bem seus usuários e sabem usar isso a favor deles e, consequentemente, a favor do negócio. Talvez haja algumas tias ou cachorros chateados por aí, mas pelo menos assim a gente sabe que nenhuma maratona vai ser subaproveitada.


Se você curtiu a carreira de um cientista de dados, conheça o Bootcamp em Data Science & Machine Learning for Business da Tera. Essa é uma formação desenhada para aplicar sua curiosidade nata a conhecimentos em tecnologia, negócios e análise de dados para identificar e resolver problemas no mundo de dados. Criado lado a lado com alguns dos melhores data scientists do mercado, o curso guia os estudantes por uma jornada de mais de 130 horas de conhecimento com dados e problemas reais de negócios reais.

Como a Netflix utiliza a Ciência de Dados

by Kaique Paes tempo de leitura: 4 min
0