A utilização massiva e o dinamismo da troca de informações entre usuários no mercado de compra e venda online geram um alto volume de dados. E na OLX, maior plataforma desse segmento no Brasil, com mais de 7 milhões de usuários diários e 500 mil novos anúncios todos os dias, a quantidade de informações gerada apenas no último ano foi exorbitante: apenas nos dias de semana, foi quase 1 petabyte de dados por dia – um tamanho de dados equivalente a ouvir mais de 9.000 anos de música. Com tantos insumos, a empresa aproveita tais informações e faz uso do Machine Learning para gerar valor e aprimorar ainda mais o seu negócio, lançando melhorias customizadas para o usuário.
Por dia, a OLX insere aproximadamente 4 terabytes de dados no seu Data Lake (repositório central de informações). Isso equivale a 2.000 horas de filme: daria para passar 83 dias assistindo filmes por 24 horas, sem parar, ou seria o tempo de assistir “Titanic” mais de 600 vezes. Internamente, quem lida com esse volume gigantesco de dados é o time de Big Data. Seu desafio é coletar, armazenar e disponibilizar as informações para todas as áreas da OLX. Parte de uma cultura voltada a dados, cada área consegue analisar e transformar os insumos em conhecimento útil para o dia a dia do negócio, aperfeiçoando ou elaborando novos produtos e processos.
A equipe de Big Data, composta por 30 profissionais, engloba os times de Data Engineering, Data Service & BI e Data Science. Esse último junto ao time de produto, está desenvolvendo projetos para tornar a experiência do usuário ainda melhor com o uso do Machine Learning, por meio de métodos automáticos que incluem colocar máquinas para identificar padrões e analisar grandes quantidades de dados de uma só vez.
O primeiro projeto consiste em um serviço de identificação automática do que o usuário pretende inserir em um anúncio. A ideia é que o vendedor tire uma foto do produto e a plataforma consiga reconhecer e especificar o item automaticamente, além de indicar a categoria a qual ele faz parte.
Desenvolvido em parceria com o time de Autos, o segundo projeto é um serviço de dados que dará uma estimativa de preço do veículo que o usuário está anunciando, com base nas informações que ele preencher no formulário de inserção. Além da tabela FIPE, essa estimativa levará em consideração o histórico da OLX, que concentra ¼ de todas as vendas de automóveis no Brasil e conta com uma riqueza de dados que permite calcular a média de preço na plataforma para cada modelo. A novidade é relevante tanto para o comprador, que saberá o valor médio do carro para analisar se está alto ou baixo, quanto para o vendedor, que terá acesso à faixa de preço do veículo que pretende anunciar para usar como base.
As duas inovações impactarão a experiência do usuário final com a empresa, melhorando ainda mais a qualidade dos anúncios. Elas também permitirão que o vendedor insira seu produto de forma muito mais rápida, o que tornará o processo de inserção mais suave. Assim, os usuários poderão se conectar ainda mais rápido para transformar itens sem uso em felicidade – que é o propósito da companhia.
Em linha com o mindset experimental de uso de dados presente na companhia, esses dois novos produtos estão em fase de testes para, em seguida, serem lançados no mercado. Por meio de uma plataforma de experimentação, o time de Big Data consegue testar com uma parcela dos usuários a aceitação da nova funcionalidade e quais resultados ela gera para quem usa a OLX. A previsão é que as novidades comecem a ser disponibilizadas nos canais da OLX até o fim de 2018.