Paulo Ceschin*
Tecnologia de dados
Data-Driven e Data Science: como transformar dados corporativos em uma mina de ouro?
Inovadores, bem-informados, enfim, digitais. De alguns anos para cá, adotamos os dados como um fiel companheiro em nossas atividades diárias, seja no trabalho, na academia e até em relações mais próximas entre parceiros. Quantificar, extrair e organizar séries de comportamentos e reações dos consumidores tem sido uma máxima para obter os melhores resultados com produtos e campanhas digitais. A exemplo das big techs, sobretudo as de redes sociais, empresas apresentam uma grande preocupação para não só ter um conhecimento refinado sobre as preferências e gostos pessoais dos usuários, como, cada vez mais, essas operações repetitivas e exaustivas vêm sendo realizadas por algoritmos cujo mérito é automatizar e criar modelos preditivos sobre os novos interesses do cliente.
O fenômeno recente do ChatGPT também trabalha com algoritmos de maneira parecida. Por meio da inteligência artificial (IA) e do aprendizado de máquina (do inglês Machine Learning, ML), a plataforma cria conteúdos de acordo com as perguntas do usuário e seu enorme arsenal de números, informações e funcionalidades armazenados em data centers. No entanto, a forma como grandes corporações utilizam essa tecnologia de dados apresenta uma diferença importante: o foco dessas companhias é utilizar essas informações para abastecer seus algoritmos para que, então, por meio de decisões baseadas em dados, experts e CTIOs possam tomar as decisões certeiras no ramo dos negócios.
Esse novo ramo de serviços e estratégias com enfoque em dados é recente e se denomina Data Science. Assim como seu nome sugere, trata-se de um verdadeiro método científico que envolve coleta, análise, organização de informações e criação de modelos preditivos (algoritmos) e manutenção inteligente dos sistemas. Para se ter uma ideia do impacto que essa mentalidade baseada em dados impactará o mercado, um levantamento do Gartner afirma que, neste ano, mais de um terço das grandes companhias mundiais investirá em soluções de modelagem e criação de linguagens para analisar, prever e nortear ações futuras de empresas. Ainda segundo o estudo, a tendência é que até o fim de 2025, 95% de todas as decisões baseadas em modelos digitais sejam 100% automatizadas.
Data Analytics e Data Science, por onde começar?
Há menos de 10 anos no mercado, a filosofia de Data Analytics nasce de uma vontade de auferir mais assertividade e controle sobre a enorme quantidade de informações, imagens, números e dados que organizações começaram a produzir nas últimas décadas. Segundo um levantamento realizado pela Internet Data Center, consumidores, governos e, sobretudo, empresas movimentaram mais 40 Zettabytes de informação em 2021, o que seria o mesmo que possuir 40 bilhões de supercomputadores com memória de 1 Terabyte para alcançar essa esse fluxo de informações em ecossistemas de nuvem, ambientes de on-premise e data centers convencionais.
No Brasil, segundo a uma pesquisa do instituto Serasa Experian, a pandemia foi um dos grandes impulsionadores da transformação digital e mentalidade analítica de empresas. De acordo com o levantamento feito nos Estados Unidos, Reino Unido e Brasil com mais 700 líderes de negócios, 8 a cada 10 organizações brasileiras registraram um aumento no fluxo de informações e dados em suas atividades, o que sinaliza uma crescente necessidade de utilizar esse recurso a favor do desenvolvimento de negócios. Em tempo, sublinha a pesquisa, 68% dos respondentes afirmam que um dos maiores gargalos para adotar uma estratégia de Data-Driven é a má qualidade de dados (incompletos, viciados e pouco elucidativos) presente em seus servidores.
Nesse contexto, recursos de Data Science e, mais especificamente, Data Analytics, despontam como soluções práticas para organizar, filtrar e tirar insights sobre páginas, consumidores e estratégias e orientar negócios a ter mais resultados. É certo que o investimento em big data, data centers e data lakes pode assustar no começo, principalmente para empresas de médio e pequeno porte que possuem operações mais enxutas e menores fontes de receita. Por outro lado, o início de uma jornada digital não precisa ser mirabolante: com pequenas contratações de tecnologia de análise já se pode aferir grandes resultados.
Com efeito, de acordo com uma pesquisa do MIT, em colaboração com a consultoria Be Analytic, de pequenos negócios a grandes organizações apresentam um ganho real de produtividade quando optam por uma mentalidade e decisões baseadas em Data-Driven. Segundo o levantamento, a média do aumento de produtividade nas mais de 170 empresas ouvidas foi de 6% ao ano, graças à redução de trabalho e esforço para fazer ações repetitivas e de pouco valor. Isso significa que os processos que envolvem automatização e decisões pautadas por dados não só alavancam a competitividade, como também transformam a organização em um modelo de negócios a ser invejado e copiado, dado que uma das vantagens desse sistema é prever as próximas tendências do mercado.
Não obstante, como mencionado acima, a efetividade dos serviços, soluções e ferramentas não diminui o impacto que esses recursos representam no orçamento de pequenas e médias organizações. Para piorar, em alguns casos, é preciso mais do que um fornecedor para atingir objetivos com dados. Para contratar servidores e funcionalidades de cloud, por exemplo, muitas vezes organizações têm que firmar contratos com dois, três ou até quatro provedores diferentes para alcançar resultados satisfatórios.
Open Source: fortalecendo o ambiente de negócios
Em meio a essa procura por soluções robustas, ágeis e, sobretudo, competitivas para atender às necessidades de organizações no ordenamento e elaboração de informações-chave para empresa, softwares baseados em dados abertos vêm conquistado o mercado de Data-Driven graças à sua estrutura escalável, mentalidade disruptiva e baixo custo de implementação. De acordo com a pesquisa The State of the Data Race 2022, elaborada pela agência norte-americana Data Stax e que ouviu 500 líderes mundiais de TI, a maioria das tecnologias de gestão, análise e compressão de dados utiliza softwares open source como padrão global de tecnologia, seja porque apresentam uma interface mais simples para desenvolvedores e tomadores de decisões ou possuem um potencial escalável dentro do ambiente de negócios.
Não é à toa que 71% dos respondentes da pesquisa afirmam que essas aplicações representam um aumento concreto no valor de empresas e fluxos de trabalho, uma vez que não apenas alavancam processos para facilitar a tomada de decisões internas, como também aumentam a satisfação de consumidores, os quais, na média, se sentem mais satisfeitos com produtos e serviços oferecidos por companhias. Para além desses benefícios, soluções de dados abertos se baseiam em formatos flexíveis e contratos personalizados, alinhados com suas necessidades diárias dentro de seu ambiente corporativo e suas demandas sazonais no atendimento de clientes.
Certamente, muitos argumentarão que, por estar em seus estágios iniciais, investir em estruturas de Data Science e soluções Data-Driven representaria um gasto desnecessário dentro dos orçamentos reduzidos e uma tarefa a mais para equipes de TI enxutas. Na verdade, trata-se do contrário. Por meio de soluções práticas, muitas vezes automáticas ou de baixa interação humana, empresas poderão destravar uma série de oportunidades para dinamizar demandas e criar um fluxo mais assertivo para acelerar mudanças e solidificar um novo tipo de cultura corporativa: ágil, criativa e, principalmente, proativa no lançamento de tendências e criação de modelos rentáveis, seja pelo uso de tecnologia, seja por meio de estratégias eficientes. Em poucas palavras, estamos diante uma verdadeira mina incontável e, mediante o uso dessas ferramentas e recursos, poderemos transformar pedras brutas em radiantes diamantes.
*Paulo Ceschin é Diretor de Vendas da Red Hat.