Michael Chen | Estrategista de conteúdo | 13 de maio de 2024
Latência de dados refere-se ao tempo de atraso entre quando os dados são enviados para uso e quando eles produzem o resultado desejado. A latência pode ser causada por uma série de fatores, incluindo congestionamento de rede, limitações de hardware, tempos de processamento de software, distância entre pontos finais e como um sistema é configurado.
Considere o atraso de resposta entre bater o pedal de freio do seu carro e a parada do veículo. Na prática, os seres humanos tendem a frear dentro de um segundo de perceber a necessidade de fazê-lo. Imagine como seria desestabilizador se houvesse então um atraso de dois ou três segundos antes do sistema se engajar. O resultado seria uma redução drástica dos limites de velocidade, e a distância segura entre os carros precisaria aumentar muito. Felizmente, a menos que algo esteja errado, a frenagem começa em décimos de segundo, e percebemos isso como uma resposta instantânea e em tempo real.
A latência em qualquer sistema de controle – incluindo a tecnologia Internet of Things (IoT) – limitará a precisão com que ele pode operar. Um caso de uso popular do IoT é a tecnologia de casa inteligente que nos permite controlar vários utilitários, como iluminação, aquecimento, segurança e eletrodomésticos, por meio de um hub inteligente centralizado ou aplicativo móvel. Considere um termostato inteligente. Quando você o define em 70 graus, por causa da latência no sistema, a temperatura vai flutuar entre cerca de 69 e 71. Mas vamos dizer que, em vez de uma flutuação de dois ou três graus, você quer apenas uma flutuação de 0,1 grau. Devido à latência entre o calor ou A / C acontecendo e o termostato registrando a mudança, a temperatura real quase nunca estaria nessa faixa de 0,1 grau muito estreita. Então, a cada minuto, o hub alterna entre A / C e calor. Não só isso seria difícil em seus sistemas mecânicos, você também teria uma surpresa grosseira quando sua próxima conta de energia chegou.
A latência de dados é o tempo necessário para os dados viajarem de sua origem para seu destino, ou o tempo necessário para que os dados sejam processados e disponibilizados para uso. Este atraso pode ser causado por vários fatores, incluindo congestionamento de rede e limitações de hardware, como uma coleta de dados é configurada e gargalos em sistemas de processamento de dados.
A latência de dados pode ter implicações negativas significativas; também pode ser uma alavanca que a TI pode extrair para equilibrar o custo de coleta e transmissão de dados com as necessidades da empresa. Em alguns setores, especialmente aqueles que exigem informações em tempo real ou sensíveis ao tempo, como o setor financeiro, até mesmo um pequeno atraso na transmissão de dados pode levar a oportunidades perdidas ou preços incorretos. Em geral, as organizações trabalharão para avaliar a velocidade vital para a tomada de decisões e o desempenho ideal em vários aplicativos em relação aos custos de uma resposta mais rápida e, ainda assim, há um limite para a quantidade de latência que pode ser expulsa de um sistema.
Embora a latência sempre degrada o desempenho, se um sistema digital se torna inutilizável ou não depende de uma série de fatores.
Em sistemas de controle, isto é, aqueles que gerenciam, direcionam e comandam outros sistemas ou dispositivos, a latência excessiva causa instabilidade e pode até tornar o sistema inoperante. Em casos de uso em tempo real, como chamadas de voz e vídeo, a latência é, na melhor das hipóteses, irritante e, em um determinado limite, torna o sistema inutilizável. E na análise de dados, a latência pode retardar o processo até o ponto de renderizar a análise concluída porque os tomadores de decisão seguiram sem ela.
Vejamos vários tipos de latência.
Os seres humanos são muito intolerantes à perda de dados em áudio e vídeo. Em aplicativos de áudio, se os dados forem atrasados em mais de um quarto de segundo, eles se tornarão inúteis e serão percebidos como um clique ou pop ou áudio distorcido. O mesmo vale para o vídeo. Os dados atrasados são tão ruins quanto os dados perdidos. Algoritmos podem tentar compensar, mas se a latência da rede exceder cerca de 300 milissegundos, o vídeo em tempo real se tornará intoleravelmente corrompido.
Em redes modernas, a latência é tipicamente apenas dezenas de milissegundos, e os aplicativos de vídeo e áudio funcionam muito bem. As redes também reconhecem o tráfego em tempo real e o priorizam para que a latência não torne os dados inúteis na chegada.
Em aplicações quase em tempo real, a latência é um problema. Ao coletar dados de sensores em um chão de fábrica remoto para monitorar avarias, por exemplo, a latência pode retardar o tempo de resposta até o ponto de uma linha de produção ser desligada antes que um técnico possa intervir. Mas o compartilhamento de informações mais rápido requer redes de longa distância de alto desempenho, que são caras. A resposta é usar os chamados sistemas de computação de borda que movem o armazenamento e a computação para mais perto das máquinas que criam os dados, reduzindo os requisitos de transporte de dados e, assim, reduzindo a latência.
Até agora, os sistemas sobre os quais falamos exigem latência de subsegundos para funcionar de forma eficaz. Os dados de negócios e a análise deles serão sempre mais úteis no momento em que foram criados. Mas, além dessa afirmação muito ampla, é difícil dizer exatamente quanta latência é aceitável sem pensar na aplicação em questão.
Na previsão do tempo, os dados sobre as condições atmosféricas da semana passada podem ter algum uso na identificação de padrões climáticos para esta semana, mas dados mais recentes dos últimos dias e horas serão muito mais úteis. Ainda assim, há um limite para o quanto a pontualidade importa. Os meteorologistas precisam de atualizações de dados a cada segundo ou a cada décimo de segundo? Em algum momento, não há variação suficiente nos dados coletados em intervalos muito curtos para valer a despesa.
O mesmo tipo de pensamento é importante ao calcular quanta latência é aceitável no projeto de sistemas de análise de negócios. Será que um grande varejista quer saber quantas camisas azuis vendem em uma base segundo a segundo? Provavelmente não. Os dados de estoque e vendas por hora são suficientes? Considerando o quão difícil seria fazer uma mudança significativa no inventário em menos de uma hora, sim, isso provavelmente é suficiente. Alcançar um melhor desempenho custaria dinheiro que poderia ser melhor gasto em outro lugar.
Por outro lado, relatórios sobre dados de vendas precisos dentro de algumas horas ou até mesmo alguns dias podem ser bastante valiosos. Os executivos podem querer saber quais itens as pessoas que compram camisas azuis também compram, mesmo que não estejam na mesma instância de compra. Eles poderiam criar pacotes de vendas - pense em ofertas de "Comprar a aparência" - com base nesses dados. Da mesma forma, os compradores on-line apreciam as recomendações de "pessoas que compraram isso, também compraram isso". Assim, a latência na coleta de dados "As pessoas também compraram" pode ser muito mais crítica do que simplesmente quantas camisas foram vendidas. A diferença entre ter relatórios dos gerentes de loja em suas caixas de entrada todos os dias e deixá-los extrair os dados em segundos pode ser um verdadeiro divisor de águas nos negócios.
Portanto, embora a latência afete a forma como os dados são coletados, como são processados e como são disponibilizados para análise futura, decidir qual área melhorar deve começar com uma compreensão do desafio dos negócios. A coleta de dados precisa ser tão rápida quanto as necessidades da empresa, mas gastar dinheiro para torná-la mais rápida pode ser um investimento imprudente. A chave é se concentrar em áreas onde os investimentos em novas tecnologias terão o maior impacto.
Enquanto isso, passar de um sistema que exige um processo de ETL antes que a análise possa começar para um que permita que os dados sejam armazenados em um ambiente de banco de dados avançado pode permitir que os líderes empresariais entendam mais tendências com mais rapidez, possivelmente mesmo em tempo real. A adição de recursos de autoatendimento para que os líderes de negócios possam gerar análises comuns também reduzirá outra fonte de latência.
Isso se relaciona ao conceito de latência de negócios, o tempo entre o momento em que um evento inesperado que afeta o desempenho futuro acontece e o momento em que sua organização age com base nessas informações.
É crucial gerenciar a latência porque ela pode afetar muito a experiência e a satisfação do usuário. A alta latência pode levar a tempos de carregamento lentos, atrasos no processamento de solicitações e desempenho ruim geral. O monitoramento e a otimização dos níveis de latência valem o esforço. Ao reduzir a latência, as empresas podem melhorar a satisfação dos clientes e funcionários.
Os hiperescaladores de hoje criaram parcerias que permitem acesso total aos seus dados nas instalações de qualquer provedor de nuvem e sem latência. Veja como, mais 10 avanços para saber agora.
O que é latência de dados aceitável?
A latência de dados aceitável varia de acordo com a organização ou o sistema que utiliza os dados. Em geral, a latência de dados aceitável refere-se ao tempo máximo que pode levar para que os dados sejam transmitidos ou processados de sua origem para seu destino para oferecer desempenho aceitável. Em alguns casos, como em sistemas financeiros ou aplicativos de missão crítica, o processamento de dados em tempo real com latência mínima é crucial. Em outros casos, como em análises de dados ou relatórios em que as atualizações de dados podem ser agrupadas em lotes, um ligeiro atraso na transmissão ou processamento de dados pode ser aceitável. Em última análise, o que constitui latência de dados "aceitável" é determinado pelas prioridades específicas e casos de uso da organização ou do sistema.
Nos servidores, a latência entre memória, CPU e adaptadores de rede será medida em microssegundos. Em sistemas de armazenamento em larga escala, são milissegundos. Quando os clientes estão fazendo compras, comprometer transações no armazenamento pode levar uma fração de segundo ou mais. E quando os humanos estão envolvidos, a latência pode ser muito maior. A determinação da latência aceitável quase sempre dependerá do aplicativo em questão.
Como você lida com a latência de dados?
As estratégias para lidar com a latência de dados dependem da origem da latência. Se uma organização só vê um punhado de reclamações sobre latência, o problema pode resultar do lado do usuário. Possíveis causas incluem dispositivos desatualizados ou uma conexão lenta com a Internet. Para questões generalizadas, este é um sinal de que a causa repousa no lado da organização. Um conjunto de melhores práticas para ajudar a corrigir a latência de dados pode incluir a implementação de ferramentas de cache, ferramentas de monitoramento, melhores estratégias de compactação de dados e a consideração de um melhor provedor de infraestrutura de nuvem.
A taxa de dados afeta a latência?
Taxa de dados refere-se à velocidade com que os dados são enviados através de uma rede, geralmente expressa em bytes por segundo. A latência de dados está relacionada a isso, pois é o intervalo de tempo entre a solicitação e a resposta. Taxas de dados mais altas podem ajudar a reduzir a latência de dados, pois taxas de dados mais altas garantem melhor largura de banda e desempenho geral. No entanto, a latência de dados não é necessariamente diretamente dependente da taxa de dados, pois outras variáveis podem ser aplicadas. No entanto, eles estão relacionados o suficiente para que os problemas de taxa de dados possam ser indicativos de problemas de latência e vice-versa.
Como a variação de latência pode ser reduzida?
Para os usuários, a variação de latência pode resultar de algo tão simples quanto uma conexão de internet não confiável ou pouca memória / armazenamento em um dispositivo; abordar esses problemas geralmente elimina a variação. No lado do provedor, a variação de latência pode ser um sintoma de solicitações repentinas de computação que consomem energia de processamento ou largura de banda. O monitoramento de aplicativos de ponta a ponta, bem como o monitoramento geral da rede, devem fornecer informações sobre por que ocorrem picos repentinos de latência. Uma vez que a causa raiz é isolada, as equipes de TI podem implementar estratégias de otimização.