Cinco pontos essenciais em relação aos dados de um Big Data

Big data é a nova tendência tecnológica que promete causar tanta revolução quanto a internet e até mesmo a própria imprensa. Trata-se da capacidade de armazenar grande quantidade de informações, e analisá-las com objetivos definidos para chegar a conclusões incríveis.

1-      Atente-se para o volume de dados

Trabalhar com big data exige a preparação para lidar com o grande volume dos dados que são gerados pelos sistemas transacionais e principalmente pela internet das coisas.

Para começar, faça um inventário de seus dados, completo e organizado, posteriormente isso auxiliará a fazer um melhor gerenciamento de tudo. É recomendado também, fazer uma avaliação de sua capacidade atual de armazenamento e processamento.

2-      Encarregue-se pela variedade de dados

Uma variedade muito grande de dados é armazenada no big data, incluindo dados estruturados como textos e não estruturados como fotos, vídeos, etc. Essa grande variedade de formatos e estruturas que são necessários conciliar em suas análises é o aspecto mais desafiador do Big Data. É preciso integrar inúmeras fontes se houver pretensão de incluir novos tipos e estruturas de dados (sociais, sensores, vídeo) às fontes já utilizadas (relacionais, mainframes legados).

Aproveite as ferramentas para integração e qualidade de dados disponíveis para acelerar o processo, destinando tempo para atividades mais importantes.

 3-      Gerencie a velocidade de dados

A velocidade é um ponto muito importante, pois muitas vezes precisamos responder aos eventos quase em tempo real. A combinação dos dados de streaming em tempo real e dos seus dados históricos geralmente aumenta a capacidade de previsão da análise. Dessa forma, alguns dados desejados só poderão ser úteis se estiverem constantemente sendo originados no sistema.

A maioria das análises tempo real precisa se basear em dados de streaming, muitas vezes provenientes de diferentes fontes e em diferentes formatos.

Seu projeto deve ser preparado com uma tecnologia analítica de streaming e infraestrutura lógica para gerenciar todos esses dados.

4-      Assegure a veracidade dos dados

Não importa a finalidade de suas análises se não for possível ter uma confiança razoável nos dados coletados. Quanto maior o volume de dados analisados, maior será a necessidade de manter um alto padrão de qualidade dos dados.

Para que os dados sejam adequados ao objetivo, é necessário conhecer esse objetivo. Numa busca por padrões em dados agregados do cliente, a preparação será mínima. Mas, no caso de dados de relatórios financeiros, estes deverão ser altamente editados, limpos e certificados para obter precisão e conformidade.

5-      Preocupe-se com a conformidade

Os conjuntos de dados com os quais você deverá lidar virão com distintas condições e requisitos de segurança. Será preciso identificar o que é necessário para deixá-los anônimos através de políticas de segurança.

Imensas quantidades de dados se proliferarão por toda empresa em inúmeros repositórios de dados, entenda onde são armazenados os dados confidenciais e proteja-os com criptografia e controle de acesso de usuários. Além disso, mascare esses dados com regras predefinidas sempre que necessário migrá-los ou inseri-los em ambiente de teste.

Autor: Ovidio Matiazi Neto

Baseado em: O grande livro de Big Data

Veja cinco pontos essenciais em relação aos dados de um Big Data
Classificado como:                        
%d blogueiros gostam disto: