A REVOLUÇÃO DO BIG DATA
O Hubble está desvendando o Universo; o
Big Data o nosso universo de dados!
O volume de dados que vem sendo
gerado hoje em computadores, tablets,
smarphones e outras formas de
tecnologia é impressionante e vem crescendo consideravelmente, muito
especialmente em função da denominada internet das coisas (ver postagem nesse
blog de 21/02/2014).
Para avaliar o crescimento desse
volume de dados, basta lembrar a velha fábula do inventor do jogo de xadrez,
quando o imperador encantado com o jogo quis remunerar o seu criador. Ele então
respondeu: “no primeiro quadrado eu quero um grão de arroz, e a cada quadrado
seguinte a quantidade de arroz deverá ser duplicada”. Depois de trinta e duas
quadras, o imperador teria dado ao inventor do xadrez nada menos do que quatro
bilhões de grãos de arroz!
Segundo estimativas da International
Data Corporation, uma empresa de pesquisa de mercado, análise e consultoria especializada
em tecnologia da informação, telecomunicações e tecnologia de consumo, o volume
de dados que são gerados diariamente vem dobrando a cada dois anos, considerando nessa estimativa os dados gerados através da denominada internet das coisas.
De acordo com Eric Schmidt ex CEO
da Google, havia cinco exabyte de
informação criados entre o início da civilização até 2003. Muito mais
informação é gerada hoje a cada dois dias e, essa velocidade está aumentando
exponencialmente! As pessoas não estão prontas para revolução que vai acontecer
com elas.
O termo Big Data é aplicado para as
informações que não podem ser processadas ou analisadas utilizando-se dos
processos e ferramentas tradicionais, uma vez que essas informações são geradas
através de inúmeros dispositivos visto que a formatação desses dados é bastante
variada o que dificultaria ou tornaria impossível a sua análise pelos métodos
tradicionais.
Três características definem o Big
Data: volume, variedade e velocidade. Quanto ao volume, muitos fatores contribuem para um aumento considerável no
volume de dados gerados, como descrito nos parágrafos anteriores; a relação
quanto à variedade pode ser percebida
considerando-se os dispositivos geradores de dados, tais como: arquivos de
textos, emails, imagens,
vídeos, áudios, etiquetas inteligentes (RFID) e tantas outras formas vinculadas
ao que se denominou de internet das coisas e, finalmente a velocidade está ligada tanto a geração dos dados quanto a forma
ágil de processá-los para que tenhamos condições de rapidamente analisa-los.
A figura 2 apresenta esse
detalhamento que passa a ser conhecido no jargão da tecnologia da informação
como V3 (volume x Variedade x Velocidade).
Figura 2 – As característica
do Big Data – Volume, Variedade e Velocidade.
Inúmeras empresas estão mergulhando
profundamente nesse universo com objetivo de explorar esse verdadeiro tsunami de dados, objetivando,
por exemplo, orientar as previsões de vendas, novos investimentos, lançamentos
de novos produtos, etc., além de possibilitar monitorar operações das mais
diversas (ver postagem de 08/12/2013).
O Mckinsey Global Institute (MGI) estudando
alguns setores nos Estados Unidos e na Europa, entre eles saúde nos EUA, setor
público europeu e o varejo americano, estimou grandes ganhos através da
utilização do Big Data, como por exemplo: um varejista com big data tem
possibilidades de aumentar sua margem operacional em mais de 60 por cento. Na área
da saúde nos EUA, a análise de um grande volume de dados pode impulsionar a
eficiência e qualidade do setor e produzir redução nas despesas em cerca de 8
por cento. No setor público europeu, segundo o mesmo estudo, para as economias
desenvolvidas da Europa, os governos poderiam economizar mais de € 100 bilhões
em melhorias na eficiência operacional, através da utilização do big data.
Também não podemos esquecer que o
big data é uma excelente ferramenta para a detecção e controle de erros e fraudes,
além de aumentar a eficiência do sistema de receitas fiscais. O nosso “leão” da
Receita Federal deve utilizá-lo com bastante eficiência!
Estudos realizados por
pesquisadores liderados pelo professor Erik Brynjolfsson do MIT destacam que a
gestão através do big data vem produzindo grandes efeitos na melhoria da produtividade.
Esse estudo teve com base uma pesquisa realizada em 179 grandes empresas e
mostrou que ao utilizarem de análise de dados essas empresas obtiveram ganhos
de produtividade que oscilaram em 5% e 6%.
É claro que a mineração desses
dados é uma tarefa bastante complexa, porém algoritmos computacionais
sofisticados e uso de tecnologias de inteligência artificial tem permitido o
processamento e o reconhecimento de padrões por computadores de alto desempenho.
Um relatório produzido pelo MGI
estima que, em face dessa massiva geração de dados que precisam ser processados
e analisados, haverá uma necessidade de cerca de 180.000 novos postos de
trabalho, só nos EUA.
Como o volume de dados gerados vem crescendo
assustadoramente, cada vez mais é imperioso o uso de computadores de alta
velocidade, assim com algoritmos que permitam a mineração desses dados em tempo
recorde. Essa tarefa envolve: sistemas, softwares, computadores, recursos
humanos etc. em fim, uma grande infraestrutura para manter e operar hardwares e
softwares. Nesse sentido, muitas aplicações estão surgindo na análise desses
dados com a utilização de algoritmos especiais que se acoplam aos sistemas de
inteligência artificial e redes neurais, possibilitando assim que os próprios softwares
através do “aprendizado” na coleta e interpretação dos dados produzam melhorias
no próprio funcionamento deles.
O Big Data está se tornando uma
grande revolução, porém não podemos esquecer outras questões importantes que terão
de ser abordadas com relação ao potencial dessa nova ferramenta. Estamos
falando de políticas relacionadas à privacidade, segurança, propriedade
intelectual, bem com da responsabilidade no uso e operação do big data. Recentes
questões jurídicas com o Google já demonstram preocupações nesse âmbito!
Fonte:
Big data: The next
frontier for innovation, competition, and productivity in http://www.mckinsey.com/insights/business_technology/big_data_the_next_frontier_for_innovation - acesso: 15/05/2014.
Manyika, j. ; Chui M.; Brown B.; Bughin, J,; Dobbs, R.;
Roxburgh C.; Hung, C.B. in BIG Data -
The next frontier for innovation, competition, and productivity – in McKinsey
Global Institute Report – May, 2011.
Eaton, C.; Derros, D.;
Deutsch, T.; Derros, D.; Lapis, G.; Zikopoulos,P. – in Understanding Big
Data – Analytics for Enterprise Class Hadoop and Streaming Data – McGraw
Hilll – Companies – 2012
Lhor, S. -The Age of Big Data – The New York
Time – Sunday Review – February 11 , 2011 – in http://www.nytimes.com/2012/02/12/sunday-review/big-datas-impact-in-the-world.html?pagewanted=all&_r=0 – acesso 15/05/2014
___________________________________
Paulo Sérgio Gonçalves é engenheiro, M.Sc. em engenharia de Produção
pela COPPE/UFRJ, professor do IBMEC/RJ e
autor das seguintes obras didáticas:
- Administração de Estoques – Teoria e Prática, em coautoria de E. Schwember – Editora Interciência;
- Administração de Materiais – 4ª. Edição – Editora Campus/Elsevier;
- Logística e Cadeia de Suprimentos – O Essencial – Editora Manole.
bigdatabrasil.net
ResponderExcluir