{"id":2403,"date":"2017-03-06T00:00:00","date_gmt":"2017-03-06T00:00:00","guid":{"rendered":"https:\/\/www.cesar.org.br\/painel\/insight\/big-data-das-coisas\/"},"modified":"2025-10-14T15:47:56","modified_gmt":"2025-10-14T18:47:56","slug":"big-data-das-coisas","status":"publish","type":"insight","link":"https:\/\/www.cesar.org.br\/painel\/insight\/big-data-das-coisas\/","title":{"rendered":"Big Data das coisas"},"content":{"rendered":"<div class=\"content-article\">\n<p id=\"3f9c\" data-selectable-paragraph=\"\"><em>Por\u00a0<\/em><strong><em>Kiev Gama<\/em><\/strong><\/p>\n<blockquote>\n<p id=\"a325\" data-selectable-paragraph=\"\"><cite>Estamos nos deparando com o surgimento de novos tipos de produtos e servi\u00e7os, al\u00e9m de uma mudan\u00e7a na pr\u00f3pria ind\u00fastria, onde o uso de dados torna-se um dos trunfos mais importantes.<\/cite><\/p>\n<\/blockquote>\n<p id=\"0352\" data-selectable-paragraph=\"\">J\u00e1 \u00e9 sabido por muita gente que, atualmente, alavancados pelas tecnologias de informa\u00e7\u00e3o e comunica\u00e7\u00e3o (TICs), produzimos uma quantidade de informa\u00e7\u00f5es muito maior do que podemos processar como humanos e at\u00e9 mesmo maior do que podemos processar com m\u00e1quinas.<\/p>\n<p data-selectable-paragraph=\"\">As \u00faltimas quatro d\u00e9cadas trouxeram evolu\u00e7\u00f5es tecnol\u00f3gicas gradativas que foram permitindo cada vez mais desaguar informa\u00e7\u00f5es neste inesgot\u00e1vel oceano de bytes: nos anos 80 tivemos a populariza\u00e7\u00e3o do computador pessoal; nos anos 90 a evolu\u00e7\u00e3o das telecomunica\u00e7\u00f5es com a Internet comercial e v\u00e1rios tipos de redes de comunica\u00e7\u00e3o sem fio; na d\u00e9cada seguinte chegaram os smartphones e na d\u00e9cada atual estamos nos deparando com a ascens\u00e3o da Internet das Coisas (Internet of Things \u2014 IoT).<\/p>\n<article>\n<section>\n<p id=\"1c1a\" data-selectable-paragraph=\"\">A quantidade de informa\u00e7\u00e3o produzida \u00e9 t\u00e3o grande que, h\u00e1 alguns anos, foi criada uma nova express\u00e3o \u2014 Big Data \u2014 para se referir a grandes quantidades de dados. O conceito n\u00e3o refere-se apenas a uma massa gigantesca de dados. Ele tampouco se refere a uma mera caixinha onde entram dados vindos de v\u00e1rias fontes e saem v\u00e1rios cifr\u00f5es, gra\u00e7as \u00e0 descoberta m\u00e1gica de informa\u00e7\u00f5es estrat\u00e9gicas para o neg\u00f3cio. Esse \u00e9 o apenas o cen\u00e1rio que geralmente \u00e9 apresentado em slides de apresenta\u00e7\u00f5es de algumas empresas quando falam em Big Data.<\/p>\n<p id=\"09e0\" data-selectable-paragraph=\"\">Embora a origem do termo tenha vindo do mundo acad\u00eamico<a href=\"http:\/\/www.forbes.com\/sites\/gilpress\/2013\/05\/09\/a-very-short-history-of-big-data\" target=\"_blank\" rel=\"noopener ugc nofollow\">[1]<\/a>, a primeira descri\u00e7\u00e3o popular do que seria Big Data \u00e9 atribu\u00edda ao Gartner Group<a href=\"http:\/\/www.gartner.com\/it-glossary\/big-data\" target=\"_blank\" rel=\"noopener ugc nofollow\">[2]<\/a>, que utilizou tr\u00eas letras \u201cV\u201d para explicar o que comp\u00f5e este conceito:\u00a0<strong>Velocidade\u00a0<\/strong>(dados produzidos continuamente),\u00a0<strong>Variedade\u00a0<\/strong>(dados de tipos e fontes distintos \u2014 planilhas, redes sociais, v\u00eddeos, dados de sensores, etc.) e\u00a0<strong>Volume\u00a0<\/strong>(massas gigantescas acumuladas). Logo, \u201cvolume\u201d n\u00e3o \u00e9 a \u00fanica coisa que o comp\u00f5e, pois segundo esta defini\u00e7\u00e3o, 50 terabytes de registros de ponto de funcion\u00e1rios (isoladamente) n\u00e3o seriam Big Data.<\/p>\n<p id=\"208d\" data-selectable-paragraph=\"\">Tanto na ind\u00fastria quanto na academia come\u00e7ou-se a discutir Big Data com ainda outras caracter\u00edsticas. Seguindo a linha do Gartner de usar o \u201cV\u201d, foi-se adicionando ao conceito a\u00a0<strong>Veracidade<\/strong>,\u00a0<strong>Volatilidade\u00a0<\/strong>e\u00a0<strong>Viabilidade<\/strong>. Entretanto, h\u00e1 tamb\u00e9m um outro \u201cV\u201d que \u00e9 estrat\u00e9gico para qualquer neg\u00f3cio, o\u00a0<strong>Valor<\/strong>. A economia do s\u00e9culo XXI est\u00e1 cada vez mais se baseando em informa\u00e7\u00e3o, que sem d\u00favida alguma \u00e9 um diferencial competitivo para v\u00e1rios neg\u00f3cios. \u00c9 fundamental saber que tipo de dado ou informa\u00e7\u00e3o pode ser coletada e se aquilo pode gerar valor para a estrat\u00e9gia da empresa.<\/p>\n<h2 id=\"6a04\" data-selectable-paragraph=\"\"><strong>Novos neg\u00f3cios<\/strong><\/h2>\n<p id=\"67ba\" data-selectable-paragraph=\"\">A Internet das Coisas (IoT) caracteriza um cen\u00e1rio t\u00edpico de Big Data, com dispositivos conectados produzindo dados continuamente (velocidade), em formatos variados dos diversos tipos de sensores envolvidos (variedade), e acumulando massas de dados que v\u00e3o rapidamente crescendo (volume). Grande parte do valor por tr\u00e1s da IoT n\u00e3o est\u00e1 nas \u201ccoisas\u201d em si, mas sim nos dados que elas produzem e as informa\u00e7\u00f5es que podem ser obtidas a partir deles. Com a combina\u00e7\u00e3o destas duas novas tend\u00eancias \u2014 Big Data e IoT \u2014 estamos nos deparando com o surgimento de novos tipos de produtos e servi\u00e7os, al\u00e9m de uma mudan\u00e7a na pr\u00f3pria ind\u00fastria, onde o uso de dados torna-se um dos trunfos mais importantes. Novas ofertas de servi\u00e7o ent\u00e3o est\u00e3o surgindo, baseadas na an\u00e1lise cont\u00ednua de dados coletados por objetos inteligentes.<\/p>\n<p id=\"dfdb\" data-selectable-paragraph=\"\">Por exemplo, o modelo de\u00a0<em>pay-as-you-drive<\/em>\u00a0(ou\u00a0<em>pay-how-you-drive<\/em>), que come\u00e7ou sendo empregado por seguradoras de ve\u00edculos nos EUA, como a Progressive, e j\u00e1 se replica em outros lugares do mundo, promete uma tarifa mais barata para quem aderir ao servi\u00e7o. Utilizando um dispositivo espec\u00edfico conectado ao ve\u00edculo, \u00e9 poss\u00edvel coletar informa\u00e7\u00f5es como frenagem, acelera\u00e7\u00e3o e tempo de viagem, que s\u00e3o enviados atrav\u00e9s de redes 3G\/4G para um servidor da seguradora. A massa de dados gerada para cada usu\u00e1rio \u00e9 processada para analisar o estilo de dire\u00e7\u00e3o do motorista e gerar um valor personalizado do seguro que pode ser at\u00e9 30% mais barato que a tarifa convencional. N\u00e3o ser\u00e1 surpresa se esses dados forem cruzados com informa\u00e7\u00f5es de tr\u00e1fego e estat\u00edsticas de acidentes dos locais por onde o carro passou, para saber se o risco da dire\u00e7\u00e3o daquele motorista foi maior ou menor.<\/p>\n<p id=\"721e\" data-selectable-paragraph=\"\">A utiliza\u00e7\u00e3o de dispositivos da IoT junto com Big Data representa uma forte combina\u00e7\u00e3o que pode ajudar a criar solu\u00e7\u00f5es para cidades, visando servi\u00e7os mais otimizados e melhoria de qualidade de vida urbana. Dados de c\u00e2meras, medidores inteligentes de \u00e1gua, energia e de sensores de diversos prop\u00f3sitos (contagem de ve\u00edculos, condi\u00e7\u00f5es clim\u00e1ticas, detec\u00e7\u00e3o de alagamentos, etc) podem ser analisados para entender melhor a din\u00e2mica da cidade e auxiliar na identifica\u00e7\u00e3o de problemas em diversos dom\u00ednios como mobilidade urbana, defesa civil e seguran\u00e7a p\u00fablica. O nicho tecnol\u00f3gico de Smart Cities tem previs\u00f5es otimistas de alcan\u00e7ar um valor global de mercado superior um trilh\u00e3o de d\u00f3lares at\u00e9 2020, segundo a consultoria Frost &amp; Sullivan<a href=\"http:\/\/ww2.frost.com\/news\/press-releases\/frost-sullivan-global-smart-cities-market-reach-us156-trillion-2020\" target=\"_blank\" rel=\"noopener ugc nofollow\">[3]<\/a>.<\/p>\n<p id=\"be63\" data-selectable-paragraph=\"\">O Google vem crescendo nesta \u00e1rea, j\u00e1 demonstrando esse interesse atrav\u00e9s da compra do Waze e recentemente pela a aquisi\u00e7\u00e3o da Urban Engines, no m\u00eas de Setembro\/2016. O Waze \u00e9 conhecido de todos, e utiliza\u00a0<em>crowdsensing<\/em>\u00a0para coletar valiosos dados de tr\u00e1fego em realtime e ajuda diariamente milh\u00f5es de motoristas em seus trajetos. J\u00e1 a Urban Engines, fundada em 2014, utiliza dados de diversas origens e formatos \u2014 smartphones, beacons, pagamentos de viagens em transporte p\u00fablico \u2014 para analisar e entender melhor o fluxo de pessoas e ve\u00edculos em cidades e fornecer servi\u00e7os para auxiliar no planejamento de mobilidade urbana.<\/p>\n<p id=\"d83b\" data-selectable-paragraph=\"\">A ind\u00fastria tamb\u00e9m est\u00e1 passando por grandes transforma\u00e7\u00f5es alavancadas pela IoT. Al\u00e9m dos benef\u00edcios diretos para os clientes atrav\u00e9s do uso desta nova onda de objetos computadorizados, as pr\u00f3prias linhas de produ\u00e7\u00e3o das ind\u00fastrias come\u00e7am a ser transformadas em equipamentos inteligentes e conectados que aumentam a efici\u00eancia operacional atrav\u00e9s de diagn\u00f3sticos em tempo real. Isso facilita reparos, diminui custos e evita paradas na produ\u00e7\u00e3o, permitindo at\u00e9 mesmo a equipamentos se ajustarem de forma aut\u00f4noma. Sensores tamb\u00e9m podem ser embutidos em produtos visando coletar dados sobre sua opera\u00e7\u00e3o. Com isso, o mesmo princ\u00edpio de manuten\u00e7\u00e3o preditiva da linha de produ\u00e7\u00e3o pode ser tamb\u00e9m aplicado em produtos para os consumidores, visando analisar e diagnosticar poss\u00edveis problemas, emitindo-se para os usu\u00e1rios alertas sobre manuten\u00e7\u00e3o. Ademais, pode-se coletar dados para se entender como o produto vem sendo utilizado, permitindo aperfei\u00e7o\u00e1-lo mais rapidamente e diminuir o ciclo de melhoria para novas vers\u00f5es do produto. A viabilidade de toda esta coleta e an\u00e1lise depende do uso de plataformas de software robustas baseadas em cloud computing para armazenamento escal\u00e1vel e processamento de tais dados.<\/p>\n<h2 id=\"6229\" data-selectable-paragraph=\"\"><strong>Processamento em\u00a0<em>batch<\/em>\u00a0ou\u00a0<em>realtime<\/em>?<\/strong><\/h2>\n<p id=\"5bbe\" data-selectable-paragraph=\"\">\u00c9 importante escolher as t\u00e9cnicas mais adequadas para extrair as informa\u00e7\u00f5es desejadas, al\u00e9m de avaliar se h\u00e1 alguma necessidade de resposta r\u00e1pida. Primeiramente, nem todo o dado coletado ser\u00e1 \u00fatil. \u00c9 importante fazer uma esp\u00e9cie de limpeza dos dados, por exemplo, eliminando duplicatas. Outro ponto importante diz respeito ao\u00a0<em>timing<\/em>. O uso de Big Data t\u00edpico iniciou-se com processamento em\u00a0<em>batch<\/em>\u00a0para se extrair informa\u00e7\u00f5es ou efetuar previs\u00f5es em cima das massas de dados adquiridas, aplicando-se t\u00e9cnicas \u00fateis para\u00a0<em>analytics<\/em>, como\u00a0<em>machine learning<\/em>.<\/p>\n<p data-selectable-paragraph=\"\">Entretanto, em cen\u00e1rios de IoT \u00e9 recorrente se analisar os dados em tempo real, \u00e0 medida em que s\u00e3o coletados, para permitir uma r\u00e1pida tomada de decis\u00e3o. Neste caso, o tratamento da informa\u00e7\u00e3o se d\u00e1 atrav\u00e9s de t\u00e9cnicas de processamento de fluxos de dados. H\u00e1 pelo menos duas estrat\u00e9gias para analisar dados neste contexto: modelar e mapear eventos que ser\u00e3o notificados quando acontecerem ou utilizar t\u00e9cnicas que descubram tend\u00eancias nos dados. Na primeira, j\u00e1 conhecemos o problema. Na segunda, queremos descobrir algo que n\u00e3o conhecemos.<\/p>\n<p id=\"8a42\" data-selectable-paragraph=\"\">Um fator cr\u00edtico a ser levado em conta \u00e9 o tempo. Dependendo do cen\u00e1rio, um atraso no processamento dos dados pode gerar informa\u00e7\u00e3o que perdeu o\u00a0<em>timing<\/em>\u00a0(ex: c\u00e1lculo de rota baseado em dados de redes sociais e de equipamentos de monitoramento de tr\u00e2nsito, diagn\u00f3stico de funcionamento de equipamento com base em dados de sensores) de sua utilidade ou levar a diferentes tipos de preju\u00edzo (ex: atraso de entregas de mercadoria, pane de um equipamento, dano \u00e0 sa\u00fade).<\/p>\n<p id=\"9e72\" data-selectable-paragraph=\"\">Al\u00e9m de produzirmos dados sobre n\u00f3s mesmos na Internet e em redes sociais, cada vez mais coisas ao nosso redor est\u00e3o se encarregando em fazer o mesmo. Duas importantes preocupa\u00e7\u00f5es que surgem em torno do uso destes dados coletados por dispositivos s\u00e3o acerca da seguran\u00e7a e privacidade. Empresas que adotam estrat\u00e9gias de coleta de dados de uso de seus produtos devem ser transparentes desde o in\u00edcio a respeito de como est\u00e1 sendo feito o armazenamento e quais dados est\u00e3o sendo lidos e transmitidos. Al\u00e9m de prover mecanismos para garantir seguran\u00e7a da informa\u00e7\u00e3o \u00e9 fundamental utilizar modelos em que seja poss\u00edvel permitir aos usu\u00e1rios optarem ou n\u00e3o pelo compartilhamento ou escolherem o que querem compartilhar.<\/p>\n<p id=\"1f19\" data-selectable-paragraph=\"\">S\u00e3o v\u00e1rios os cen\u00e1rios de uso de Big Data na Internet das Coisas e diversos aspectos devem ser levados em conta. Devemos ficar atentos a n\u00e3o apenas tratarmos do assunto como uma quest\u00e3o\u00a0<em>hype<\/em>, ou moda passageira, mas entendermos como esta combina\u00e7\u00e3o seria relevante para cada neg\u00f3cio, quais dados s\u00e3o importantes de ser coletados, como eles ser\u00e3o analisados e em quanto tempo precisam gerar resposta, dentre v\u00e1rias preocupa\u00e7\u00f5es.<\/p>\n<p data-selectable-paragraph=\"\">Ainda h\u00e1 outros aspectos n\u00e3o necessariamente ligados \u00e0 funcionalidade, mas a preocupa\u00e7\u00f5es transversais como a seguran\u00e7a dos dados e privacidade dos usu\u00e1rios. Certamente h\u00e1 um potencial de gerar mais valor e novos neg\u00f3cios com o \u201cBig Data das coisas\u201d, mas \u00e9 necess\u00e1rio trazer um olhar mais cuidadoso para aquela caixinha m\u00e1gica desenhada do slide da apresenta\u00e7\u00e3o, para sabermos como ela vai processar os dados que recebe antes de transform\u00e1-los nos almejados cifr\u00f5es.<\/p>\n<div id=\"37a4\" class=\"portlet-msg-info\" data-selectable-paragraph=\"\"><strong><em>Kiev Gama\u00a0<\/em><\/strong><em>\u00e9 professor adjunto do Centro de Inform\u00e1tica da UFPE (CIn-UFPE) e membro associado do CESAR. Obteve o doutorado em Ci\u00eancia da Computa\u00e7\u00e3o pela Universit\u00e9 de Grenoble, Fran\u00e7a, em 2011. \u00c9 pesquisador nas \u00e1reas de Engenharia de Software e Sistemas Distribu\u00eddos, aplicadas ao contexto da Internet das Coisas e Cidades Inteligentes.<\/em><\/div>\n<\/section>\n<\/article>\n<\/div>\n","protected":false},"featured_media":2404,"template":"","categories":[5],"tags":[65],"formato_insights":[],"class_list":["post-2403","insight","type-insight","status-publish","has-post-thumbnail","hentry","category-tecnologia","tag-big-data"],"acf":[],"_links":{"self":[{"href":"https:\/\/www.cesar.org.br\/painel\/wp-json\/wp\/v2\/insight\/2403","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.cesar.org.br\/painel\/wp-json\/wp\/v2\/insight"}],"about":[{"href":"https:\/\/www.cesar.org.br\/painel\/wp-json\/wp\/v2\/types\/insight"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.cesar.org.br\/painel\/wp-json\/wp\/v2\/media\/2404"}],"wp:attachment":[{"href":"https:\/\/www.cesar.org.br\/painel\/wp-json\/wp\/v2\/media?parent=2403"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.cesar.org.br\/painel\/wp-json\/wp\/v2\/categories?post=2403"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.cesar.org.br\/painel\/wp-json\/wp\/v2\/tags?post=2403"},{"taxonomy":"formato_insights","embeddable":true,"href":"https:\/\/www.cesar.org.br\/painel\/wp-json\/wp\/v2\/formato_insights?post=2403"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}