Desde que a análise de Big Data (ou Big Data Analytics) atingiu o mundo dos negócios nos anos 2000, mais e mais organizações estão ajustando suas abordagens e estratégias baseadas em dados, desde o recrutamento e seleção até o desenvolvimento de produtos. Uma pesquisa recente da Deloitte revela que 62% das empresas já usam a análise como um direcionador para decisões estratégicas e a razão é óbvia – as empresas que efetivamente aproveitam os dados que coletam, superam a concorrência. Mas o Gartner prevê que até 60% dos projetos de Big Data devem falhar. Isso significa que entender a necessidade de análise não é suficiente. É preciso coletar, armazenar e processar os dados e colocar a análise em prática de maneira eficaz e profissional. Trazer as tecnologias Blockchain para a análise de Big Data oferece benefícios consideráveis para ambas as plataformas e pode ser uma alternativa para evitar que esses projetos falhem.

Este é o quarto artigo da série sobre Blockchain. Para ler os artigos anteriores, clique nos links abaixo:

O Que é a Tecnologia Blockchain

Aplicações da Tecnologia Blockchain

Blockchain e Big Data

 

Descentralizando Aplicações para Melhorar o Big Data

A qualidade dos dados é uma grande parte do problema ao usar a análise para orientar a tomada de decisões. Alguns erros podem significar grandes equívocos no futuro. Em sistemas centralizados, todos os dados são armazenados em sua rede, mas o que acontece quando você precisa escalar? A computação em nuvem pode ser uma solução, facilitando a escalabilidade, mas criando uma nova série de desafios.

É aí que a mudança para um banco de dados e análises descentralizadas entra em cena. Como um sistema somente de anexação, a base de Blockchain, essas plataformas oferecem o potencial para garantir a qualidade dos dados em uma plataforma incrivelmente segura.

Recentemente, um consórcio de 61 bancos japoneses se uniu a uma empresa chamada Ripple para facilitar as transferências de dinheiro entre contas bancárias através de Blockchain. A principal razão para o movimento foi permitir transferências em tempo real a um custo muito baixo. Uma das razões pelas quais as transferências tradicionais em tempo real são caras é o alto volume de possíveis fatores de risco, que precisam ser mitigados. O double spending (uma falha de transação que usa o mesmo token de segurança duas vezes) é um problema real nas transferências em tempo real. A tecnologia Blockchain evita amplamente esse risco, entre diversos outros. O Big Data Analytics possibilita identificar padrões de gastos do consumidor e identificar transações arriscadas muito mais rapidamente do que a tecnologia atual. Isso pode reduzir significativamente o custo das transações em tempo real.

Fora do sistema bancário, a principal força motriz por trás da introdução da tecnologia Blockchain é a segurança. Na área de saúde, varejo e administração pública, as empresas começaram a usar Blockchain para analisar dados, impedir invasões e vazamento de dados. Na área da saúde, tecnologia de Blockchain pode ser usada para garantir que várias “assinaturas” sejam verificadas em cada nível de acesso a dados. Isso pode impedir uma repetição de ataques de hackers, como em 2015 (leia aqui), que resultou no roubo de mais de 100 milhões de registros de pacientes.

Blockchain está atualmente se desenvolvendo como um tipo de técnica de autenticação universal para resolver um dos maiores problemas das operações via internet: segurança!

Vale ressaltar que isso não tem relação com mineração de Bitcoins. Não confunda. Bitcoin é uma criptomoeda, cujas transações são realizadas em uma Blockchain. No curso Inteligência Artificial Aplicada a Finanças – Fintechs e Blockchain, os alunos vão aprender a criar uma Blockchain privada que pode ser usada em aplicações descentralizadas.

 

Análise em Tempo Real

Até agora, a detecção de fraudes em tempo real era apenas um sonho e os bancos sempre usaram a tecnologia para identificar transações fraudulentas. Como Blockchain contém uma entrada de banco de dados para cada transação, as instituições podem procurar padrões em tempo real, conforme necessário. Empresas como a Chainalytics e a Skry usam essa inteligência em tempo real para detectar anomalias precoces ou quase em tempo real.

A tecnologia Blockchain melhora a transparência na análise de dados. Ao contrário de outros algoritmos, Blockchain rejeita qualquer entrada que não possa ser verificada e seja considerada suspeita.

 

O Que Significa Crowd Analytics para Ecossistemas de Blockchain?

A Internet 2.0, que é uma descrição comumente usada para Blockchain, vem trazendo mais um conceito interessante, chamado Crowd Analytics (em uma tradução livre, algo como “análise com apoio da multidão”), para ilustrar como podemos usar o poder da rede para criptografia, capacidade de computação, conectividade e escala. O grande desafio no caminho desse movimento é o problema de escalabilidade. Com 20 bilhões de dispositivos conectados com probabilidade de chegar ao mercado em 2020, o armazenamento e o gerenciamento de dados são uma questão cada vez mais importante.

Para uma melhor análise de Big Data, as empresas precisam acessar o armazenamento de dados de forma escalonável e com segurança. e para tentar resolver esta equação, a rede Ethereum começou a testar sua rede de armazenamento Swarm, uma plataforma de armazenamento distribuído e uma rede de distribuição de conteúdo. Mas Blockchain só pode funcionar para análises, se bancos de dados descentralizados se tornarem parte do arsenal e é por isso que os conceitos de Swarming e Sharding são tão importantes para o futuro da análise.

 

Mas o que é Swarming?

Pense na tecnologia Swarm como gerenciadores de dados. Essa camada rastreará onde todas as informações são armazenadas para reduzir a latência e tornar uma base de dados descentralizada uma possibilidade real. A tecnologia Swarm baseia-se na ideia relativamente simples de que pequenas ações individuais podem ter um impacto direto no todo maior. A tecnologia Swarm é construída com base no princípio de que dispositivos simples seguindo regras simples podem gerar soluções surpreendentemente eficientes quando os dados são incorporados a um Swarm. A Unanimous AI, uma startup de Inteligência Artificial, já está usando tecnologia SWARM, usando o conceito de “Crowd Analytics” controlada por algoritmos para gerar previsões com alto nível de precisão, o objetivo de toda a tecnologia de análise.

 

E quanto ao Sharding?

O sharding ocorre quando um banco de dados é particionado logicamente, de modo que nem todas as informações precisam ser armazenadas no ledger da Blockchain. Aplicativos descentralizados (DApps) podem acessar as informações armazenadas usando uma chave de partição. Basicamente, o sharding é uma maneira de armazenar dados em várias máquinas (o conceito de Sharding é estudado em um dos cursos da Formação Cientista de Dados, o curso de Engenharia de Dados com Hadoop e Spark e demonstrado no banco de dados NoSQL Apache HBase).

O que torna esse modelo de arquitetura banco de dados tão importante para descentralizar bancos de dados é simples – a capacidade de dividir a carga ao executar consultas. Manter os tempos de transação baixos também significa manter os tamanhos do banco de dados gerenciáveis, o que parece incompatível com o crescente número de pontos de dados necessários para a análise de Big Data. O sharding separa instâncias em diferentes partições, portanto, uma pesquisa é executada apenas em uma pequena parte do banco de dados. Essa eficiência adicional significa que a quantidade de dados não importa, desde que o Swarm esteja efetivamente liderando o caminho para o fragmento armazenado correto. A rede Ethereum já está trabalhando em um modelo de sharding para adicionar escalabilidade à segurança e descentralização já oferecidas pela plataforma.

 

Prós e contras da Descentralização do Banco de Dados

Mover grandes volumes de dados de instalações de armazenamento centralizadas para uma rede descentralizada tem um benefício instantâneo e enorme: maior segurança. Em um mundo onde as violações de dados são anunciadas com regularidade angustiante, armazenar dados pessoais para milhões de pessoas em um único lugar é mais ou menos como colocar uma placa com a frase “pode hackear aqui”. Centros de dados centralizados rapidamente se tornaram o padrão, mas também aumentaram o risco potencial. E coletar Big Data também significa coletar grandes riscos e é por isso que um banco de dados descentralizado é tão importante para as empresas que desejam usar análise de dados para sustentar suas estratégias. A construção de uma aplicação descentralizada passa pelo uso de um banco de dados descentralizado.

Com dezenas de startups surgindo neste espaço é impossível prever com precisão quais ainda estarão ativas daqui a um ano, muito menos em uma década (é bem provável que em pouco tempo sejam adquiridas por grandes players como Microsoft, IBM, Oracle, SAP ou Amazon). Aqui estão algumas das empresas que estão lançando suas versões atuais de um banco de dados descentralizado para dar suporte a uma melhor análise de Big Data.

BigchainDBEsta solução corporativa é um banco de dados baseado em Blockchain para fornecer integridade de dados sólida, baixa latência e controles descentralizados.

FlureeDBBanco de dados de alta velocidade e escalável, baseado claro em Blockchain, que use conceitos de GraphDB e DocumentDB, duas importantes categorias de banco de dados NoSQL.

BluzellePermite não apenas coletar e armazenar dados, mas também monetizar todos os pontos de dados como uma plataforma de banco de dados Blockchain descentralizada.

Big Data BlockOferece análises de Big Data descentralizadas combinando software de código aberto que conecta redes massivas de computadores.

Embora seja impossível prever quais dessas empresas acabarão na vanguarda do Big Data Analytics, está claro que os bancos de dados descentralizados estão prontos para suportar suas funções de negócios, como análises. Processe mais dados, com mais segurança e mais rápido do que nunca e use-os para alimentar os mecanismos de análise dos negócios para tomada de decisão.

 

E se fosse possível aprender a construir aplicações descentralizadas com Blockchain, para a área financeira? Tudo 100% em português e 100% online, com conteúdo do básico ao avançado, suporte em até 24 horas e networking com uma comunidade de alunos de alto nível? Clique no link abaixo e confira:

 

Formação Engenheiro Blockchain

 

Referências:

Big Data e as Oportunidades com Blockchain

Organizing Analytics — From the inside out

How a Decentralised Ecosystem Will Change Big Data Analytics

Ripple develops blockchain-powered payment app with 61 banks to speed up transactions in Japan

Ripple Develops Blockchain Payments App With 61 Japanese Banks