Compartilhe este artigo

O problema dos dados do Blockchain pode ser maior do que você pensa

Alguns pontos de dados do Bitcoin parecem fáceis de medir, mas cuidado, há mais nuances nesses números do que você imagina.

Um dado direto: o fornecimento total de Bitcoin atingiu 17 milhões.

Mas como acontece com a maioria das coisas em Cripto, T foi tão simples.

A História Continua abaixo
Não perca outra história.Inscreva-se na Newsletter Crypto Long & Short hoje. Ver Todas as Newsletters

A cada 10 minutos, mais ou menos, os mineradores encontram um bloco de transações e a rede adiciona 12,5 novos Bitcoin ao suprimento total como recompensa para os descobridores. E cada recompensa foi registrada no blockchain desde que o Bitcoin foi lançado no início de 2009.

Como tal, parecia um número –um marco– a indústria podia confiar.

Mas enquanto alguns comemoraram quando a marca foi atingida no site do provedor de dados de Bitcoin Blockchain, outros foram ao Twitter para estragar a festa.

Jameson Lopp, engenheiro da Casa e criador do Statoshi.info, outro site de dados de Bitcoin de acesso público, tweetou:

"Hoje eu aprendi que muitas fontes de dados estão relatando incorretamente o fornecimento total de Bitcoin . Na verdade, ainda T atingimos 17 milhões de BTC ."

A alegação de Lopp era que o Blockchain.info, uma das fontes mais populares e respeitadas de dados de rede blockchain, entre outras, não havia contabilizado casos em que os mineradores de Bitcoin , devido a bugs e outras causas, não reivindicousua recompensa de bloco total.

Infelizmente, essas discrepâncias na métrica de fornecimento total de Bitcoin não são exceção, mas parte de um problema maior que decorre das metodologias "opacas" que esses provedores de análise de dados de blockchain usam, de acordo com Greg Cipolaro, CEO da Digital Asset Research (DAR), uma empresa que fornece análises de blockchain para clientes.

Como tal, o DAR partiu em uma missão para descobrir os métodos do Blockchain para o que ele chama de "um dos mistérios mais antigos na comunidade de Criptomoeda " - o bitcoin valor estimado da transação. No relatório da empresa sobre o assunto,publicado recentemente, O DAR disse que o Blockchain superestimou os valores das transações de outubro a fevereiro de 2017 e os subestimou desde então.

Executivos da Blockchain não estavam disponíveis para entrevista antes do fechamento desta edição.

Mas não é só Blockchain. Cipolaro citou a remoção (sem aviso) de janeiro pela CoinMarketCapDados de câmbio da Coreia do Sul do seu índice de preços. Como os preços das Criptomoeda nas bolsas sul-coreanas tendem a ser mais altos, a expulsão fez parecer que os Mercados de Cripto estavam quebrando.

Seguiu-se uma venda em pânico, desencadeando o que Cipolaro chamou de "um mini-flash crash".

Para ser justo, porém, os Cotações de preços sempre envolvem decisões subjetivas. Isso é verdade não apenas para criptomoedas, mas também para o mercado de ações. No entanto, sem insights sobre como o preço e outras métricas são obtidos, a comunidade de Criptomoeda pode sofrer. Dados precisos são extremamente importantes para investidores, comerciantes, usuários, desenvolvedores, acadêmicos, jornalistas – basicamente todos.

Um problema multicamadas

Ainda assim, muitas pessoas que dependem de dados públicos de blockchain T percebem o quão falhos alguns desses dados são.

Oferecendo uma perspectiva sombria sobre o amplo estado da análise de blockchain hoje, Stefan Richter, um cientista da computação que cofundou o provedor de dados BitcoinPrivacy, disse ao CoinDesk:

"É claro que há bugs de software em provavelmente todos os exploradores por aí."

E Cipolaro repetiu isso, dizendo: "Isso não é algo que você notaria a menos que passasse os dias olhando para isso."

Felizmente, alguns entusiastas do setor perceberam.

Lopp, por ONE, é um caçador de dados de Criptomoeda . Ele apontou a contagem de nós de Bitcoin , um número frequentemente citado como uma medida da descentralização e saúde da rede, como uma métrica particularmente exigente.

"Eu frequentemente ouço as pessoas dizerem que há apenas 10.000 nós de Bitcoin ", disse Lopp. Mas a fonte desse número, Nós de bits, "conta apenas nós alcançáveis que aceitam conexões de entrada."

Addy Yeow, o criador do Bitnodes, confirmou que o site conta apenas nós "de escuta".

Como tal, o número total de nós poderia ser muito maior, de acordo com Lopp. De fato,uma estimativacoloca os nós de escuta e não escuta em quase 140.000.

E embora Yeow concorde, ele adverte que adicionar nós não ouvintes à métrica exigiria fazer suposições importantes. Ele explicou que as fontes de dados que contam nós não ouvintes estão, na verdade, participando de um jogo de adivinhação. Os nós que T estão ouvindo ainda podem estar conectados, mas atrás de um firewall, por exemplo. Alternativamente, eles podem ter alterado os endereços IP ou podem ter se desconectado completamente.

Os provedores de análise que levam em conta nós não ouvintes usam uma fórmula que leva em conta o número de dias em que os nós ficaram sem escuta, em um esforço para contá-los, mas quanto mais nós invisíveis, mas conectados, eles capturam, mais nós desconectados eles incluem erroneamente.

Chegando lá

Devido aos problemas com conjuntos de dados públicos, muitos profissionais de dados de blockchain evitam usá-los e, em vez disso, usam dados que calculam internamente sempre que possível.

A Chainalysis, uma empresa que analisa dados de blockchain para clientes, incluindo o US Internal Revenue Service (IRS), certamente é cética. Kimberley Grauer, economista-chefe da Chainalysis, disse que prefere usar dados internos porque, "Eu sei onde estão os erros; Eu sei onde estão as vulnerabilidades." Cipolaro, da DAR, ecoou isso, dizendo ao CoinDesk que a empresa executa seu próprio código, coletando dados de seu próprio nó de Bitcoin .

Ainda assim, apesar de suas deficiências, Cipolaro faz grandes elogios aos sites gratuitos que disponibilizam dados de Bitcoin ao público.

"Eles fornecem uma boa fonte de informações de alta qualidade", disse ele.

E é óbvio que essas empresas estão tentando. Quando umerro no serviço web do Blockchain fez parecer (incorretamente) que o fundador do Bitcoin, Satoshi Nakamoto, havia movido algumas moedas, a empresa fixoo problema.

Certos problemas devem ser fáceis de consertar. Grauer apontou que os exploradores de blocos frequentemente negligenciam a anotação de fusos horários, e eles T usam todos o ONE. Embora isso não seja estritamente errado, causa confusão.

"Basta comparar blockchain.info com BTC.com!", disse Grauer. (Fizemos isso: o bloco 520672 foi minerado às 23:18 em30 de abrilou 03:18 em1 de maio. Não há nenhuma indicação de qual fuso horário cada site está usando.)

Outros conjuntos de dados T serão tão fáceis de limpar. Embora o blockchain do Bitcoin possa ser totalmente público para todos verem, o maneira complicada em que as transações são realizadas significa que medir seu valor pode ser um grande desafio. Nem mesmo o DAR afirma que seu novo método é perfeitamente preciso.

"Essa provavelmente não será a última melhoria que faremos", disse a empresa em seu relatório.

Por enquanto, a comunidade precisará se lembrar do antigo provérbio russo, reaproveitado pelos cypherpunks:

"T confie, verifique."

Bingoimagem via Shutterstock

Picture of CoinDesk author David Floyd