币公开课第42期挖掘链上数据的价值

币市行情 1年前 (2021) nav123
108 0

币公开课,由币财经主办,定位联合行业头部企业一起打造行业最全最专业的知识共享平台。课程将以社群分享、线上直播、全网直播的方式打造行业最具影响力的线上栏目,累积100期课程,10万以上社群覆盖,千万级内容展现。

第42期课程币财经与OKLink联合出品,邀请OKLink产品副总裁张超担任本期讲师,为大家讲解区块浏览器的背后:挖掘链上数据的价值。

张超,现任OKLink 产品副总裁,全面负责OKLink 各业务线产品。张先生毕业于北京大学硕士研究生,曾担任阿里巴巴产品经理、蚂蚁金服产品经理,曾负责蚂蚁财富市场端基金、基金推荐类与中港互认基金等产品的研发,是蚂蚁聚宝最早的产品经理之一。

以下为课程详情:

一、如何通过区块链浏览器获取链上数据

区块链以其可信任性、安全性和不可篡改性,可以让更多数据被解放出来。而链上数据就是写到区块链上的数据,它是一种结构化数据,形式比较复杂。这些数据是很有用的,但是如何获取这些数据,我们就需要借助一下区块链浏览器这类工具。

举个例子,BTC从第一个块起,到现在有了几十亿笔交易。那么谁还记着最早的块,和第一笔交易呢?

我们打开oklink.com  或者 okcoin.com  浏览器  可以看下。

这就是当年,中本聪先生挖出的第一个块,第一个交易地址 和第一笔比特币的转账

我们再去查看一下这个11年前的地址,至今也是活跃的

当然很多的比特币信仰者  就是拿着这个地址在说:  “看中本聪,还活着,第一比特币的交易地址还在转账”

举这个例子就是在表达,区块链浏览器是什么。

所谓区块链浏览器,是指提供用户浏览与查询区块链所有信息的工具,是链上数据可视化的一个窗口。通过区块浏览器,我们可以搜索到交易记录,查询转账进度,也可以通过查询钱包地址来获得该地址下的余额、交易详情等信息。除了这些基本信息,大部分区块浏览器还提供可视化的统计信息图表。

值得注意的是,每一条区块链都有自己的区块链浏览器,如比特币有比特币区块链浏览器,以太坊有以太坊区块链浏览器,区块链浏览器不可以跨链查询。

目前我们提供了最主流的几条公链的浏览器

OKLink的ETH浏览器也会在近期发布。

这样讲概念性的东西可能会比较笼统,以OKLink区块链浏览器为例,我来教大家如何使用区块链浏览器获取链上数据。

首先打开OKLink(www.oklink.com),就可以看到一个搜索框,输入地址/交易/区块高度任一信息,点击搜索就可以进入到区块链浏览器页面。

我们以BTC为例,进行信息查询。可以看到,每一个区块首先会有一个区块号。其次,BTC区块数据还包括当前区块的基本信息,例如当前区块的哈希值,前一个区块的哈希值,当前区块的时间戳以及当前区块所包含的交易笔数等。

然后就是区块里的每笔交易的详细信息,这里包括交易哈希,转入地址,转出地址,转账金额等信息。需要说明的是,由于比特币采用的是UTXO模型,它的交易可能包含多个转入地址和多个转出地址。但是如果是以太坊这样采用账户模型的区块链,就只会有一个转入地址和一个转出地址。

回到BTC的链上数据查询,在交易栏里,可以看到多笔该区块所打包等交易。其中,左边是付款地址,右边的是接收地址。在付款地址的上方,还有一长串的字符“2dca4061ed9b3be552eab7f124f2b73bde62e50e438fb2dd2df6069416456044

”,点击这串字符(哈希值),可以看到这笔交易的详细记录。

这样的方法适合直接查询某个直观、具体的数据。另外,主流区块链浏览器都会提供有数据统计与分析版块。依旧打开OKLink,可以在进入官网之后,在首页顶端点击浏览器,选择想要查询的币种,下拉页面之后可以看到更多的统计信息,包括富豪榜、链上活跃地址数等,当然,之后我们还会完善统计分析这部分内容,提供更多数据,大家可以关注一下。

至于链上数据的数据量,就取决于区块链本身的活跃度以及所采用的共识机制。比特币的共识算法是工作量证明,大约10分钟产出一个区块,当前每个区块大小约为1MB,一天时间比特币区块链就会增加144MB的数据;以太坊大概一分钟出一个区块,当前每个区块约20KB,因此,以太坊一天会增加约173MB的数据。

与区块链相关的还有其他形式的数据,例如,加密货币的交易行情数据、白皮书数据等。交易行情数据都是时间序列数据,包括K线,市场深度,历史逐笔成交等。交易数据的数据结构相对简单,但是粒度更细。而区块链项目里的白皮书、社群里的舆情是非结构化数据,需要用到自然语言处理技术来进行分析。这些不属于我们今天讨论的链上数据的范围。

对于小白用户,知道怎么查询区块链浏览器上面的数据信息已经足够了,你打币给别人,别人不承认,你就可以从浏览器上面,通过哈希值或者打币地址,把这一笔交易的所有情况看的清清楚楚,是网络不通畅,还是那个人拒不承认,都是可以说清楚的。

这也是区块链链上信息,经过区块确认,全网广播,不可篡改的精髓所在。

二、链上数据的分析方法

区块链提供的只是账本的完整性,而大数据则具备海量数据存储技术和灵活高效的分析技术,能够极大提升数据的价值和使用空间。二者的结合,即链上数据分析,这可以说是一个相对比较新的技术领域。

从技术上讲,是有一定难度的,主要体现在数据量的处理,我来简单介绍一下链上数据分析的一些基本步骤。要做链上数据分析,首先第一步是要获取数据。现在基本上每一个主流区块链都有自己的区块链数据浏览器。有些浏览器也提供数据的API接口,可以直接通过调用接口来获取数据。但是这些网站通常有访问限制且访问速度比较慢,如果需要爬取大量数据就比较困难。

给大家分享一个完整而系统地获取链上数据的方法:搭建一个区块链全节点,通过访问本地的全节点获取并解析链上数据,再将清洗好的数据落入数据库。不过这种方式成本较高,用这种方法需要多台高性能服务器组成的集群,海量的数据还要求我们有大量的存储空间,再者,技术门槛也是难倒很多人的一个事情。因此,对于个人获取数据,我更推荐使用区块链浏览器。

浏览器的数据主要体现在  数据的及时性 、全面性与准确性。

数据准确性:区块链的数据,不仅有区块和交易这样的基础数据,还有地址余额/utxo等状态数据,基础数据可以直接从区块链节点获取,地址余额等状态数据需要根据区块基础数据进行计算,在每个区块处理的过程中,要保证数据的一致性和准确性。

基础数据和状态数据,我们使用了不同的存储,基础数据使用文档数据库存储,状态数据采用关系型数据库存储,使用关系型数据库存储的原因是使用数据库的事务特性,保证状态数据存储的一致性。

数据实时性:BTC的一个区块,区块体积较大,最近平均的区块大小约1.3M,交易的数量基本在2000-3000之间,监听到一个新的区块产生之后,会对区块进行解析,获取区块的所有交易,并计算相关的状态信息后,再进行数据的存储,区块处理的逻辑比较复杂。

为了第一时间将区块信息推送给客户,我们设计并验证了很多方案,采用了本地存储/本地缓存/分片存储/预处理等多种技术结合的方式,提高区块处理的速度。

里面更多的技术细节就不给大家一一介绍了。

这是获取数据,在使用区块链浏览器完成数据的获取之后,第二步我们来给地址打标签。区块链的匿名性导致我们并不能直接了解到字符背后,财富的持有者的真实身份。做链上数据分析,最希望挖掘的信息就是地址间的关联。所以我们首先要做的是尽可能的找到更多的线索。

给地址打标签一般有多种方法,这里我介绍一下比较简单的两种。其中,最简单的方法是从一些公开的数据源获取,比如基金会捐款地址或者是项目方地址等都可以直接获取地址信息。其次,我们可以通过充提币来获取地址标签。当我们进行充提操作时,就可以根据交易所提供的地址追溯到热钱包地址甚至冷钱包地址。

完成获取数据、地址标签两个步骤后,就可以进一步做数据分析或运用了。比如,我们可以通过这种方法去做链上资金的流向监控,大额转账的预警等。

其实,大部分加密货币是通过公链上透明的网络活动开发出来的,这也就意味着,有丰富的信息可供参考、解析和挖掘。包括普通用户在内,我们可以通过搜集这些数据信息,譬如网络规模、健康度和安全性能等来进行甄别一个项目是否值得我们去投资。

链上数据有大量的信息需要我们去发掘和消化。举例来说,链上交易量、平均交易费用、网络哈希率、活跃地址、通胀率、区块大小和挖矿难度等参数,可以帮助我们更多了解具体区块链网络的详细情况。

再就是,你也可以通过了解不同交易所的链上地址的出入金情况,了解到交易所的硬实力,毕竟在交易所内部刷交易量是很难界定的,但是链上的流入流出是公开透明的。

现在比较流行的说法是,区块链+金融被称作新金融领域。那在传统金融领域,比率分析是最为广泛使用的评估方式之一。加密货币领域也出现了一项关于加密经济比率分析的新研究。最广为人知的比率分析方法之一是Network Value to Transactions(简称NVT)。由Chris Burniske,Willy Woo和Coinmetrics及旗下优秀的计量团队提出和推广,NVT通常被称为“加密货币市盈率”。该比率的定义为:NVT=总市值/每日链上交易量。

NVT的方法虽然在加密货币社区广受欢迎,但这一方法只考虑了链上交易的总量,没有考虑到交易数量以及参与交易的钱包地址数量。参与交易的钱包地址数量我们也叫每日活跃地址。链上数据分析的重点与难点也是在挖掘账户/地址之间的关联关系。接下来我们OKLink也会重点更新统计功能,展现更多链上数据,为用户投资行为提供参考。

三、减产前后,主流币的链上数据统计与对比

今年最热的话题当属“减产”,包括市值第一的比特币之内的多种加密货币都将在今年减产。通过浏览器去进行一些数据分析,指引用户进行市场分析把握投资时机,这完全是可实现的。比如,我们可以关注一下链上的大额异动,通过关注这些巨鲸交易的动向,来推测市场的走向。当然也还有很多其他的指标,比如交易所链上的流入流出,甚至是还没有被定义的更有代表性的指标,这些都会是我们在区块链大数据领域探索的方向。

除了关注巨鲸交易的动向,我们还可以关注一下活跃地址数、链上交易量等统计数据。其中,“链上交易量”这一数据用在了很多加密货币估值方法里,作为指定加密资产网络效用的评估指标。换句话说,“链上交易量”可以用来判断某个指定加密资产是否正在被实际使用。

根据OKLink的信息,我们统计了上半年三大减半币种BTC、BCH、BSV的活跃地址数与链上交易数据。可以看到,虽然都将迎来减半,BTC的活跃地址数在过去的一个月里依旧稳居第一。此外,BCH的链上交易量遥遥领先。这样,我们就可以推断出,目前市场中的主力交易者以做多为主,正在囤积大量BCH,因此才会出现链上交易量激增。

https://www.oklink.com/btc

这是BCH的活跃地址数,可以看到出现了一个峰值。那有心人就会去找原因。

2月18号北京时间12点,BCH活跃地址数在小幅增长之后达到近三日峰值,结合BCH的价格来看,活跃地址数大幅在到达一个数值后迅速下跌,而价格曲线也呈现了同样的趋势。可以看到,链上数据对投资策略起到了一定的参考作用。

四、链上数据在加密货币投资中的应用

当前的链上数据,绝大部分都是交易和投资为目的产生的,链上的资金不是直接转入了交易所就是在去交易所的路上。区块浏览器提供的信息比较大而全,数据分析功能往往要视各个不同产品是否提供统计图表。

链上数据分析的重点与难点是挖掘账户/地址之间的关联关系。以BTC为例,首先我们需要从链上交易数据中统计出每日的活跃地址数,然后拿到对应时间的BTC市值,通过做对数-线性拟合建立比特币市值和活跃地址数之间的关系。按照这样的方法,我们就可以用模型对不同币种进行估值。当市值高于估值时,说明币种价值被高估,这就可以给投资加密货币提供一定的参考。

除此之外,我想说一下通常情况下两股左右市场的力量:做多交易者和做空交易者。

做多交易者通过低价买入高价卖出完成获利。当市场情绪从熊向牛开始悄然发生转变时,做多交易者便会在现货市场买入大量筹码。比起短期的价格波动,做多交易者们希望在较长时间过后,投资资产出现成倍数的增长,因此较少关注盘面,操作也不太频繁。

做空交易者通过高价卖出低价买入,增加筹码持有量获利。做空交易者一般会通过合约和杠杆的方式,从价格的下跌中获利后,套现离场。

可以说这两股力量左右着市场走向,那我们如何从链上数据获取这两种交易者的交易意愿呢?一般来说,当市场由牛转熊时,主力交易者选择把之前囤积的BTC转入市场中进行抛售。越来越少的人愿意囤积BTC,这时候链上交易量将会下降至新的低位。

而当市场价格开始横盘时,市场的主流情绪开始从做空变为做多。做多交易者会囤积大量筹码,大家纷纷把自己囤积的BTC转入私人钱包中,因此就会出现链上交易量整体抬升。由此也可以看出,链上交易量这一数据的重要性。

很多的数据是需要用户自己去挖掘时用的,类似在二级市场大家有wind,有彭博社、有路透、C端有同花顺,OKLink也在开放数据权限,因为我们跑了全节点数据,可以通过API的形式,给很多的B端,无论是钱包还是一些策略交易库去使用。

很多专业的交易策略者,会把数据使用的淋漓尽致,不过大家还是要有风险意识与自己的判断力,把控好风险。毕竟数字货币市场比传统的股票市场风险更大。

五、链上数据的未来应用

目前的主流区块链浏览器都是以查询链上信息为主,当然,查询只是浏览器的最基本功能,在这基础之上,链上数据还可以用来做一些链上追赃和反洗钱的工作。与此同时,我们OKLink也在不断地探索,如何将行业上下游数据和区块链链上数据结合起来,为广大的投资者、B端用户提供数据服务。

近期行业的一个大事件,就是巨鲸用户丢币。在链上,任何交易都是可追踪的。比如,这次被盗的巨鲸账户比特币地址为:1Edu4yBtfAKwGGsQSa45euTSAG6A2Zbone。结合媒体披露的信息,我们可以确定,黑客是通过两笔额度为1500个BTC和47个BTC的交易将资产转移的。

打开OKLink(www.oklink.com),搜索这笔金额为1500BTC的交易哈希,我们可以看到BTC的流向,OKLink在这里提供了一个比较实用的小功能,点击输入地址右侧的箭头,我们就可以追溯这笔UTXO(资金)的流向。

交易哈希为:

85da64eda91b031e7a628cd145bfe6a6ece731b2bacffceb8c76c592a80ee7e0

通过追溯,我们发现黑客不断的将BTC转移至更多的其他地址,这实际上是一个拆分的过程,会给这次丢币时间的追回工作带来更多困难,最终被拆分的币会逐步流向交易所来进行套现。

以上是使用OKLink对盗币时间进行追踪还原的一个过程。对于事件的进展,目前已知的消息是被盗的比特币已经有一部分流入了交易所。

对于未来的一些追币行为,其实就是通过这种路径来追踪的,如果还有KYC或者地址标签的信息,那么就有可能追币成功。

通常我们讲,发生盗币行为,通过发动全网算力回滚数据不现实,也不可行,那么通过链上追踪与地址标签相结合可能是唯一的有效办法

以上是区块链链上数据未来应用之一的一个举例。区块链在垂直领域已经逐步有一些项目在落地。在未来的解决方案中,区块链技术同5G、IoT(物联网)、人工智能、大数据等技术统筹使用,共同作为信息化的基础设设施,才能发挥最大价值。链上数据也将会有更广阔的应用前景。

OKLink提供的功能目前主要是聚焦在高性能的链上数据查询功能上,我们支持BTC、LTC等六种主流的公链,未来这个数字还会增加。除此之外,我们其实还提供了一些对于小白用户比较友好的功能,比如我们的“学院”模块。这是我们提供给刚入门的用户的一个学习的功能。用户可以去了解用户的一些基本原理和行业的动态。未来我们会支持更多区块链大数据分析的功能。另外对于B端用户来说,也会提供丰富的数据支持,我们拥有多条主链的全部区块数据,可服务其他的钱包、浏览器、交易所等B端用户。OKLink在区块链、大数据技术上经验丰富,未来希望能同更多应用场景合作,提供技术上的支持,探索并推进区块链在更多垂直行业的落地。

今天的分享就到此结束,谢谢大家。

版权声明:nav123 发表于 2021-05-22 13:54:53。
转载请注明:币公开课第42期挖掘链上数据的价值 | 币导航-币导航链接虚拟币世界

暂无评论

暂无评论...