Telegram Channel
记录和分享有趣的信息。

Record and share interesting information.

contact: [email protected]
https://youtu.be/xi4ijRWH5Hs?si=tT1MCtKzYwcRdADP

'The Panama Papers' 这部纪录片讲述事件背后的记者的故事。

自2016年4月3日,一名自称 John Doe 的爆料人向德国记者 Bastian Obermayer 传输了大量文件,这些文件是巴拿马著名律所 Mossack Fonseca 的内部文件,包含了大量世界名流委托该公司开设离岸公司(offshore)进行非法贿赂、洗钱和避税的内幕。

Bastian 简单翻阅了一下后感觉事态重大,他没有选择独吞这批材料做私家报道,而是决定通过联系国际调查记者组织(International Consortium of Investigative Journalists, ICIJ)共享了所有文件,并组建了一批包含来自世界各地数百名调查记者的秘密调查团,由各国的调查记者负责本国的政要名流进行深入挖掘和报道。数百人进行高效密切地合作,同时还严守了秘密,堪称人类新闻史上的一次奇迹。

给我最大的感触就是,西方社会有着悠久而且成熟的社会组织结构和方式,无论想做任何事情都可以找到合适的组织和专业人员。相较而言,中国的社会趋于原子化,政府之下皆散沙,遇到任何事情都只能寄希望于从上至下的关注,民间的组织能力和社会成熟度始终停留在一个非常幼稚低级被高度领导的状态。
https://laisky.notion.site/Critiquing-DePIN-False-Hope-or-Real-Dawn-by-Rui-S-Feb-2024-Medium-05d6fafab8a34e4ea1c73665dd1bd799?pvs=4

一篇对分布式物理基础设施网络(Decentralized Physical Infrastructure Networks,DePIN)的综述文章。

DePIN 试图用区块链来管理如存储、5G、GPU 等物理基础设施服务。但是基础设施极为复杂,具体的实现和定价逻辑往往都是 off-chain 的,很多 DePIN 项目仅仅是将交易上链。而且基础设施往往面临地区性的监管,使得 DePIN 全球化的故事实际上很难落地。

另一个问题是,通过空投可以短期内吸引大量矿工导致供给和货币通胀,但是真实需求却很难提高。此外基础设施往往对性能敏感,这在分布式领域很难实现。

最后提供了一个 DePIN 项目的定价模型,可供参考。

最近还调研了一个 DePIN 项目 io.net,主要的故事就是废弃矿场分享自己配置有高速网络和显卡的机房,为用户提供廉价的 GPU 服务。目前以空投为诱饵,已经吸引了大量的矿工算力接入,从控制台上可以看出需求估计是严重不足的。它目前的计价模式是以周为单位租用设备,根据所选择的硬件、区域和带宽质量,以美元计价。矿工以本地运行 docker container 的方式接受任务调度,调度器会监控 GPU 硬件的工作状态,确保独占硬件,否则会惩罚矿工。 #blockchain
https://sentry.io/ 真是个好东西啊,上次用还是差不多十年前,那时候用来记录后台错误日志。没想到现在已经这么强大了,前端项目一行 js 就可以集成,然后自动捕捉异常,甚至还能捕捉异常用户的操作行为(所有文本都会打码,不会泄露用户隐私),太实用了。
https://laisky.notion.site/solana-Tower-BFT-0a519e548d114e4db0dee0c2f332e2be

学习了一下 solana 的 Proof of History(PoH),在解决 Byzantine Fault Tolerance(BFT) 的同时还可以实现 65000 tps。

感觉结构有点 RAFT 的感觉,每轮都会选择一个 leader validator,然后这个中心化的 leader validator 将尽可能多的交易打包,每 400ms 生成一个区块(slot)。

每个 validator 都会为这个 slot 背书,并生成一个 lockout/timeout,这个 timeout 表明 validator 在这个时间内都会支持该 slot 为主 fork 的一员,并且不会改投其他 fork。timeout 以 slot(400ms)为单位,初始值为 2。

每当 validator 生成了一个新的 slot,而且如果新的 slot 的 timeout 和老 slot 的一致,那么就将老 slot 的 timeout 翻倍。如果当前 validator 维护的链中有一个老 slot 的 timeout 达到了 32,那么就认为这个 slot 已经固化,可以将其移出 validator 当前维护的提交链,并发放奖励。

形象地说,validator 就像是在努力地堆塔,每次都试图在旧塔过期前从塔底塞进去一个新的 slot,如果成功在过期前将塔堆到了第五层(timeout 达到 32),那么塔顶的 slot 就成功固化并赢得奖励。所以这一算法也被称为 tower vote,或 tower BFT。

它的性能主要来自 leader validator 可以不需要 peers communication,就专注于打包区块,而其他 validator 可以并行地验证,从而大幅度提高了整个网络的吞吐量。

还没看完就被抓去干其他事了,所以此处仅记录一下 tower BFT 的笔记。 #blockchain
美军军事占领阿富汗期间,一批为美军工作的阿富汗翻译和美军士兵之间的故事。在塔利班人看来,这些翻译背叛了自己的祖国。但是行事极端的塔利班也并不受所有的阿富汗人欢迎。

本片就讲述了一位阿富汗翻译历经千辛万苦救助了一位落单美军士兵,自己却身陷塔利班的通缉和搜捕,最终这位美军士兵通过私人武装公司重返阿富汗营救这位翻译的故事。片名 'The Covenant' 预示着片中多次出现的“契约”或“人情债”,坚毅的人们不计得失地选择尊重这些债务,并且努力使其偿还。片中有一句台词很得我心:

"That is not how this debt works.
It demands a result, not an appeasement.
There is a hook in me."


内容有点接近于 'Lone Survivor',都是美军被暴揍然后被普通阿富汗人所救的故事。 #movie

Ps. 一句话剧透:美签真的很难办
最近读完芬兰科幻小说家 Hannu Rajaniemi 的侠盗若昂三部曲 'The Quantum Thief', 'The Fractal Prince', 'The Causal Angel'。

作者是一位物理学博士,书中的世界观大量使用了物理和密码学概念。尤其第一本,整个世界观都建立在博弈论、量子论和密码学的基础上,非常有趣。但是他的书读起来也很费劲,作者没有为读者提供任何解释,而是假设你已经掌握了所有的概念,直接开始推进跌宕起伏的情节。第一本读完后我立刻从头又读了一遍,因为这时候我才了解了全部的设定,终于可以开始真正的理解故事了。

如果你不满于很多科幻作品都是掺杂着科幻元素的老套故事,那这系列的科幻肯定能让你满意,人们的思维习惯甚至存在本身,都是建立在全新的设定基础上,能持续给你带来耳目一新的阅读体验。 #book
https://youtu.be/Z76YpCz9N2Y?si=fbrH66ArtYMyhPvs

2018 年 10 月 JT610 坠毁,2019 年 3 月 ET302 坠毁。在半年时间内,连续两架 Boeing 737 MAX 坠毁,357 人遇难,引起了人们对该机型的关注。

时间回到 2011 年巴黎航展,AirBus 推出 A320neo,收获大量订单,给波音构成了巨大威胁,AirBus 甚至成功与 American Airlines 达成合作,AA 将首次采购非波音客机。

波音的高层决定立刻发起反击,重新设计 737 机型,称为 737 MAX。这款飞机从一开始,就是以低成本阻击 A320neo 为目的。而且为了向航空公司兜售这款机型,波音的高管保证说该机型不需要为飞行员做任何额外培训,保证操作方式不发生任何重大变化,如果需要重新培训,波音会为每架交付的飞机赔付 100 万美元。

但实际上为了提高飞行效率,飞机的结构做了大幅改动,为了实现高管“无须培训”的承诺,设计者们引入了自动驾驶系统,而且为了适应需求进行了大量的临时更改,这些临时更改都没有经过严格的认证和测试,其中就包括著名的 MCAS 系统。

MCAS 的设计初衷是为了防止飞机失速,当判定飞行速度较低时会自动压下机头进行俯冲加速。波音在交付时提出不需要额外培训,也没有告知飞行员该系统的存在。

实际上在交付前的测试中,波音就发现了该系统可能导致灾难性的事故。在 JT610 坠毁后,FAA 也了解了这一故障,但是经过计算,FAA 认为平均来说 MCAS 会导致每年一起的事故率,而 FAA 认为刚发生过一次事故,距离下一次事故发生还有一年,于是并没有下达禁飞令,而是要求波音在一年内修复系统,结果 FAA 赌输了,半年后 ET302 坠毁。

媒体们进一步深挖后发现,FAA 很多雇员同时也受聘于波音,FAA 的飞行安全评估很多也是直接委托给波音进行,这个政府机构和企业之间利益交织,既做运动员又当裁判,最终导致了 FAA 作出牺牲乘客生命去维系波音利益的决定。
https://www.youtube.com/live/Y2F8yisiS6E?si=T7k5a0cjLHGkxWQE

周末在家养病的时候看了 NVIDIA GTC 2024,我认为基本上代表了 AI 大饼的方向。这场大会可以概括为三个词:算力、生成式(generative) 和 仿真(simulation)。

首先是推出了性能更为强劲的 Blackwell 芯片,开启 GPU 摩尔时代新篇章。然后提出 AI Generative Factory 的概念,认为 Token 就是未来的货币,由 Generative AI 驱动智能工业时代。由强大的算力作为支撑,将 Generative 推向 AI 的各个领域,比如自动学习操作机器人躯体的 GR00T。

最后就是以 Omniverse(OVX) 为代表的仿真模拟,在虚拟世界中构建数字孪生(Digital Twins),然后在仿真世界中利用生成式驱动 AI 行动,在仿真世界中经历各种事件或事故,反馈于训练。不断在训练和仿真的过程中循环迭代,最终进化为可以用于现实的成品(可以简单理解为养蛊😓)。

可以看出老黄身为卖铲子的,正在拼命鼓吹一个算力需求呈指数膨胀的未来。只是在如今这个时间点,没人知道我们是位于一个泡沫的顶峰,还是一个指数级增长的起点。
最近踩的一个坑,X.509 的证书,是可以签发出不同公钥算法的子证书的。

每个证书有两个签名相关的属性:

* public_key_algorithm: 当前证书所使用的公钥算法
* signature_algorithm: 父证书签发本证书时所使用的签名算法

比如 Google 的 HTTPS 证书,就是由 RSA 签发的 ECDSA 证书。
'Attention Mechanism' 详细介绍了 Attention 机制的起源和原理。以前也简要描述过 RNN、Attention Transformer 的关系

'Attention? Attention!' 则是更详细地介绍了 Attention 的不同种类和用途。Attention 的关键在于使用 alignment score 从 input 中提取 context vector 作为辅助信息,所以不同的 alignment score 计算方式也就诞生了不同的 attention 类型:

1. self-attention: 每一个输入都和之前的输入计算相关性
2. global/soft attention: 每一个输出都和所有输入计算相关性
3. local/hard attention: 先计算一个输入范围,然后输出只和这个范围内的输入计算相关性

以前介绍过实现 GPT 的 transformer 是用 multi-head attention heads 完全取代 RNN 实现了 seq2seq 的功能。文中还介绍了 attention 的其他一些应用,比如在 Pointer Network 中,让 decoder 可以利用 attention 选择下一轮迭代的 encoder,从而实现让神经网络可以循环迭代解决 irreducible computation 问题。
https://youtu.be/2d8j_q2tl9c?si=qcFxhjBXkmJ2IKo1

FT 关于拼多多的报道,非常有趣。

你粗略看去,拼多多/TEMU 正在疯狂地抢占市场,其商品和广告在身边无处不在,其美国公司也在 NASDAQ 上市,看上去似乎一切都很正常。

但是随着 FT 的财经记者深入挖掘,就会发现拼多多和你所以为的“上市公司”完全不一样,这公司的中国公司起源于一家法人为一名老太的皮包公司,而其在美国上市的公司则是一家注册在开曼群岛的公司,这家公司的股权结构和公开信息都一塌糊涂,名义上和中国的拼多多实际上根本没任何关系,毕竟拼多多根本没有在香港上市,也并不是人们过去所熟悉的 VIE 结构。简而言之,美股的拼多多根本就是一家空壳,FT 的记者发出了灵魂拷问:请问在美股上购买拼多多的人,究竟在买什么?

最近 PDD 还告知美国 SEC 其将总部搬到了爱尔兰,但其爱尔兰办公室实际上只是一个空壳办公处,在该地址注册的是一家名为 WhaleCo 的公司,PDD 声称 WhaleCo 是自己的全资子公司,负责其全球拓展业务。

TEMU 也是疑云重重,它的起源故事一再更换,最新的版本是这是一家 2022 年成立于波士顿的“本土企业”。TEMU 的低价来于美国对低价邮包的免税政策,而对该政策的滥用显然会引起地缘政治冲突。

此外还介绍了 PDD 的商业模式,通过 Factory to Consumer (F2C) 的模式,PDD 提供市场营销、广告、设计等环节,让企业直接给终端消费者发货,同时给企业提供市场反馈和进一步的改进建议,大部分建议都是放弃一部分的品质换取大幅降价。简而言之,通过放弃品牌,从而大幅压缩成本,最终构成了 PDD 的极致低价。但是其品质往往非常低劣,一些消费者也表示不会从 PDD 购买重要的商品。
以前写过一篇用 CFSSL 签发根证书和叶子证书的水文 https://blog.laisky.com/p/cfssl/

有人问了关于签发 CRLs 的问题,正好查了些资料。

简而言之,CRLs 是一个证书列表,用来列举已经被吊销的证书。证书中有个属性叫做 CRL Distribution Points,用来指定对应 CRLs 的下载地址。

每个 CRLs 都有一个 scope,即定义它所管辖的证书。一般来说,CRLs 应该由某个 CA 来签发,这个 CA 称为它的 issuer,而这个 CRLs 的 scope 就是这个 issuer 所签发的其他证书。

但是,CRLs 的 scope 并不一定需要和其 issuer 相关,当 CRLs 的 scope 超出其 issuer 所签发的证书时,这个 CRLs 就称为 indirect CRLs。甚至于,indirect CRLs 其实可以没有 issuer,这种情况使得可以在不动用 CA 私钥的情况下生成 CRLs。但是,很多客户端默认情况下不一定支持 indirect CRLs,所以并不常见。

具体可见 https://www.rfc-editor.org/rfc/rfc5280#page-55
Telegram Channel