深入 Geth- 為什麼同步以太坊節點會這麼慢？

這篇文章將進一步解釋一些同步以太坊節點時的細節。關於同步效率，相信是許多部署以太坊 (節點) 的人都曾遭遇困難。當前 Geth 預設的同步模式稱為快速同步 (sincronización rápida)從理由是與其從 génesis 區塊開始並重新處理所有發生的交易 (可能需要數週時間) ，選擇快速同步可以很快的下載完區塊且僅需驗證相關的工作證明。下載所有區塊是一個相對簡單且快速的過程，許多人錯誤地認為因為他們的節點已下載了所有區塊，所以他們目前的狀態是同步的。

然而實際情況並非如此，因為這是一個還沒有執行過任何交易（即沒有執行任何交易以驗證此區塊鏈的有效性）的新節點，因此沒有任何有效的的帳戶狀態 (即餘額，隨機數，智能合約代碼等資料)。這些資訊需要另外下載並與最新的區塊交叉檢查，這個階段我們稱為 descarga de estado trie ，它實際上與區塊的下載同時進行，但需要比下載區塊花更久的時間。

T state trie 究竟是什麼？我們首先需要了解以太坊的網路結構。目前以太坊主網中存在大量的帳戶並可追蹤該地址或是合約的餘額、隨機值 (sustantivo) 等資訊。

但單靠帳戶本身並不足以執行一個節點，帳戶還需要以加密方式連接到區塊，以便節點可以實際驗證該帳戶資訊是否被篡改。這個加密連接是透過在帳戶上方建立一個樹狀資料結構來Root 的，該結構的每個層級都將其下一層級匯聚成更小的一層，一直持續到此樹狀結構的唯一根 (raíz) 為止。這個包含所有帳戶和中間加密證明的龐大資料結構被稱為 Estado Trie。

Rie Trie 這樣的資料結構是由無數個加密證明 (又稱作 Nodos Trie) 相互連結而構成。因此要真正擁有同步節點，我們還需要下載所有的帳戶資料以及所有的加密證明以驗證網路的正確性。所以其本身就已經是一個相當複雜的資料集。

更麻煩的是，這個資料集的狀態仍在持續地改變；以太坊每生成一個新的區塊 (平均 15 秒) 就會從這個 trie 中剔除約 1000 個節點，並加入大約 2000 個新節點。這代表節點需要具有能以每秒 200 次的速度修改此 conjunto de datos 的能力才能完成同步。

當我們正在進行同步時，以太坊網路仍在不停更新，因此我們在初期獲得的狀態可能會在下載進行途中消失，進而導致節點需要不斷地追蹤網路狀態，同時嘗試收集所有最新資料。

很多人發現當同步已進行到只落後主網最新高度後幾個區塊，卻不知道這僅僅是完成了區塊鏈的主要下載階段且仍在執行前面提到的狀態下載。若要確認真實同步進度，需要透過日誌中 (或是 nohup 日誌) 導入的狀態條目去觀察。由於節點無法事先預知 estado trie 有多大，所以它只能持續地執行，直到搜索及下載完所有的資訊。

原因是以太坊中的區塊僅包含狀態根 (raíz del estado), 也就是根節點 (nodo raíz) 的一個雜湊值。啟動同步後節點會開始從另一個節點下載區塊，該節點最多可以再引用其他 16 個新節點。在下一階段，初始節點將連結到約 16 個新節點並嘗試下載。在下載進行的同時，這 16 個節點之中的多數節點將繼續引入其他新的節點。這就是為什麼Rie 會發現區塊的同步值一直停頓在相同的數字。事實上是它仍正在搜尋和下載 trie。這個狀態同步的過程主要受於儲存裝置本身 I / O 的限制，而不是網路的頻寬。

7.200 RPM SATA3 A Serial ATA）的主流硬碟在容量上已經可達到 3–4TB 空間大小，售價相比 SSD 通常也非常便宜，但在效能表現方面，亦即 IOPS 數值，則大約落在 75 左右SAS 而 15,000 RPM SAS （SCSI conectado en serie）主流硬碟容量為 300–900 GB, 雖然售價是 SATA 硬碟的好幾倍，並且空間也小很多，但是其 IOPS 效能數值大約可達 175 左右。

以太坊中的 state trie 結構包含數億個節點，其中大多數節點採用單一雜湊的形式，允許引用其他最多 16 個雜湊。這是將資料儲存在硬碟上的一種可怕方式，因為它幾乎沒有結構(僅是隨機數引用更多的隨機數)。關於這點，恐怕任何的底層資料庫都會哭泣，因為它幾乎無法以任何有意義的方式去優化資料存儲與搜尋。

近資料的存儲非常不理想，且由於每秒近 200 次的資料修改，我們甚至無法將其以任何一種正確的預處理方式去下載，使其能更快地被導入，同時讓資料庫也不O 頻繁地反覆修改。最終的結果是，即使是採用快速同步，也會產生巨大的硬碟 IO 成本，這對一般機械式硬碟是相當大的負荷。

對照 SSD 接近 6000 IOPS 的效能執行表現，加上自身反應延遲極低，這些都是 HDD 沒有的優勢，這也是為什麼我們很難在單一機械式硬碟上執行並同步一個全節點。機械式硬碟D 快速同步事實上將花費非常非常久的時間。即使你願意等待到同步完成， HDD 恐怕也無法滿足目前主網對交易處理的 IOPS 請求。

除了硬碟的類型及轉速影響 IOPS 效能數值外，還有磁碟陣列（Matriz redundante de discos independientes ， RAID）的 Penalización 和 Caché 部分需要考量，因為不同類型的磁碟陣列 RAID 模式，仍會影響到整體IOPS 效能數值。

/ 不考慮透過磁碟陣列提升 I / O 的的情況下，機械式硬碟唯一的選擇就是執行對系統資源影響最低的輕節點。但就執行全節點來說， SSD 目前是唯一選擇。

深入 Geth- 為什麼同步以太坊節點會這麼慢？ – STAR BIT

Me gusta esto:

Relacionado

Compartir

Me gusta esto:

Relacionado

Related Posts