CPU 使用率が急上昇した時

CPU 使用率が急上昇した時の事象や可能であれば対策をまとめます。

TraceMempool

バージョン:

Cardano-node 1.25.2

事象:

当該バージョンにした後からRelay NodeのCPUの使用率が極度に増加した。Peerからの重複したトランザクションがログされている。

ワークアラウンド:

1: mainnet-config.jsonのTraceMempooltrueからfalseに編集

"TraceMempool": false,

2: ノードのサービスを再起動

結果:

CPU使用率を抑える事ができました。(15:00以降) ただし、トランザクションのメトリックが取得できない状態になります。

メリット:

CPUの使用率を抑える事ができる。

デメリット:

Grafanaなどで監視している場合トランザクションのメトリックが取得できなくなる。

設定する時の考慮点:

トランザクションがNodeに入ってきていることは正常性確認でも大切な情報のため、変更前にプールの設定に問題無い事が確認できていること。

自身のプールのRelay Nodeしか繋がっていないBlock Producer Nodeでトランザクションがきている事を確認する。

将来の作業でファイルを上書きをした場合などは、設定が(規定値のtrueへ)戻る可能性がある。

レファレンス:

[Documentation] - TraceMempool: practical usage for relays #2350

48時間問題

バージョン:

CardanoNode1.21.1 で改修されたが、1.23.0で再発。

事象:

報酬計算が走るため、エポック開始から48時間後にCPU使用率が上がった。(日本時間6:44分頃)

(SUGARプールの例では)Relay Nodeの接続ピアが10台ほど一時的に減少しました。

レファレンス:

[BUG] - The return of the epoch + 48 hour rewards calculation freeze → Closedを確認

Last updated