2024年2月にGKEのReleaseNoteに流れてきた情報から、新機能と影響のありそうな不具合情報のみをまとめて紹介します。
新機能
2/28
AutopilotのコンピューティングクラスでPerformanceが使用可能になりました
Autopilotにはコンピューティングクラスを指定することができ、今回新たにPerformanceが追加されました。
PerformanceとはPod1つにNodeを専有させる機能です。この機能を使うことでCPUメインの重たいワークロードでNodeリソースの全てを使用することができパフォーマンスの向上が見込めます。
2/21
Stateful HA OperatorがGAになりました
Stateful HA Operatorを使用するとStatefulSetのStorageClassをstandard-rwo-regional
に自動的に変更してくれます。これによりリージョン Persistent Diskが使用できるようになります。
Persistent Diskを使用するアプリケーションを運用している場合はこれを利用することで安全で手軽にNodeの障害に対応できるようになりそうです。
ただし、使い方によってはダウンタイムが発生するようなので設定を詰める必要はありそうです。
2/20
GKE APIを使用してNodeにResource Manager tagsを設定できるようになりました
GKE Enterprise Editionを新規作成するときに各種ログやメトリクスの収集がデフォルトで有効になります
Enterprise Editionだけですが、control plane logs, control plane metrics, kube state metricsがデフォルトで有効になります。
これらのログやメトリクスは有用なためすでに有効にしている人も多いかと思いますが、デフォルトで有効になるのは良いことですね。
ClusterのCAの有効期限が切れているか180日を切っている場合に推奨事項として表示されるようになりました
2/2
GKE Enterprise EditionでFQDN network policiesがGAになりました
これを利用すると特定のドメインのみにアクセスを許可するといったことができるようになります。
Enterprise Editionでしか使用できませんが、これが必要になるほど厳しいセキュリティ監査があるところは少ないと思われますし問題にはならないでしょう。
2/1
Pod間のトラフィックを暗号化できるようになりました
なお、Node間の暗号化はGKE Enterprise Editionのみになります。
こちらも一般的なサービスを運用している場合にこれほどのセキュリティを求められることはないため、必要になることは少ないでしょう。
不具合
stableチャンネルで発生していない場合や影響が極小な場合はスルーしています。
2/16
特定のバージョンでUbuntuをNodeに使用するとNode poolがunhealthyになります
1.25.16-gke.1497000
、1.26.13-gke.1189000
の2つのバージョンで問題が発生しています。
該当する場合はパッチバージョンを更新しましょう。
2/15
HorizontalPodAutoscaler (HPA) と VerticalPodAutoscaler (VPA) の設定が誤っている場合、クラスタ内の全てのオートスケールが停止する可能性があります
1.26以下を使用している場合は影響がありません。
1つでも間違った設定があると全体に影響がでてしまうため最新のパッチバージョンに更新することが推奨されます。
2/6
1.26.6-gke.1900以降のクラスタで接続が断続的に失敗することが低確率で発生するようです
発生確率は低そうで、Lenetのクラスタでも発生していません。
発生したら厄介そうなので、修正済みの最新のパッチバージョンに更新しておくのが安心できそうです。