WHITEPLUS TechBlog

株式会社ホワイトプラスのエンジニアによる開発ブログです。

GKEの新機能と不具合情報まとめ 2025年7月

2025年7月にGKEのReleaseNoteに流れてきた情報から、新機能と変更内容、stableチャンネルに影響のありそうな不具合情報のみをまとめて紹介します。

7月はリリース数は少なかったですが大きなリリースが複数あり長文になっています。メンテナンスが告知されたため影響を受けないように適切にメンテナンスウィンドウを設定する必要があります。また、GFEsのTLSハンドシェイクに変更が入っています。現時点の発表内容を見る限り直接アクセスしている場合は影響はありませんが、中間プロキシ等を使用している場合は正しくRFCに準拠していることを確認する必要があります。

メンテナンス情報

7/28

コントロールプレーンのデータストアに対してメンテナンスが行われます

すべてのGKEクラスターの内部コントロールプレーンのデータストアに対してメンテナンスを実施し、スケーラビリティと信頼性を向上させます。これらの改善は2025年10月までにGKE全体で完了する予定です。

このメンテナンスはすべてのGKEクラスターで段階的に実施され、設定されたメンテナンスウィンドウ中に行われます。メンテナンスプロセスはクラスターのメンテナンスウィンドウ中に約15分で完了する予定です。

予想される影響

コントロールプレーンのデータストアに対するメンテナンス中、Kubernetes APIサーバーは15分間利用できません。これはリージョナルクラスターを使用する場合でも、ゾーンクラスターを使用する場合でも同様です。この15分間はクラスターのKubernetes APIサーバーと通信できません。

クラスターのメンテナンスウィンドウ中に通常のワークフローに以下の潜在的な障害が発生する可能性があります。

  • Kubernetes APIの利用不可
    • クラスターがリージョン型かゾーン型かに関わらず、kubectlやその他のKubernetes APIクライアントを使用してコントロールプレーンにコマンドを発行できません。この期間中、Kubernetes APIを使用してリソースのデプロイ、変更、またはクエリを試行すると失敗します。
  • デプロイの停止
    • Kubernetes APIと相互作用する自動化されたデプロイパイプライン(CI/CD)は、クラスター内のアプリケーションのデプロイや更新などのタスクを完了できなくなります。
  • Google Cloudコンソールの制限
    • Google Cloudコンソールでクラスターに対して実行される操作で、Kubernetes APIと通信するものは失敗する可能性があります。
  • コントロールプレーンの自動化遅延
    • コントロールプレーンで管理される機能(クラスターオートスケーラー、水平または垂直ポッドオートスケーリングの調整、一部のノード自動修復操作など)はAPIサーバーがオンラインになるまで一時停止される可能性があります。
影響を受けない部分
  • 実行中のアプリケーション
    • ノード上で実行中のアプリケーションやサービスは中断なく機能し続けます
  • ノードプール操作
    • 既存のノードは接続されたまま動作し続けます
  • ネットワークトラフィック
    • データプレーンのトラフィック(実行中のワークロードへのトラフィックなど)は影響を受けません
行うべきこと
  • メンテナンスウィンドウの確認
    • クラスターのメンテナンスウィンドウと除外設定を確認し、通常のワークフローへの影響を最小限に抑える期間にメンテナンスウィンドウをスケジュールしてください。
  • Kubernetes API の利用不可への対応
    • クラスターでKubernetes APIへのアクセスを必要とする重要な操作を実行している場合、メンテナンスウィンドウ中にこれらの操作をスケジュールしないようにしてください。

新機能

7/28

ComputeClass内のreservationSubBlockフィールドを使用することでリザーベーションブロック内の特定のサブブロックを指定できるようになります

1.33.1-gke.1788000以降で利用できます。

単一ホストおよびマルチホストのTPUノードプールに対して、ComputeClassを使用してコレクションスケジュールを設定できるようになりました

1.32.2-gke.1359000以降で利用できます。
コレクションスケジュールを使用するとTPUワークロードに対してサービスレベル目標 (SLO) を設定できます。

GKE GatewayコントローラーがGateway API v1.3 CRDsをサポートしました

1.33.2-gke.1335000以降で利用できます。

7/21

ComputeClassを使用してそのクラスで作成されるすべてのノードにKubernetesラベルを設定できるようになりました

これらのラベルはKubernetes APIの対応するNodeオブジェクトに適用されます。

変更

7/15

GKEのDNSベースのコントロールプレーン パブリックエンドポイントをサポートするGoogle Front Ends(GFEs)はTLSハンドシェイク中にクライアント証明書のリクエストを追加します

今後、mTLSとクライアント証明書をサポートするためです。
ホスト名がus-central1.gke.googで終わるGKEのDNSベースのコントロールプレーン パブリックエンドポイントでは既にリクエストが組み込まれています。その他のすべてのGKE DNSベースのコントロールプレーン パブリックエンドポイントでこの機能は2025年8月18日から2025年8月22日の間に段階的に展開されます。

mTLSおよびクライアント証明書設定オプションが利用可能になるまで以下が適用されます。

  • TLS ハンドシェイクでクライアント証明書がリクエストされたとしても、kubectl(またはその他の互換クライアント)がクライアント証明書を提供しなければならないわけではありません。クライアント証明書は必須ではなく設定もできません。
  • 現在のオペレーティングシステムのTLSライブラリはパブリックエンドポイントのクライアント証明書要求に対して「クライアント証明書なし」の応答を送信します。
  • GKE DNSベースのコントロールプレーン パブリックエンドポイントは設定オプションに関する今後の発表があるまでクライアント証明書またはmTLS要件を強制しません。

kubectl(または他の互換性のあるクライアント)とGKE DNSベースのコントロールプレーン パブリックエンドポイントの間に中間プロキシを使用する場合、RFC 5246のセクション7.4.4、RFC 8446のセクション4.4.2、またはRFC 8446のセクション4.4.2.4に完全に準拠していることを確認してください。

不具合、修正

7/28

Compute Engine Persistent Disk CSIドライバーがカスタムマシンタイプを使用するGKEノードで無効なcpuStringエラーにより失敗する問題が修正されました

以下のバージョンで修正されています。

  • 1.31.10-gke.1021000以降
  • 1.32.4-gke.1698000以降
  • 1.33.1-gke.1386000以降

7/14

NVMeのみをサポートするマシンファミリーを使用するWindowsワークロードがある場合、クラスターをバージョン1.33.2-gke.1240000 以降にアップグレードしてください

Windows NVMe接続のディスクはGKEバージョン1.33.2-gke.1240000以降でしかサポートされていません。以前のGKEバージョンではNVMeボリュームを使用するWindowsノードでPersistentVolumeClaimsを作成するとエラーが発生します。

先月までの新機能と不具合情報

先月までの内容は以下のリンク先で確認できます。

blog.wh-plus.co.jp