Vertex AI Priority PayGo in 27.000 realen Service-Anfragen geprüft: kein Unterschied zu Standard

calmlake79 · 2026-02-25T11:06:54+09:00

Ergebnisse einer Analyse von rund 27.000 über etwa zwei Wochen gesammelten Anfragen nach Uhrzeit, nachdem Vertex AIs Priority PayGo auf einen produktiven AI-Chatbot angewendet wurde Bei der Antwortzeit auf Basis des Medians lagen ON_DEMAND(Standard) und ON_DEMAND_PRIORITY meist innerhalb von 100 bis 300 ms und damit faktisch auf demselben Leistungsniveau Ein Zeitraum, in dem Priority spürbar schneller war, war praktisch nur 16 Uhr (-338 ms); in den übrigen 23 Stunden war die Leistung ähnlich oder Standard sogar schneller Der Anteil der Anfragen mit mehr als 10 Sekunden lag bei Standard bei 3,4 % und bei Priority bei 5,9 %; Priority war damit sogar 1,7-mal instabiler Besonders nachts (22–23 Uhr) lag die Quote von Priority bei Anfragen über 10 Sekunden bei mehr als 12 % und damit über dreimal so hoch wie bei Standard Angesichts eines 1,8-mal höheren Token-Preises wird derzeit davon ausgegangen, dass Priority PayGo keinen Vorteil beim Preis-Leistungs-Verhältnis bietet Da es sich um Ergebnisse aus einer Umgebung mit gemini-3-flash-preview (Preview-Modell) + asia-northeast3 (Region Seoul) handelt, kann sich dies nach dem GA-Release ändern

Ergebnisse einer Analyse von rund 27.000 über etwa zwei Wochen gesammelten Anfragen nach Uhrzeit, nachdem Vertex AIs Priority PayGo auf einen produktiven AI-Chatbot angewendet wurde
Bei der Antwortzeit auf Basis des Medians lagen ON_DEMAND(Standard) und ON_DEMAND_PRIORITY meist innerhalb von 100 bis 300 ms und damit faktisch auf demselben Leistungsniveau
Ein Zeitraum, in dem Priority spürbar schneller war, war praktisch nur 16 Uhr (-338 ms); in den übrigen 23 Stunden war die Leistung ähnlich oder Standard sogar schneller
Der Anteil der Anfragen mit mehr als 10 Sekunden lag bei Standard bei 3,4 % und bei Priority bei 5,9 %; Priority war damit sogar 1,7-mal instabiler
Besonders nachts (22–23 Uhr) lag die Quote von Priority bei Anfragen über 10 Sekunden bei mehr als 12 % und damit über dreimal so hoch wie bei Standard
Angesichts eines 1,8-mal höheren Token-Preises wird derzeit davon ausgegangen, dass Priority PayGo keinen Vorteil beim Preis-Leistungs-Verhältnis bietet
Da es sich um Ergebnisse aus einer Umgebung mit gemini-3-flash-preview (Preview-Modell) + asia-northeast3 (Region Seoul) handelt, kann sich dies nach dem GA-Release ändern

Vertex AI Priority PayGo in 27.000 realen Service-Anfragen geprüft: kein Unterschied zu Standard

Verwandte Beiträge

Noch keine Kommentare.