1 Punkte von calmlake79 2026-02-25 | Noch keine Kommentare. | Auf WhatsApp teilen
  • Ergebnisse einer Analyse von rund 27.000 über etwa zwei Wochen gesammelten Anfragen nach Uhrzeit, nachdem Vertex AIs Priority PayGo auf einen produktiven AI-Chatbot angewendet wurde
  • Bei der Antwortzeit auf Basis des Medians lagen ON_DEMAND(Standard) und ON_DEMAND_PRIORITY meist innerhalb von 100 bis 300 ms und damit faktisch auf demselben Leistungsniveau
  • Ein Zeitraum, in dem Priority spürbar schneller war, war praktisch nur 16 Uhr (-338 ms); in den übrigen 23 Stunden war die Leistung ähnlich oder Standard sogar schneller
  • Der Anteil der Anfragen mit mehr als 10 Sekunden lag bei Standard bei 3,4 % und bei Priority bei 5,9 %; Priority war damit sogar 1,7-mal instabiler
  • Besonders nachts (22–23 Uhr) lag die Quote von Priority bei Anfragen über 10 Sekunden bei mehr als 12 % und damit über dreimal so hoch wie bei Standard
  • Angesichts eines 1,8-mal höheren Token-Preises wird derzeit davon ausgegangen, dass Priority PayGo keinen Vorteil beim Preis-Leistungs-Verhältnis bietet
  • Da es sich um Ergebnisse aus einer Umgebung mit gemini-3-flash-preview (Preview-Modell) + asia-northeast3 (Region Seoul) handelt, kann sich dies nach dem GA-Release ändern

Noch keine Kommentare.

Noch keine Kommentare.