- Ergebnisse einer Analyse von rund 27.000 über etwa zwei Wochen gesammelten Anfragen nach Uhrzeit, nachdem Vertex AIs Priority PayGo auf einen produktiven AI-Chatbot angewendet wurde
- Bei der Antwortzeit auf Basis des Medians lagen ON_DEMAND(Standard) und ON_DEMAND_PRIORITY meist innerhalb von 100 bis 300 ms und damit faktisch auf demselben Leistungsniveau
- Ein Zeitraum, in dem Priority spürbar schneller war, war praktisch nur 16 Uhr (-338 ms); in den übrigen 23 Stunden war die Leistung ähnlich oder Standard sogar schneller
- Der Anteil der Anfragen mit mehr als 10 Sekunden lag bei Standard bei 3,4 % und bei Priority bei 5,9 %; Priority war damit sogar 1,7-mal instabiler
- Besonders nachts (22–23 Uhr) lag die Quote von Priority bei Anfragen über 10 Sekunden bei mehr als 12 % und damit über dreimal so hoch wie bei Standard
- Angesichts eines 1,8-mal höheren Token-Preises wird derzeit davon ausgegangen, dass Priority PayGo keinen Vorteil beim Preis-Leistungs-Verhältnis bietet
- Da es sich um Ergebnisse aus einer Umgebung mit
gemini-3-flash-preview (Preview-Modell) + asia-northeast3 (Region Seoul) handelt, kann sich dies nach dem GA-Release ändern
Noch keine Kommentare.