Google cloud run si optimziarea instantelor

Salut,
Ma joc de vreo cateva zile cu Google Cloud Run si pare interesant.
Pentru cei care nu stiu google cloud run este un serviciu de la google prin care poti sa iti deployezi aplicatiile sub forma de containere spun ei si consturile sunt in functie de cat utilizezi putand chiat sa ai costuri 0 daca nu se foloseste nici o resursa.

Parametrii containerului care mi-ai sarit in ochi sunt CPU (care poate sa fie chiar sub 1 vCPU) si memorie care sunt 128MB, 256MB, 512MB si tot asa…
Ai posibilitatea sa alegi numarul minim de containere dar si maximul. (Daca alegi 0 containere o sa ai un cost de “cold start” si practic aplicatia ta o sa aiba la primul utilizator un timp mai mare). Daca alegi 1 si e pe idle platesti 1/10 din pret.
Tot aici am mai vazut si numarul de requesturi pe container.

Cum jonglez cu parametrii de mai sus astfel incat sa am costuri mici si totusi sa si scaleze aplicatia. (evident ca poti sa dau 2 vcpu per masina si nspe gb ram, dar la sfarsit de luna vine factura…)

Nu-s familiar cu Google cloud dar de obicei exista optiuni de autoscaling in functie de load.
À propos de l'autoscaling des instances  |  Documentation Cloud Run  |  Google Cloud Pare a fi ce cauti

Multumesc. Am citit linkul dinainte sa fie acolo.
Cred ca cea mai buna abordare este sa pornesc cu 3 instante mai mici decat una mai mare. In felul asta scalez la costuri mai mici. Decat daca as avea o instsnta mare.