Gesundheitsorganisationen können jetzt KI-Modelle auf sensible Patientendaten anwenden, ohne diese Schwachstellen in der öffentlichen Cloud auszusetzen. Einschränkungen der öffentlichen Cloud in Bezug auf GPU-Verfügbarkeit, Ausgangspreise und gemeinsam genutzte Ressourcen treiben Unternehmen dazu, sich für nicht-öffentliche Cloud-Optionen zu entscheiden. Dies macht die Kaltstartlatenz sichtbarer und wirkungsvoller, insbesondere bei Funktionen, die sofortige Reaktionen erfordern, wie z. B. Chat-Schnittstellen oder Entscheidungstechniken mit geringer Latenz. Dies gilt insbesondere dann, wenn viele alternative Modelle gleichzeitig bereitgestellt werden, was eine dynamische Zuweisung von Rechenressourcen erfordert. Kaltstartlatenz wird zu einem immer sichtbareren und wirkungsvolleren Problem, insbesondere wenn die Infrastruktur nach Bedarf bereitgestellt wird, um die Ressourcennutzung zu optimieren oder Kosten zu senken.

Sledge bietet schnelle Startzeiten durch die Unterstützung von Berechnungen mit hoher Dichte und ist daher vielversprechend bei der Reduzierung der Kaltstartlatenz. Die Autoren AlexHost SRL von Reference stellten ein neues serverloses Framework Sledge für Edge basierend auf WebAssembly vor. Durch die Einführung eines neuen Sandboxing-Ansatzes war SAND in der Lage, den Containervorbereitungsprozess und damit die Kaltstart-Latenzzeit zu verkürzen. Dadurch kann die Latenzzeit beim Kaltstart verkürzt werden.
Mit dieser Forschungsabfrage wird untersucht, wo die Studien veröffentlicht werden und ob der in den aktuellen Studien verwendete Datensatz mit Forschern geteilt wird. Die im ATOM-Framework untersuchten DRL-Modelle sind Deep Deterministic Policy Gradient (DDPG) und Recurrent Deterministic Policy Gradient (RDPG). Zu diesem Zweck ist es äußerst wichtig, die Vorhersagegenauigkeit der verwendeten KI-Modelle zu erhöhen (z. B. durch die Verwendung neuer Modelle). KI-Modelle mit hohen Startanforderungen (RAM, CPU, viel Daten usw.) können diese Latenz weiter verbessern. Lee et al. schlug eine auf Perform Fusion basierende Technik vor, um die Kaltstartlatenz zu reduzieren. In Reference schlagen die Autoren eine Strategie zur Reduzierung der Kaltstartlatenz vor, indem den identischen Containern mithilfe des Sandbox-Algorithmus vergleichbare Funktionen zugewiesen werden.
In der zweiten Forschungsfrage wurden die Elemente untersucht, die die Kaltstartlatenz beeinflussen. Zukünftige Forscher könnten leichtgewichtige microVMs und Techniken zum Abfangen von Systemaufrufen kombinieren, um die Kaltstartlatenz weiter zu reduzieren. Die Wiederverwendung zuvor erlernter Modelle für eine andere Aufgabe kann die Leistung von Schaufensterpuppen steigern.