Es ist fast ein Jahrzehnt her, seit Amazon Web Services (AWS), die Cloud-Computing-Abteilung von Amazon, SageMaker, seine Plattform zum Erstellen, Trainieren und Bereitstellen von KI-Modellen, angekündigt hat. Während sich AWS in den vergangenen Jahren darauf konzentrierte, die Fähigkeiten von SageMaker deutlich zu erweitern, war in diesem Jahr die Rationalisierung das Ziel.
Auf seiner re:Invent 2024-Konferenz stellte AWS SageMaker Unified Studio vor, einen zentralen Ort zum Suchen und Arbeiten mit Daten aus dem gesamten Unternehmen. SageMaker Unified Studio vereint Tools aus anderen AWS-Diensten, einschließlich des bestehenden SageMaker Studio, um Kunden bei der Entdeckung, Vorbereitung und Verarbeitung von Daten zum Erstellen von Modellen zu unterstützen.
„Wir sehen eine Konvergenz von Analytik und KI, wobei Kunden Daten auf zunehmend vernetzte Weise nutzen“, sagte Swami Sivasubramanian, Vizepräsident für Daten und KI bei AWS, in einer Erklärung. „Die nächste Generation von SageMaker vereint Funktionen, um Kunden alle Tools zur Verfügung zu stellen, die sie für die Datenverarbeitung, die Entwicklung und Schulung von Modellen für maschinelles Lernen und generative KI benötigen, direkt in SageMaker.“
Mit SageMaker Unified Studio können Kunden Daten, Modelle, Apps und andere Artefakte veröffentlichen und mit Mitgliedern ihres Teams oder einer größeren Organisation teilen. Der Service bietet Datensicherheitskontrollen und anpassbare Berechtigungen sowie Integrationen mit der Bedrock-Modellentwicklungsplattform von AWS.
KI ist in SageMaker Unified Studio integriert – genauer gesagt in Q Developer, dem Programmier-Chatbot von Amazon. In SageMaker Unified Studio kann Q Developer Fragen beantworten wie „Welche Daten sollte ich verwenden, um eine bessere Vorstellung von Produktverkäufen zu bekommen?“ oder „SQL generieren, um den Gesamtumsatz nach Produktkategorie zu berechnen.“
Erklärt AWS in einem Blogbeitrag: „Q Developer [can] „Unterstützung von Entwicklungsaufgaben wie Datenerkennung, Codierung, SQL-Generierung und Datenintegration“ in SageMaker Unified Studio.
Über SageMaker Unified Studio hinaus hat AWS zwei kleine Ergänzungen seiner SageMaker-Produktfamilie auf den Markt gebracht: SageMaker Catalog und SageMaker Lakehouse.
Mit SageMaker Catalog können Administratoren Zugriffsrichtlinien für KI-Apps, -Modelle, -Tools und -Daten in SageMaker mithilfe eines einzigen Berechtigungsmodells mit detaillierten Kontrollen definieren und implementieren. Mittlerweile stellt SageMaker Lakehouse Verbindungen von SageMaker und anderen Tools zu Daten bereit, die in AWS Data Lakes, Data Warehouses und Unternehmensanwendungen gespeichert sind.
Laut AWS funktioniert SageMaker Lakehouse mit allen Tools, die mit den Apache Iceberg-Standards kompatibel sind – Apache Iceberg ist das Open-Source-Format für große Analysetabellen. Administratoren können auf Wunsch Zugriffskontrollen für alle Daten in allen Analyse- und KI-Tools anwenden, die SageMaker Lakehouse nutzt.
In einer etwas verwandten Entwicklung soll SageMaker dank neuer Integrationen nun besser mit Software-as-a-Service-Anwendungen funktionieren. SageMaker-Kunden können auf Daten aus Apps wie Zendesk und SAP zugreifen, ohne diese Daten zuerst extrahieren, transformieren und laden zu müssen.
„Kunden verfügen möglicherweise über Daten, die über mehrere Data Lakes sowie ein Data Warehouse verteilt sind, und würden von einer einfachen Möglichkeit zur Vereinheitlichung all dieser Daten profitieren“, schrieb AWS. „Jetzt können Kunden ihre bevorzugten Analyse- und maschinellen Lerntools für ihre Daten verwenden, unabhängig davon, wie und wo sie physisch gespeichert sind, um Anwendungsfälle wie SQL-Analysen, Ad-hoc-Abfragen, Datenwissenschaft, maschinelles Lernen und generative KI zu unterstützen. ”