Das neue KI-Modell von Meta kann jedes Objekt erkennen, so geht’s

Die Kolosseen von Elden Ring oeffnen morgen endlich im kostenlosen

Metafrüher bekannt als Facebookhat eine entwickelt KI-Modell genannt „Alles segmentieren„, das Objekte in Bildern und Videos ohne vorherige Tr identifizieren kannain. Das bedeutet, dass die KI Elemente erkennen kann, die nicht im ursprünglichen Datensatz enthalten sind. Benutzer können Objekte auswählen, indem sie darauf klicken oder Textaufforderungen verwenden. Geben Sie zum Beispiel „Katze“ fordert die KI auf, alle Katzen auf einem Foto hervorzuheben. Laut Reuters ist diese Funktion ein Durchbruch für die KI, da sie die Notwendigkeit bereits vorhandener Datensätze überflüssig macht und eine genauere Objekterkennung ermöglicht.

Wie funktioniert das KI-Modell „Segment Anything“ von Meta?
Das „Segment Anything“-Modell kann mit anderen Modellen kombiniert werden, um verschiedene Aufgaben zu erfüllen. Beispielsweise kann es bei der Erstellung einer 3D Darstellung eines Objekts aus einem Einzelbild oder bieten Ansichten von einem Mixed-Reality-Headset. Diese Funktionalität reduziert den Bedarf an zusätzlichem KI-Training und erhöht dadurch die Effizienz.Meta verwendet vergleichbare Technologien für verschiedene Zwecke, z. B. zum Moderieren verbotener Inhalte, zum Vorschlagen von Beiträgen und zum Identifizieren von Personen auf Fotos.Obwohl das „Segment Anything“-Modell Eingabeaufforderungen in Echtzeit verarbeiten kann, kann es bei komplexen Bildverarbeitungsaufgaben zu einer langsamen Leistung kommen. Laut Meta wird erwartet, dass spezialisiertere KI-Tools dieses Modell in ihren jeweiligen Bereichen übertreffen werden.Es ist unwahrscheinlich, dass dieses KI-Modell in Robotern oder anderen Geräten verwendet wird, die eine schnelle und präzise Objekterkennung erfordern. Dennoch können Modelle wie dieses in Situationen wertvoll sein, in denen es unpraktisch ist, sich nur auf Trainingsdaten zu verlassen. „Durch die gemeinsame Nutzung unserer Forschung und unseres Datensatzes hoffen wir, die Forschung zur Segmentierung und ein allgemeineres Bild- und Videoverständnis weiter zu beschleunigen“, sagte Meta in dem Beitrag.Meta stellt sowohl das KI-Modell als auch den Datensatz unter einer nichtkommerziellen Lizenz zum Download zur Verfügung, was bedeutet, dass sie nicht für kommerzielle Zwecke verwendet werden können. Dieser Schritt zielt darauf ab, die Forschung zu fördern und den Zugang zu Technologie zu verbessern.


gn-tech