Amazon hat am Montag Nova Act vorgestellt, einen allgemeinen AI-Agenten, der die Kontrolle über einen Webbrowser übernehmen und unabhängig einige einfache Aktionen ausführen kann. Neben dem neuen Agentic AI -Modell veröffentlicht Amazon das Nova Act SDK, ein Toolkit, mit dem Entwickler Agentenprototypen mit Nova ACT erstellen können.
Nova Act, entwickelt von Amazon’s Closed in San Francisco Lab, wird auch die wichtigsten Funktionen des bevorstehenden Alexa+ Upgrade des Unternehmens, einer generativen AI-verbesserten Version von Amazon’s populärem Sprachassistenten, anführen. Die Version von Nova Act, die heute heute verfügbar ist, ist jedoch etwas weniger poliert. Amazon nennt es eine Forschungsvorschau.
Entwickler können auf eine neue Website auf das Nova Act Toolkit zugreifen. nova.amazon.comdas auch als Schaufenster für die verschiedenen Nova Foundation -Modelle von Amazon dient.
Nova Act ist der Versuch von Amazon, den OpenAI-Betreiber und den Computer-Gebrauch von Anthropic mit eigenen AI-Agenten-Technologie von AI-Agenten zu übernehmen. Mehrere führende Tech -Unternehmen glauben, dass KI -Agenten, die im Internet navigieren, für Benutzer die heutigen KI -Chatbots wesentlich nützlicher machen werden.
Amazon ist vielleicht nicht der erste, der diese Art von Agententechnologie entwickelt, aber über Alexa+kann dies die größte Reichweite haben.
Laut Amazon sollten Entwickler, die mit dem Nova ACT SDK bauen, in der Lage sein, grundlegende Aktionen im Namen von Benutzern zu automatisieren, z. Mit dem Nova Act Toolkit können Entwickler Tools zusammenschließen, mit denen ein AI -Agent auf Webseiten navigieren, Formulare ausfüllen oder Daten in einem Kalender auswählen kann.
Amazon behauptet, dass Nova ACT Agenten von OpenAI und Anthropic bei mehreren internen Tests des Unternehmens übertrifft. Zum Beispiel auf dem Bildschirmspot -Webtext, der misst, wie ein AI -Agent mit Text auf einem Bildschirm interagiert, erzielte Nova ACT 94%, übertraf Openai’s CuA (das 88%erzielte) und das Claude 3.7 -Sonett von Anthropic (90%).
Amazon hat Nova Act jedoch nicht unter Verwendung häufigerer Agentenbewertungen wie WebVoyager bewertet.
Das Nova Act ist das erste öffentliche Produkt, das aus dem oben erwähnten Agi -Labor von Amazon hervorgeht. eine Initiative gemeinsam von den ehemaligen OpenAI-Forschern David Luan und Pieter Abbeel. Beide zuvor gegründeten eigenen Startups – Luan startete Adept, während Abbeel Covariante mitkamen -, bevor Amazon sie letztes Jahr anstellte, um seine AI -Agentenbemühungen zu leiten.
Während es für ein AGI -Labor seltsam erscheinen mag, KI -Agenten zu bauen, die Sweetgreen bestellen können, sagte Luan gegenüber Tech, dass er Agenten als wichtigen Schritt zur Erstellung von Superintelligent -KI -Systemen betrachte. Luan definiert Agi als „ein KI -System, das Ihnen helfen kann, alles auf einem Computer zu tun.“
Laut Luan hat sein Team das Nova ACT SDK so gestaltet, dass er kurze, einfache Aufgaben zuverlässig automatisiert und Entwicklungswerkzeugen genau definiert, wann sie möchten, dass ein Mensch in einen agenten -Workflow eingreift. Er hofft, dass Entwickler zuverlässigere agierende Anwendungen erstellen können, wenn auch nicht unbedingt vollständig autonome.
Amazon veröffentlichen seinen ersten Generalisten -KI -Agenten in einem überfüllten Raum, aber es ist eine entscheidende Technologie, auf der das Unternehmen viel fährt. Frühe Tests des Nova Act könnten einen Einblick in einige der Fähigkeiten des langverzögerten Alexa+, einen Moment für die KI-Bemühungen von Amazon, einen Moment für Make oder Break-Moment geben.
Ein großes Problem mit frühen KI -Agenten von OpenAI, Google und Anthrop sind ihre Zuverlässigkeit in verschiedenen Bereichen. Bei den Tests von Tech sind die Systeme langsam, haben Schwierigkeiten, sehr lange unabhängig zu arbeiten, und sind anfällig für Fehler, die ein Mensch nicht machen würde. Es wird nicht lange dauern, bis wir sehen, ob Amazon den Code geknackt hat – oder ob seine Agenten unter den gleichen Mängel leiden, die Konkurrenten plagen.