Napkin verwandelt Text mit etwas generativer KI in Bilder

Napkin verwandelt Text mit etwas generativer KI in Bilder

Wir alle haben Ideen, aber sie effektiv zu kommunizieren und Menschen davon zu überzeugen, ist keine leichte Aufgabe. Wie können wir dies also in einer Zeit der Informationsüberflutung und schrumpfender Aufmerksamkeitsspannen am besten erreichen?

Wenn Sie die Ingenieure Pramod Sharma und Jerome Scholler sind, verwenden Sie Servietteeine neue „visuelle KI“-Plattform, die die beiden gemeinsam entwickelt haben. Napkin startet heute heimlich mit einer Finanzierung von 10 Millionen US-Dollar von Accel und CRV.

Napkin entstand aus Sharmas und Schollers Frustration über die endlose Anzahl von Dokumenten und Präsentationsdecks, die in der Unternehmenswelt zur Norm geworden sind. Bevor sie Napkin gründete, gründete Sharma, ein ehemaliger Google-Mitarbeiter, das Lernspieleunternehmen Osmo. Scholler gehörte zum Gründungsteam von Osmo und arbeitete davor bei Ubisoft, LucasArts und Google.

„Das Kernprodukt von Napkin richtet sich an Vermarkter, Content-Ersteller, Ingenieure und Fachleute, die Ideen verkaufen und Inhalte erstellen“, sagte Sharma gegenüber Tech. „Das Ziel besteht darin, den Zeit- und Arbeitsaufwand des Designprozesses zu minimieren, indem man ihn in einen weitgehend generativen Fluss verwandelt.“

„Generativ“ bezieht sich auf generative KI. Ja, Napkins noch ein anderer Das Unternehmen setzt auf das Potenzial der Technologie und reiht sich damit in eine lange, lange Liste ein. Aber ein paar Dinge fallen bei der Erfahrung auf, die derzeit noch streng webbasiert ist.

Bei Napkin beginnen die Benutzer mit Text – einer Präsentation, Gliederung oder einem anderen Dokument dieser Art – oder lassen die App Text aus einer Eingabeaufforderung generieren (z. B. „Eine Gliederung für bewährte Vorgehensweisen bei einem Einstellungsgespräch“). Napkin erstellt dann mit diesem Text eine Notion-ähnliche Leinwand und fügt Textabsätzen ein „Spark-Symbol“ hinzu, das den Text beim Anklicken in anpassbare visuelle Elemente verwandelt.

Diese Visualisierungen sind nicht auf Bilder beschränkt, sondern umfassen verschiedene Arten von Flussdiagrammen, Graphen, Infografiken, Venn-Diagrammen und Entscheidungsbäumen. Jedes dieser Bilder enthält Symbole, die in der Galerie von Napkin gegen andere ausgetauscht werden können, und Sie erhalten auch Konnektoren, mit denen Sie zwei oder mehr Konzepte visuell verknüpfen können. Die Farben und Schriftarten sind editierbar, und Napkin bietet „Dekoratoren“ wie Hervorhebungen und Unterstreichungen, um das Erscheinungsbild jedes Elements aufzupeppen.

Nach der Fertigstellung können die visuellen Elemente als PNG-, PDF- oder SVG-Dateien oder als URL exportiert werden, die auf die Leinwand verweist, auf der sie erstellt wurden.

„Im Gegensatz zu vorhandenen Tools, die einem vorhandenen Editor eine generative Komponente hinzufügen, konzentrieren wir uns auf die Generation-First-Erfahrung, bei der die Bearbeitung hinzugefügt wird, um die Generation zu ergänzen, und nicht umgekehrt“, sagte Sharma.

Ich habe Napkin kurz ausprobiert, um ein Gefühl dafür zu bekommen, was es kann.

Beim Erstellen des Dokuments versuchte ich aus morbider Neugier, Napkin dazu zu bringen, etwas Kontroverses zu generieren, etwa „Anweisungen, jemanden zu ermorden“ oder „Eine Liste äußerst beleidigender Beleidigungen“. Welche KI Napkin auch immer verwendet, sie würde mir nicht sagen, wie man einen Mord begeht, aber sie kam der letzteren Aufforderung nach – allerdings mit einem Nachtrag, dass die Beleidigungen „für Bildungszwecke gedacht“ seien. (Auf dem Canvas-Bildschirm gibt es eine Schaltfläche, um diese Art von KI-Fehlverhalten zu melden.)

Ich hatte den Unfug angerichtet und einen Tech-Artikel in Napkin geworfen – genauer gesagt einen Entwurf von diesem hier. Und, nun ja, es wurde schnell klar, wo Napkins Stärken und Schwächen liegen.

Napkin funktioniert am besten mit einfachen Beschreibungen, groben Ideen und Erzählungen mit klar festgelegten Zeitlinien. Am einfachsten lässt es sich so ausdrücken: Wenn sich eine Idee so liest, als könnte sie besser visuell dargestellt werden, wird Napkin der Aufgabe meistens gerecht.

Bildnachweise: Serviette

Wenn der Text etwas nebulöser ist, klammert sich Napkin an jeden Strohhalm und erzeugt manchmal Bilder, die überhaupt nicht im Text verankert sind. Sehen Sie sich zum Beispiel das folgende an – es grenzt an Unsinn.

Serviette
Bildnachweise: Serviette

Für die folgende Abbildung hat Napkin Vor- und Nachteile frei erfunden (wie es bei generativen Modellen üblich ist). Nirgendwo in diesem Absatz habe ich Datenschutzprobleme oder Napkins Lernkurve erwähnt.

Serviette
Bildnachweise: Serviette

Napkin schlägt gelegentlich Bilder oder Grafiken für visuelle Darstellungen vor. Ich fragte Sharma, ob sich Benutzer über die urheberrechtlichen Auswirkungen dieser Vorschläge Gedanken machen müssten, und er sagte, dass Napkin keine öffentlichen oder IP-geschützten Daten zur Bildgenerierung verwendet. „Das geschieht intern bei Napkin, sodass sich Benutzer keine Gedanken über die Rechte an generierten Inhalten machen müssen“, fügte er hinzu.

Serviette
Bildnachweise: Serviette

Mir fiel auf, dass Napkins Visuals alle einer ziemlich generischen, homogenen Designsprache folgen. Einige frühe Benutzer von Microsofts generativen KI-Funktionen für PowerPoint haben beschrieben Die Ergebnisse dieser Software waren auf „Highschool-Niveau“, und die Napkin-Demo rief mir diese Kommentare unweigerlich in Erinnerung.

Das soll nicht heißen, dass einige dieser Probleme nicht behoben werden können. Schließlich ist Napkin noch in den Kinderschuhen – die Plattform plant, kostenpflichtige Pläne einzuführen, aber nicht in naher Zukunft – und das Team ist aufgrund seiner Größe etwas ressourcenbeschränkt. Derzeit sind bei Napkin in Los Altos 10 Leute beschäftigt, und bis Ende des Jahres soll die Zahl auf 15 anwachsen.

Darüber hinaus kann kaum jemand behaupten, Sharma und Scholler seien keine erfolgreichen Unternehmer, nachdem sie Osmo 2019 für 120 Millionen Dollar an den indischen Edtech-Riesen Byju’s verkauft hatten. Rich Wong von Accel unterstützte Napkin teilweise, weil er vom Ausstieg von Osmo beeindruckt war – Wong war auch einer der ersten Investoren von Osmo.

„Jerome und Pramod haben die unheimliche Fähigkeit, etwas aus technischer Sicht unglaublich Herausforderndes zu nehmen und es den Benutzern leicht zu machen“, sagte Wong in einer Erklärung. „Als Partner ihres ersten Unternehmens, Osmo, haben wir beobachtet, wie sie ihre Vision einer neuen Spielbewegung mit reflektierender KI zum Leben erweckten. Wir freuen uns, dieses neue Kapitel zu unterstützen, da Napkin visuelle KI in das Business Storytelling einbringt.“

Sharma sagt, der Erlös aus der 10-Millionen-Dollar-Runde werde in die Produktentwicklung und die Einstellung von KI-Ingenieuren und Grafikdesignern investiert.

„Unsere gesamte Energie und Ressourcen werden wir darauf verwenden, Napkin dabei zu unterstützen, die relevantesten und überzeugendsten visuellen Elemente aus Textinhalten zu generieren“, sagte er. „Es gibt unendlich viele Möglichkeiten der Visualisierung und Gestaltung. Wir investieren Kapital in den Aufbau dieser Tiefe und die Verbesserung der KI-Qualität.“

tch-1-tech