Wie verbringt Amazon-CTO Werner Vogels – ein Mann mit unzähligen Millionen Werten, der während der COVID-19-Pandemie das kleine Airbnb im Zentrum von Amsterdam, in dem er gelebt hatte, komplett gekauft hat – seine Tage? So wie es aussieht: Entwicklung KI-gestützter Meeting-Zusammenfassungs-Apps. Stelle dir das vor.
In einem Post Diese Woche beschreibt Vogels in seinem persönlichen Blog Distill, eine Open-Source-App, die er mit seinem „OCTO“-Team (Office of the CTO) entwickelt hat, um ihre Telefonkonferenzen zu transkribieren und zusammenzufassen. Distill nimmt eine Audioaufzeichnung eines Meetings (in Formaten wie MP3, FLAC und WAV), analysiert sie und erstellt eine Zusammenfassung zusammen mit einer Liste der zu erledigenden Punkte. Optional kann diese Zusammenfassung und Liste über benutzerdefinierte Integrationen an Plattformen wie Slack ausgespuckt werden.
Wie man es von einer App des CTO von Amazon erwarten kann, verlässt sich Distill auffällig auf kostenpflichtige Amazon-Produkte und -Dienste, um die rechenintensive Arbeit zu erledigen. AWS Transcribe führt die Transkription von Distill durch; Amazon S3 bietet Speicherplatz für die Audiodateien des Meetings; und Bedrock, die generative KI-Entwicklungssuite von Amazon, übernimmt die Zusammenfassung.
Aber warum eine Besprechungszusammenfassung erstellen, wenn es unzählige Tools gibt, die diesen Zweck erfüllen würden? Nun, ich muss mir vorstellen, dass Vogels dachte, warum nicht? Er verfügt über jede Menge Ressourcen und scheinbar genug Freizeit für Hobby-Programmierprojekte. Dem Blog zufolge versucht er bereits, die Codebasis von Distill von Python nach Rust zu portieren. (CTO zu sein ist eine schöne Arbeit, wenn man sie bekommen kann.)
Das Einzigartige an Distill ist, dass Sie auswählen können, welches KI-Modell die Besprechungszusammenfassung durchführt. Standardmäßig handelt es sich um Sonnet, ein Mittelklassemodell aus der Claude 3-Familie von Anthropic. (Die große Beteiligung von Amazon an Anthropic könnte etwas mit dieser Designentscheidung zu tun haben.) Aber jedes in Bedrock gehostete Modell wird funktionieren, wie Metas Llama 3 und Modelle der KI-Startups Mistral, AI21 Labs und Cohere.
Vogels verspricht nicht, dass Distill keine Fehler machen wird.
„Denken Sie daran, KI ist nicht perfekt“, schreibt er. „Einige der Zusammenfassungen, die wir zurückbekommen … weisen Fehler auf, die eine manuelle Korrektur erfordern. Aber das ist in Ordnung, denn es beschleunigt unsere Prozesse trotzdem. Es ist lediglich eine Erinnerung daran, dass wir weiterhin kritisch sein und in den Prozess eingebunden sein müssen. Kritisches Denken ist heute so wichtig wie je zuvor.“
Ich würde argumentieren, dass die Notwendigkeit, an der Zusammenfassung beteiligt zu sein, den Zweck einer automatischen Zusammenfassung zunichte macht. Sie können genauso gut einen Stenographen beauftragen. Aber Sie werden Vogels nie dabei erwischen, wie er schlecht über die Technologie redet, die sein Arbeitgeber verkauft. Und ich wette, das ist der Grund, warum er immer noch CTO ist.