Die gigantische technologische Der Sprung, den Modelle des maschinellen Lernens in den letzten Monaten gezeigt haben, macht alle neugierig auf die Zukunft der KI – aber auch nervös wegen ihrer unangenehmen Folgen. Nachdem Text-to-Image-Tools von Stability AI und OpenAI zum Stadtgespräch wurden, ist die Fähigkeit von ChatGPT, intelligente Konversationen zu führen, die neue Besessenheit in allen Sektoren.
In China, wo die Tech-Community den Fortschritt im Westen immer genau beobachtet hat, suchen Unternehmer, Forscher und Investoren nach Wegen, sich im Bereich der generativen KI einen Namen zu machen. Technologieunternehmen entwickeln Tools, die auf Open-Source-Modellen basieren, um Privat- und Unternehmenskunden anzuziehen. Einzelpersonen profitieren von KI-generierten Inhalten. Regulierungsbehörden haben schnell reagiert, um zu definieren, wie Text-, Bild- und Videosynthese verwendet werden sollte. Unterdessen werfen US-Tech-Sanktionen Bedenken hinsichtlich der Fähigkeit Chinas auf, mit dem Fortschritt der KI Schritt zu halten.
Während die generative KI gegen Ende des Jahres 2022 die Welt im Sturm erobert, werfen wir einen Blick darauf, wie sich diese explosive Technologie in China durchsetzt.
Chinesische Aromen
Dank viraler Kunstschaffen-Plattformen wie Stable Diffusion und DALL-E 2 ist generative KI plötzlich in aller Munde. Auf der anderen Seite der Welt haben auch chinesische Technologiegiganten die Öffentlichkeit mit ihren gleichwertigen Produkten in ihren Bann gezogen und dem Geschmack und dem politischen Klima des Landes eine Wendung gegeben.
Baidu, das sich in Suchmaschinen einen Namen gemacht hat und in den letzten Jahren sein Spiel im Bereich des autonomen Fahrens intensiviert hat, operiert ERNIE-ViLGa 10-Milliarden-Parameter-Modell trainiert auf einem Datensatz von 145 Millionen chinesischen Bild-Text-Paaren. Wie fair ist es gegenüber seinem amerikanischen Gegenstück? Unten sind die Ergebnisse der Aufforderung „Kinder essen Shumai in New York Chinatown“, die Stable Diffusion erhalten hat, im Vergleich zur gleichen Aufforderung auf Chinesisch (纽约唐人街小孩吃烧卖) für ERNIE-ViLG.
Als jemand, der in China und Chinatowns mit Dim Sum aufgewachsen ist, würde ich sagen, dass die Ergebnisse ein Unentschieden sind. Keiner hat das richtige Shumai, was im Dim-Sum-Kontext eine Art von ist Sukkulenten, Garnelen und Schweinefleischknödel in einer halboffenen gelben Verpackung. Während Stable Diffusion die Atmosphäre eines Dim-Sum-Lokals in Chinatown vermittelt, ist das Shumai ausgeschaltet (aber ich sehe, wohin die Maschine geht). Und während ERNIE-ViLG generiert a Art von Shumai, es ist eine Sorte, die eher in Ostchina als in der kantonesischen Version zu finden ist.
Der Schnelltest spiegelt die Schwierigkeit wider, kulturelle Nuancen zu erfassen, wenn die verwendeten Datensätze von Natur aus voreingenommen sind – vorausgesetzt, Stable Diffusion hätte mehr Daten über die chinesische Diaspora und ERNIE-ViLG ist wahrscheinlich auf eine größere Vielfalt von Shumai-Bildern trainiert, die außerhalb Chinas seltener sind.
Ein weiteres chinesisches Tool, das Lärm gemacht hat, ist das von Tencent Andere Dimension Ich, das Fotos von Menschen in Anime-Charaktere verwandeln kann. Der KI-Generator weist seine eigene Voreingenommenheit auf. Für chinesische Benutzer gedacht, startete es unerwartet in anderen Anime-liebenden Regionen wie Südamerika. Aber die Benutzer stellten bald fest, dass die Plattform schwarze und übergroße Personen nicht identifizieren konnte, Gruppen, die im japanischen Anime merklich fehlen, was zu anstößigen KI-generierten Ergebnissen führte.
Neben ERNIE-ViLG gibt es ein weiteres großes chinesisches Text-to-Image-Modell Taiyi, eine Idee von IDEA, einem Forschungslabor unter der Leitung des renommierten Informatikers Harry Shum, der Mitbegründer von Microsofts größter Forschungsniederlassung außerhalb der USA, Microsoft Research Asia. Das Open-Source-KI-Modell wird mit 20 Millionen gefilterten chinesischen Bild-Text-Paaren trainiert und verfügt über eine Milliarde Parameter.
Im Gegensatz zu Baidu und anderen gewinnorientierten Technologieunternehmen ist IDEA eine von wenigen Institutionen, die in den letzten Jahren von lokalen Regierungen unterstützt wurden, um an Spitzentechnologien zu arbeiten. Das bedeutet, dass das Zentrum wahrscheinlich mehr Forschungsfreiheit genießt, ohne den Druck, den kommerziellen Erfolg voranzutreiben. Mit Sitz im Technologiezentrum Shenzhen und unterstützt von einer der wohlhabendsten Städte Chinas ist es ein aufstrebendes Unternehmen, das es wert ist, gesehen zu werden.
Regeln der KI
Chinas generative KI-Tools zeichnen sich nicht nur durch die heimischen Daten aus, aus denen sie lernen; Sie werden auch von lokalen Gesetzen geprägt. Als MIT Technology Review wies darauf hin, Baidus Text-to-Image-Modell filtert politisch sensible Keywords heraus. Das ist zu erwarten, da Zensur im chinesischen Internet seit langem eine universelle Praxis ist.
Was für die Zukunft des noch jungen Feldes von größerer Bedeutung ist, sind die neuen regulatorischen Maßnahmen, die auf das abzielen, was die Regierung als „Deep-Synthese-Technologie“ bezeichnet, was „Technologie bezeichnet, die Deep Learning, virtuelle Realität und andere Synthesealgorithmen verwendet, um Text, Bilder, Audio, Video und virtuelle Szenen.“ Wie bei anderen Arten von Internetdiensten in China, von Spielen bis hin zu sozialen Medien, werden Benutzer gebeten, ihre Namen zu überprüfen, bevor sie generative KI-Apps verwenden. Die Rückverfolgbarkeit von Prompts zur realen Identität wirkt sich zwangsläufig einschränkend auf das Nutzerverhalten aus.
Aber auf der positiven Seite könnten diese Regeln zu einem verantwortungsbewussteren Umgang mit generativer KI führen, die bereits anderswo missbraucht wird, um NSFW und sexistische Inhalte zu produzieren. Die chinesische Verordnung zum Beispiel verbietet Menschen ausdrücklich, KI-erzeugte Fake News zu generieren und zu verbreiten. Wie das umgesetzt wird, liegt allerdings bei den Dienstleistern.
„Es ist interessant, dass China bei den Regulierungsversuchen an vorderster Front steht [generative AI] als Land“, sagte Yoav Shoham, Gründer von AI21 Labs, einem in Israel ansässigen OpenAI-Rivalen, in einem Interview. „Es gibt verschiedene Unternehmen, die der KI Grenzen setzen … Jedes Land, das ich kenne, bemüht sich darum, die KI zu regulieren oder irgendwie sicherzustellen, dass das Rechtssystem oder das Sozialsystem mit der Technologie Schritt hält, insbesondere bei der Regulierung der automatischen Erzeugung des Inhalts.“
Aber es gibt noch keinen Konsens darüber, wie das sich schnell verändernde Feld regiert werden sollte. „Ich denke, es ist ein Bereich, den wir alle gemeinsam lernen“, gab Shoham zu. „Es muss eine gemeinsame Anstrengung sein. Es muss Technologen einbeziehen, die die Technologie tatsächlich verstehen und wissen, was sie tut und was sie nicht tut, den öffentlichen Sektor, Sozialwissenschaftler und Menschen, die von der Technologie betroffen sind, sowie die Regierung, einschließlich der kommerziellen und juristischen Art Aspekt der Verordnung.“
Monetarisierung von KI
Während sich Künstler darüber ärgern, durch leistungsstarke KI ersetzt zu werden, nutzen viele in China maschinelle Lernalgorithmen, um auf vielfältige Weise Geld zu verdienen. Sie gehören nicht zu den technisch versiertesten Leuten. Vielmehr sind sie Opportunisten oder Hausfrauen, die nach einer zusätzlichen Einnahmequelle suchen. Sie erkennen, dass durch die Verbesserung ihrer Eingabeaufforderungen Sie können die KI dazu verleiten, kreative Emojis oder atemberaubende Hintergrundbilder zu erstellen, die sie in sozialen Medien posten können, um Werbeeinnahmen zu steigern oder Downloads direkt in Rechnung zu stellen. Die wirklich Geschickten verkaufen ihre Ansagen auch an andere, die sich dem Spiel zum Geldverdienen anschließen wollen – oder sie sogar gegen eine Gebühr ausbilden.
Andere in China verwenden KI in ihren formellen Jobs wie z der Rest der Welt. Light-Fiction-Autoren zum Beispiel können billig Illustrationen für ihre Werke produzieren, ein Genre, das kürzer als Romane ist und oft Illustrationen enthält. Ein faszinierender Anwendungsfall, der die Bereiche der Fertigung möglicherweise stören kann, ist die Verwendung von KI zum Entwerfen von T-Shirts, Aufpressnägeln und Drucken für andere Konsumgüter. Durch die schnelle Generierung großer Chargen von Prototypen sparen Hersteller Konstruktionskosten und verkürzen ihren Produktionszyklus.
Es ist noch zu früh, um zu wissen, wie unterschiedlich sich die generative KI in China und im Westen entwickelt. Aber Unternehmer haben Entscheidungen auf der Grundlage ihrer frühen Beobachtungen getroffen. Einige Gründer sagten mir, dass Unternehmen und Fachleute im Allgemeinen gerne für KI bezahlen, weil sie einen direkten Return on Investment sehen, sodass Startups bestrebt sind, Anwendungsfälle für die Industrie zu entwickeln. Eine clevere Anwendung kam von Sequoia China-gestütztem Surreal (später in Movio umbenannt) und Hillhouse-gestütztem ZMO.ai, die während der Pandemie entdeckten, dass E-Commerce-Verkäufer Schwierigkeiten hatten, ausländische Modelle zu finden, da China seine Grenzen geschlossen hielt. Die Lösung? Die beiden Unternehmen arbeiteten an Algorithmen, die Modemodelle aller Formen, Farben und Rassen generierten.
Aber einige Unternehmer glauben nicht, dass ihre KI-gestützten SaaS die Art von explodierender Bewertung und kometenhaftem Wachstum erleben werden, die ihre westlichen Kollegen wie Jasper und Stability AI genießen. Im Laufe der Jahre haben mir zahlreiche chinesische Startups mitgeteilt, dass sie die gleiche Sorge haben: Chinas Unternehmenskunden sind im Allgemeinen weniger bereit, für SaaS zu bezahlen als diejenigen in entwickelten Volkswirtschaften, weshalb viele von ihnen beginnen, ins Ausland zu expandieren.
Der Wettbewerb im chinesischen SaaS-Bereich ist ebenfalls hart umkämpft. „In den USA kann man ziemlich gut abschneiden, indem man produktorientierte Software entwickelt, die nicht auf menschliche Dienste angewiesen ist, um Benutzer zu gewinnen oder zu halten. Aber selbst wenn Sie ein großartiges Produkt haben, könnte Ihr Rivale in China Ihren Quellcode über Nacht stehlen und Dutzende von Kundendienstmitarbeitern einstellen, die nicht so viel kosten, um Sie zu überflügeln“, sagte ein Gründer eines chinesischen Startups für generative KI , um Anonymität bitten.
Shi Yi, Gründer und CEO von Sales-Intelligence-Startup FlashCloud, stimmte zu, dass chinesische Unternehmen kurzfristigen Renditen häufig Vorrang vor langfristigen Innovationen einräumen. „In Bezug auf die Talententwicklung konzentrieren sich chinesische Technologieunternehmen eher darauf, sich bei Bewerbungen zu qualifizieren und schnelles Geld zu verdienen“, sagte er. Ein in Shanghai ansässiger Investor, der nicht genannt werden wollte, sagte, er sei „ein wenig enttäuscht, dass in diesem Jahr große Durchbrüche in der generativen KI außerhalb Chinas stattfinden“.
Straßensperren voraus
Selbst wenn chinesische Technologieunternehmen in das Training großer neuronaler Netze investieren wollen, fehlen ihnen möglicherweise die besten Werkzeuge. Im September schlug die US-Regierung China mit Exportkontrollen für High-End-KI-Chips. Während sich viele chinesische KI-Startups auf die Anwendungsfront konzentrieren und keine Hochleistungshalbleiter benötigen, die mit Datenmeeren umgehen können, bedeutet die Verwendung weniger leistungsstarker Chips für diejenigen, die Grundlagenforschung betreiben, dass die Berechnung länger dauert und mehr kostet, sagte ein Investor für Unternehmenssoftware bei einer führenden chinesischen VC-Firma und bat um Anonymität. Die gute Nachricht sei, argumentierte er, dass solche Sanktionen China dazu drängen, langfristig in fortschrittliche Technologien zu investieren.
Als ein Unternehmen, das sich selbst als führend in Chinas KI-Bereich bezeichnet, glaubt Baidu, dass die Auswirkungen der US-Chip-Sanktion auf sein KI-Geschäft sowohl kurz- als auch längerfristig „begrenzt“ sind, sagte der Executive Vice President und Leiter der AI Cloud Group des Unternehmens , Dou Shen, auf seiner Gewinnaufruf für Q3. Das liegt daran, dass „ein großer Teil“ von Baidus KI-Cloud-Geschäft „nicht zu sehr auf die hochentwickelten Chips angewiesen ist“. Und in Fällen, in denen High-End-Chips benötigt werden, hat es „eigentlich bereits genug auf Lager, um unser Geschäft kurzfristig zu unterstützen“.
Was ist mit der Zukunft? „Wenn wir es mittel- bis längerfristig betrachten, haben wir tatsächlich unseren eigenen entwickelten KI-Chip mit diesem Namen Kunlun“, sagte der Geschäftsführer selbstbewusst. „Durch die Verwendung unserer Kunlun-Chips [Inaudible] In großen Sprachmodellen wurde die Effizienz zur Durchführung von Text- und Bilderkennungsaufgaben auf unserer KI-Plattform um 40 % verbessert und die Gesamtkosten um 20 % bis 30 % gesenkt.“
Die Zeit wird zeigen, ob Kunlun und andere einheimische KI-Chips China einen Vorteil im generativen KI-Rennen verschaffen werden.