Da der weltweite Konsum von Inhalten steigt und die Nachfrage nach nicht-englischsprachigen Inhalten die nach englischen Filmen und Serien übersteigt, nutzt IMAX KI, um die Lokalisierung seiner Originalinhalte zu skalieren.
Die Unterhaltungs- und Medienbranche wuchs um 5 % auf 2,8 Billionen US-Dollar im Jahr 2023, laut einem Bericht von PwC. Es wird erwartet, dass die Branche ihre Expansion fortsetzt, allerdings mit einer bescheidenen durchschnittlichen jährlichen Wachstumsrate von fast 4 % auf 3,4 Billionen US-Dollar in den nächsten fünf Jahren. Nicht englischsprachige Inhalte sind wächst auch auf den englischen Märkten schnelldarunter die USA, Großbritannien, Australien und Kanada. Letztes Jahr berichtete Netflix a 90 % Wachstum bei der Zuschauerzahl nicht-englischsprachiger Inhalte in Großbritannien in den letzten drei Jahren.
IMAX hat all dies berücksichtigt und erforscht nun die Lokalisierung mithilfe von KI, um mehr Aufmerksamkeit zu erregen.
Am Montag gab das kanadische Produktionstheaterunternehmen, das für seine riesigen Kinosäle und fesselnden Filmerlebnisse bekannt ist, seine Partnerschaft mit einem in Dubai ansässigen Startup bekannt Camb.ai seine KI-Sprachmodelle zu verwenden, um Originalinhalte, einschließlich Dokumentationen, zu übersetzen.
Camb.ai, das seine KI-Synchronisation und Sprachübersetzung bereits für Live-Sportveranstaltungen und -Ligen eingesetzt hat, darunter Australian Open, Eurovision SportUnd Major League Soccerbietet sein Boli-Modell für die Sprach-zu-Text-Übersetzung und Mars für die Sprachemulation an. Die Modelle sind über die DubStudio-Plattform des Startups verfügbar, die 140 Sprachen unterstützt, darunter verschiedene Sprachen mit geringen Ressourcen, für die keine nennenswerten Daten im Internet verfügbar sind.
„Unternehmen wie OpenAI und Anthropic haben eine andere Vision der Gesellschaft“, sagte Akshat Prakash, Mitbegründer und CTO von Camb.ai, in einem exklusiven Interview. „Sie versuchen, Modelle zu erstellen, die sehr horizontal sind und eine große Bandbreite an Aufgaben abdecken können. … Das müssen wir überhaupt nicht tun. Einige unserer Modelle umfassen weniger als 100 Millionen Parameter und sind hochspezialisiert.“
Prakash, ein ehemaliger Apple-Ingenieur, der mit dem Team zusammenarbeitete, das KI- und ML-Modelle für Siri entwickelte, gründete letztes Jahr gemeinsam mit seinem Vater Avneesh Prakash Camb.ai.
„Wir sind eine Generation voneinander entfernt und in Indien aufgewachsen. Im Abstand von 30 Jahren standen wir vor denselben sprachlichen Herausforderungen“, sagte der CTO gegenüber Tech.
Er sagte, dass Camb.ai 70 % seiner Modelle mit akademisch lizenzierten Datensätzen vorab trainiert habe, die kommerziell nutzbar seien. Bei den restlichen 30 % geht es um die Feinabstimmung der Daten, die das Unternehmen von frühen Partnern erhält, die seine Modelle für die KI-basierte Synchronisation und Übersetzung einsetzen.
„Was wir nicht tun, und wir sind sehr vorsichtig gewesen und haben das völlig vermieden, ist möglicherweise die Abschaffung des Internets“, behauptete Prakash. „Manche Unternehmen haben das Gefühl, dass sie damit durchkommen, weil sie eine verbraucherorientierte App oder ein Tool entwickeln, und glauben, dass es in Ordnung sei, etwa 10 Petabyte des Internets abzukratzen.“
Camb.ai verwendet einen „dreischichtigen“ Ansatz zur Bereitstellung einer KI-basierten Übersetzung, der die Grundschicht seiner Boli- und Mars-Modelle, die Infrastrukturschicht, die diese KI-Modelle hostet, und dann die DubStudio-Plattform für das Frontend umfasst.
Im Gegensatz zu anderen KI-basierten Modellen nimmt Boli von Camb.ai Eingabe-Sprach-Tokens entgegen, erzeugt Ausgabe-Text-Tokens in der übersetzten Sprache und behält Nuancen bei, behauptet Prakash. Sobald Boli den Text generiert hat, übersetzt Mars den Text mithilfe desselben Audioeingangssignals in Sprache, um die Leistung des eigentlichen Audios zu erfassen, einschließlich Umgebungsgeräuschen, beispielsweise der Hintergrundmusik des jubelnden Publikums bei Sportveranstaltungen, sagte er.
Prakash sagte gegenüber Tech, dass die Technologie von Camb.ai Sprachübersetzungen in bis zu 10 Sprachen gleichzeitig mit einer Latenzzeit von 20 bis 30 Sekunden liefert, die durch die Streaming- und Sendeverzögerung von 30 bis 40 Sekunden abgedeckt werden kann.
IMAX wird KI-Übersetzungen schrittweise einführen, beginnend mit ressourcenintensiven Sprachen. Die Bereitstellung erfolgt nach internen Tests der Technologie von Camb.ai anhand ihres ursprünglichen Inhalts.
„Obwohl wir uns erst in der Anfangsphase der Partnerschaft befinden, werden wir weiterhin zusammenarbeiten, um ihr Potenzial besser auszuloten und herauszufinden, wie sie uns am besten voranbringen kann“, sagte Mark Welton, Präsident von IMAX Global.
Welton gab an, dass der KI-Einsatz dazu beitragen würde, Übersetzungskosten einzusparen, ohne Einzelheiten preiszugeben.
Camb.ai hat derzeit ein Team von 50 Mitarbeitern. Im Februar sammelte das Unternehmen in einer von Courtside Ventures angeführten Seed-Runde 4 Millionen US-Dollar. Prakash sagte gegenüber Tech, dass das Startup eine größere Pre-Series-A-Runde abschließt, um seine Reichweite und Mitarbeiterzahl zu vergrößern.