Das KI-Computing-Startup Cerebras veröffentlicht ChatGPT-ähnliche Open-Source-Modelle

Die Kolosseen von Elden Ring oeffnen morgen endlich im kostenlosen

Künstliche Intelligenz Chipstart Cerebras-Systeme Am Dienstag gab es bekannt, dass es Open-Source-ChatGPT-ähnliche Modelle für die Forschungs- und Geschäftswelt zur kostenlosen Nutzung veröffentlicht hat, um mehr Zusammenarbeit zu fördern. Das im Silicon Valley ansässige Unternehmen Cerebras veröffentlichte sieben Modelle, alle trained auf seinem KI-Supercomputer namens Andromeda, einschließlich kleinerer 111-Millionen-Parameter-Sprachmodelle zu einem größeren 13-Milliarden-Parameter-Modell.

„Es gibt eine große Bewegung, das zu schließen, was Open Source in der KI war … es ist nicht überraschend, da jetzt viel Geld darin steckt“, sagte Andrew Feldman, Gründer und CEO von Cerebras. „Die Aufregung in der Community, die Fortschritte, die wir gemacht haben, war zum großen Teil darauf zurückzuführen, dass sie so offen war.“ Modelle mit mehr Parametern können komplexere generative Funktionen ausführen. OpenAIs Chatbot ChatGPT Ende letzten Jahres gestartet, hat zum Beispiel 175 Milliarden Parameter und kann Poesie und Forschung hervorbringen, was dazu beigetragen hat, das breite Interesse und die Finanzierung der KI zu wecken. Laut Cerebras können die kleineren Modelle auf Telefonen oder intelligenten Lautsprechern eingesetzt werden, während die größeren auf PCs oder Servern laufen, obwohl komplexe Aufgaben wie die Zusammenfassung großer Passagen größere Modelle erfordern. Karl Freund, ein Chip-Berater bei Cambrian AI, sagte jedoch, dass größer nicht immer besser ist. „Es wurden einige interessante Artikel veröffentlicht, die zeigen, dass (ein kleineres Modell) genau sein kann, wenn man es mehr trainiert“, sagte Freund. „Es gibt also einen Kompromiss zwischen größer und besser ausgebildet.“ Feldman sagte, sein größtes Modell habe etwas mehr als eine Woche zum Trainieren gebraucht, eine Arbeit, die dank der Architektur des Cerebras-Systems, das einen Chip von der Größe eines Esstellers enthält, der für das KI-Training gebaut wurde, normalerweise mehrere Monate dauern kann. Die meisten KI-Modelle werden heute auf den Chips von Nvidia Corp trainiert, aber immer mehr Startups wie Cerebras versuchen, an diesem Markt teilzuhaben. Die auf Cerebras-Maschinen trainierten Modelle können auch auf Nvidia-Systemen für weitere Schulungen oder Anpassungen verwendet werden, sagte Feldman.


gn-tech