Facebook-Eigentümer Meta öffnet Zugang zu großem Sprachmodell für KI-Forschung

Soul Hackers 2 Erscheinungsdatum Ankuendigungstrailer enthuellt

Facebook-Besitzer Metaplattformen Inc eröffnet den Zugang zu a großes Sprachmodell für die Erforschung künstlicher Intelligenz, teilte das Social-Media-Unternehmen am Dienstag mit. Meta said sein Modell war das erste Sprachmodell mit 175 Milliarden Parametern, das der breiteren KI-Forschungsgemeinschaft zur Verfügung gestellt wurde.

„Large Language Models“ sind Verarbeitungssysteme für natürliche Sprache, die mit großen Textmengen trainiert werden und in der Lage sind, Leseverständnisfragen zu beantworten oder neuen Text zu generieren. In einem Blogbeitrag sagte Meta, dass die Veröffentlichung seines „Open Pretrained Transformer (OPT-175B)“-Modells die Fähigkeit der Forscher verbessern würde, zu verstehen, wie große Sprachmodelle funktionieren. Meta sagte, Beschränkungen des Zugangs zu solchen Modellen hätten „den Fortschritt bei den Bemühungen behindert, ihre Robustheit zu verbessern und bekannte Probleme wie Verzerrung und Toxizität zu mindern“. Die Technologie der künstlichen Intelligenz, die ein Schlüsselbereich der Forschung und Entwicklung für mehrere große Online-Plattformen ist, kann die gesellschaftlichen Vorurteile der Menschen in Bezug auf Themen wie Rasse und Geschlecht aufrechterhalten. Einige Forscher haben Bedenken hinsichtlich der Schäden, die durch große Sprachmodelle verbreitet werden können. Meta sagte, es „hoffe, die Vielfalt der Stimmen zu erhöhen, die die ethischen Überlegungen zu solchen Technologien definieren“. Der Technologieriese sagte, um Missbrauch zu verhindern und „die Integrität zu wahren“, veröffentlichte er das Modell unter einer nichtkommerziellen Lizenz, um sich auf Forschungsanwendungsfälle zu konzentrieren. Meta sagte, der Zugang zu dem Modell würde akademischen Forschern und Personen gewährt, die mit der Regierung, der Zivilgesellschaft und akademischen Organisationen verbunden sind, sowie Forschungslabors der Industrie. Die Version enthält die vortrainierten Modelle und den Code, um sie zu trainieren und zu verwenden.


gn-tech