Schlagwort: Benchmarks
Die Leute nutzen Super Mario jetzt, um die KI zu bewerten
Dachte Pokémon war eine harte Benchmark für KI? Eine Gruppe von Forschern argumentiert, dass Super Mario Bros. noch schwieriger ist. Hao Ai Lab, eine Forschungsorganisation an der University of California…
Hat Xai über die Benchmarks von Grok 3 gelogen?
Debatten über AI -Benchmarks – und wie sie von KI -Labors gemeldet werden – werden in die öffentliche Sicht auf die öffentliche Sicht. Diese Woche ein OpenAI -Mitarbeiter beschuldigt Elon…
Diese Woche in AI: Vielleicht sollten wir AI -Benchmarks vorerst ignorieren
Willkommen im regulären KI -Newsletter von Tech! Wir machen ein bisschen eine Pause, aber Sie finden alle unsere KI -Berichterstattung, einschließlich meiner Kolumnen, unserer täglichen Analyse und den Nachrichten in…
Deepseek behauptet, das Modell „Argumenting“ schlägt die O1 von Openai auf bestimmten Benchmarks
Das chinesische AI Lab Deepseek hat eine offene Version von Deepseek-R1 veröffentlicht, seinem sogenannten Argumentationsmodell, das sie behauptet, sowie OpenAs O1 auf bestimmten AI-Benchmarks. R1 ist von der AI Dev…
DeepSeek behauptet, dass sein Argumentationsmodell bei bestimmten Benchmarks das o1 von OpenAI übertrifft
Das chinesische KI-Labor DeepSeek hat eine offene Version von DeepSeek-R1 veröffentlicht, seinem sogenannten Reasoning-Modell, das nach eigenen Angaben bei bestimmten KI-Benchmarks genauso gut abschneidet wie OpenAIs o1. R1 ist auf…
Der KI-Forscher François Chollet ist Mitbegründer einer gemeinnützigen Organisation, die Benchmarks für AGI erstellen soll
Der ehemalige Google-Ingenieur und einflussreiche KI-Forscher François Chollet ist Mitbegründer einer gemeinnützigen Organisation, die bei der Entwicklung von Benchmarks helfen soll, die KI auf „menschliche“ Intelligenz untersuchen. Die gemeinnützige ARC…
Deep-Tech-Startups mit technisch versierten CEOs erzielen laut Studie höhere Finanzierungsrunden
SaaS-Gründer, die herausfinden möchten, was sie für die nächste Runde brauchen, können sich auf das berühmte jährliche SaaS-Finanzierungsserviette. (Der Begriff bezieht sich auf Pläne oder Berechnungen, die „auf der Serviette…
Anthropic will eine neue, umfassendere Generation von KI-Benchmarks finanzieren
Anthropic startet eine Programm um die Entwicklung neuer Arten von Benchmarks zu finanzieren, mit denen die Leistung und Wirkung von KI-Modellen bewertet werden können, einschließlich generativer Modelle wie dem eigenen…
Da das Wachstum immer schwieriger zu fassen ist, entstehen neue Benchmarks für Softwareprodukte
Sogar die am schnellsten wachsenden Software-Startups expandieren nicht mehr so schnell wie früher. Natürlich ist dies teilweise freiwillig; Sie müssen Wachstum in Kauf nehmen, wenn Sie Rentabilität wollen, und umgekehrt.…
Wissenschaftler berichten über „Benchmarks“ für extremes Weltraumwetter
Hochenergetische „relativistische“ Elektronen – sogenannte „Killer“-Elektronen – sind eine der Hauptursachen für Strahlungsschäden an Satelliten, weshalb das Verständnis ihrer Aktivitätsmuster von entscheidender Bedeutung ist. Ausbrüche geladener Teilchen und Magnetfelder der…