Mit einer so schnelllebigen Branche wie der KI Schritt zu halten, ist eine große Herausforderung. Bis eine KI dies für Sie erledigen kann, finden Sie hier eine praktische Zusammenfassung der Geschichten der letzten Woche in der Welt des maschinellen Lernens sowie bemerkenswerte Forschungsergebnisse und Experimente, die wir nicht alleine behandelt haben.
Man könnte sagen, dass Apple letzte Woche sehr sichtbar und mit Absicht seinen Hut in das hart umkämpfte KI-Rennen geworfen hat. Es ist nicht so, dass das Unternehmen nicht bereits zuvor seine Investitionen in KI und deren Priorisierung signalisiert hätte. Aber auf seiner WWDC-Veranstaltung machte Apple deutlich, dass KI hinter vielen Funktionen seiner kommenden Hardware und Software steckt.
Beispielsweise kann iOS 17, das später in diesem Jahr erscheinen soll, mithilfe von Computer Vision Rezepte für ähnliche Gerichte aus einem iPhone-Foto vorschlagen. KI unterstützt auch Journal, ein neues interaktives Tagebuch, das personalisierte Vorschläge basierend auf Aktivitäten in anderen Apps macht.
iOS 17 wird außerdem über eine verbesserte Autokorrektur verfügen, die auf einem KI-Modell basiert und die nächsten Wörter und Phrasen, die ein Benutzer verwenden könnte, genauer vorhersagen kann. Mit der Zeit wird es maßgeschneidert und lernt auf unterhaltsame Weise die am häufigsten verwendeten Wörter eines Benutzers – einschließlich Schimpfwörter.
KI spielt auch beim Augmented-Reality-Headset Vision Pro von Apple eine zentrale Rolle – insbesondere bei FaceTime beim Vision Pro. Durch maschinelles Lernen kann der Vision Pro einen virtuellen Avatar des Trägers erstellen und dabei eine ganze Reihe von Gesichtsverzerrungen interpolieren – bis hin zur Hautspannung und Muskelarbeit.
Möglicherweise handelt es sich nicht um generative KI, die heute zweifellos die heißeste Unterkategorie der KI ist. Mir scheint jedoch, dass Apples Absicht darin bestand, eine Art Comeback zu starten – um zu zeigen, dass es nach Jahren scheiternder maschineller Lernprojekte, von der enttäuschenden Siri bis zum selbstfahrenden Auto in der Produktionshölle, nicht zu unterschätzen ist.
Stärke zu projizieren ist nicht nur ein Marketingtrick. Berichten zufolge hat Apples historische Unterleistung im Bereich KI laut The Information zu einer ernsthaften Abwanderung von Fachkräften geführt Berichterstattung dass talentierte Wissenschaftler für maschinelles Lernen – darunter ein Team, das an der Art von Technologie gearbeitet hatte, die OpenAIs ChatGPT zugrunde liegt – Apple verließen, um sich in grünere Gefilde zu stürzen.
Dass man es mit KI ernst meint, zeigt sich tatsächlich Versand Produkte mit KI-Unterstützung scheinen ein notwendiger Schritt zu sein – und ein Maßstab, den einige Konkurrenten von Apple in der jüngeren Vergangenheit tatsächlich nicht erreicht haben. (Hier ist suchen auf dich, Meta.) Allem Anschein nach hat Apple letzte Woche einen Durchbruch geschafft – auch wenn es nicht besonders laut darüber wurde.
Hier sind die anderen bemerkenswerten KI-Schlagzeilen der letzten Tage:
- Meta macht einen Musikgenerator: Nicht zu übertreffen Von Google hat Meta seinen eigenen KI-gestützten Musikgenerator herausgebracht – und im Gegensatz zu Google als Open Source bereitgestellt. Genannt MusicGenMetas Musikgenerierungstool kann eine Textbeschreibung in etwa 12 Sekunden Audio umwandeln.
- Regulierungsbehörden prüfen die KI-Sicherheit: Nach der Ankündigung der britischen Regierung letzte Woche OpenAI, Google DeepMind und Anthropic haben angekündigt, im Herbst einen „globalen“ KI-Sicherheitsgipfel auszurichten, und haben sich verpflichtet, „frühzeitigen oder vorrangigen Zugriff“ auf ihre KI-Modelle zu gewähren, um die Forschung zu Bewertung und Sicherheit zu unterstützen.
- KI, cloud treffen: Salesforce bringt eine neue Produktreihe auf den Markt, die seine Position im hart umkämpften KI-Bereich stärken soll. Die Suite mit dem Namen AI Cloud, die Tools zur Bereitstellung „unternehmenstauglicher“ KI umfasst, ist Salesforces jüngster interdisziplinärer Versuch, sein Produktportfolio um KI-Funktionen zu erweitern.
- Text-zu-Video-KI testen: Tech hat Gen-2 ausprobiert, die KI von Runway, die kurze Videoclips aus Text generiert. Das Urteil? Es ist noch ein langer Weg, bis die Technologie auch nur annähernd Filmmaterial in Filmqualität erzeugen kann.
- Mehr Geld für Unternehmens-KI: Ein Zeichen dafür, dass für generative KI-Startups jede Menge Geld vorhanden ist, Zusammenhängendas ein KI-Modell-Ökosystem für das Unternehmen entwickelt, gab letzte Woche bekannt, dass es im Rahmen seiner Serie-C-Runde 270 Millionen US-Dollar eingesammelt hat.
- Kein GPT-5 für Sie: OpenAI trainiert GPT-5 immer noch nicht, sagte OpenAI-CEO Sam Altman auf einer kürzlich von der Economic Times veranstalteten Konferenz – Monate nachdem das von Microsoft unterstützte Startup versprochen hatte, „für einige Zeit“ nicht an dem Nachfolger von GPT-4 zu arbeiten, nachdem viele Branchenmanager dies getan hatten und Wissenschaftler äußerten Bedenken über die schnelle Weiterentwicklung von Altmans großen Sprachmodellen.
- KI-Schreibassistent für WordPress: Automatischdas Unternehmen hinter WordPress.com und Hauptmitwirkender am Open-Source-WordPress-Projekt, hat letzten Dienstag einen KI-Assistenten für das beliebte Content-Management-System auf den Markt gebracht.
- Instagram bekommt einen Chatbot: Bildern zufolge arbeitet Instagram möglicherweise an einem KI-Chatbot durchgesickert vom App-Forscher Alessandro Paluzzi. Den Leaks zufolge, die laufende App-Entwicklungen widerspiegeln, die möglicherweise ausgeliefert werden oder nicht, können diese KI-Agenten Fragen beantworten oder Ratschläge geben.
Andere maschinelles Lernen
Wenn Sie neugierig sind, wie sich KI in den nächsten Jahren auf Wissenschaft und Forschung auswirken könnte: Ein Team aus sechs nationalen Labors hat genau darüber einen Bericht verfasst, der auf den im letzten Jahr durchgeführten Workshops basiert. Man könnte versucht sein zu sagen, dass der Bericht möglicherweise bereits veraltet ist, da er auf den Trends des letzten Jahres und nicht auf diesem Jahr basiert, in dem die Dinge so schnell vorangekommen sind. Doch obwohl ChatGPT große Wellen im Technologie- und Verbraucherbewusstsein geschlagen hat, ist es in Wahrheit für ernsthafte Forschung nicht besonders relevant. Die größeren Trends sind es, und sie bewegen sich in einem anderen Tempo. Der 200-seitige Bericht ist definitiv keine leichte Lektüre, aber jeder Abschnitt ist hilfreich in leicht verdauliche Abschnitte unterteilt.
An anderen Orten im nationalen Laborökosystem arbeiten Forscher aus Los Alamos intensiv daran Weiterentwicklung des Bereichs der Memristoren, die Datenspeicherung und -verarbeitung kombinieren – ähnlich wie unsere eigenen Neuronen. Es handelt sich um einen grundlegend anderen Berechnungsansatz, der außerhalb des Labors allerdings noch keine Früchte getragen hat, aber dieser neue Ansatz scheint den Ball zumindest voranzubringen.
Darin wird die Fähigkeit der KI zur Sprachanalyse gezeigt Bericht über Polizeiinteraktionen mit Personen, die sie angehalten haben. Die Verarbeitung natürlicher Sprache wurde als einer von mehreren Faktoren verwendet, um sprachliche Muster zu identifizieren, die eine Eskalation von Stopps vorhersagen – insbesondere bei schwarzen Männern. Die Methoden des menschlichen und maschinellen Lernens verstärken sich gegenseitig. (Lesen Sie den Artikel hier.)
Tiefer Atemzug ist ein Modell, das auf Atemaufzeichnungen von Patienten in der Schweiz und in Brasilien trainiert wird und von dem seine Entwickler an der EPFL behaupten, dass es dabei helfen kann, Atemwegserkrankungen frühzeitig zu erkennen. Der Plan besteht darin, es in einem Gerät namens Pneumoskop unter einer Spin-out-Firma herauszubringen Onescope. Wir werden wahrscheinlich mit ihnen Kontakt aufnehmen, um weitere Informationen darüber zu erhalten, wie es dem Unternehmen geht.
Ein weiterer KI-Gesundheitsfortschritt kommt von Purdue, wo Forscher entsprechende Software entwickelt haben nähert sich hyperspektralen Bildern mit einer Smartphone-Kamera an, um Bluthämoglobin und andere Messwerte erfolgreich zu verfolgen. Es handelt sich um eine interessante Technik: Mithilfe des Super-Zeitlupenmodus des Telefons erhält es viele Informationen über jedes Pixel im Bild, sodass ein Modell genügend Daten erhält, aus denen es extrapolieren kann. Es könnte eine großartige Möglichkeit sein, diese Art von Gesundheitsinformationen ohne spezielle Hardware zu erhalten.
Ich würde einem Autopiloten noch nicht zutrauen, Ausweichmanöver durchzuführen, aber das MIT bringt die Technologie durch entsprechende Forschungen immer näher hilft der KI, Hindernissen auszuweichen und gleichzeitig eine gewünschte Flugbahn beizubehalten. Jeder alte Algorithmus kann wilde Richtungsänderungen vorschlagen, um nicht abzustürzen, aber es ist schwieriger, dies zu tun und gleichzeitig die Stabilität aufrechtzuerhalten und nichts darin zu zerdrücken. Dem Team gelang es, einen simulierten Jet dazu zu bringen, autonom und ohne Stabilitätsverlust einige Top-Gun-ähnliche Manöver durchzuführen. Es ist schwieriger als es klingt.
Als letztes in dieser Woche ist Disney Research dabei, bei dem man sich immer darauf verlassen kann, dass es etwas Interessantes zeigt, das zufällig auch für das Filmemachen oder den Betrieb von Themenparks gilt. Bei CVPR zeigten sie a leistungsstarkes und vielseitiges „Netzwerk zur Erkennung von Gesichtspunkten“ das Gesichtsbewegungen kontinuierlich und mithilfe beliebiger Referenzpunkte verfolgen kann. Motion Capture funktioniert bereits ohne die kleinen Capture-Punkte, soll aber dadurch noch hochwertiger – und gediegener für die Schauspieler – werden.