Meta AI Demos

(aidemos.meta.com)

1 Punkte von GN⁺ 2025-02-10 | 1 Kommentare | Auf WhatsApp teilen

Meta bündelt seine neuesten KI-Experimente und Technik-Demos an einem Ort, damit neue Tools früh ausprobiert werden können
Behandelt Ideen an der Schnittstelle von Forschung, Kreativität und Technologie, darunter Experimente von FAIR und anderen Forschungsteams bei Meta
Die Demos sind in Tools auf Basis neuester Modelle, Tools rund um Segment Anything, spielerische leichte Demos und technikzentrierte Demos mit Fokus auf Forschungsergebnisse unterteilt
Nutzer können neue KI-Tools testen und dabei zur Entwicklung von KI-Technologien beitragen
Einige Technologien könnten künftig in Meta-Produkte integriert werden und bieten damit einen frühen Einblick in Funktionen in der Experimentierphase

Metas Erkundungsraum für KI-Experimente

AI Demos zeigt Metas neueste KI-Experimente und Technik-Demos gesammelt an
Enthält Demos von FAIR und anderen Forschungsteams von Meta
Nutzer erhalten frühen Zugang zu neuen KI-Tools und können sie selbst testen

Aufbau der Demos

Featured Experiments
- Hier lassen sich Tools sehen, die von den neuesten Modellfunktionen angetrieben werden
Featured Segment Anything tools
- Tools zu Segment Anything sind in einer eigenen Kategorie gebündelt
Playful Ideas
- Behandelt leichte Demos für Kreativität und spielerisches Ausprobieren
Technical Explorations
- Enthält Technik-Demos, die neue Forschungsergebnisse zeigen
- Tests durch Nutzer können zur Entwicklung von KI-Technologien beitragen, und einige Technologien könnten künftig in Meta-Produkte integriert werden

1 Kommentare

GN⁺ 2025-02-10

Meinungen auf Hacker News

Eine Sammlung von Demo-Tools; mit Segment Anything 2 lassen sich mit wenigen Klicks Video-Cutouts und visuelle Effekte erstellen.
Seamless Translation lässt einen die eigene Stimme in einer anderen Sprache hören, Animated Drawings erweckt handgezeichnete Skizzen als Animation zum Leben, und Audiobox ermöglicht Audio-Storys mit KI-generierten Stimmen und Geräuschen.
- Dort steht: „Diese Forschungsdemo ist nicht für Einwohner von Illinois oder Texas oder für Personen zugänglich, die aus diesen Bundesstaaten darauf zugreifen.“
  In Illinois oder Texas ist der Zugriff nicht möglich, vermutlich wegen der Stimmumwandlung und entsprechender KI-Gesetze.
  Ich hoffe, dass Gesetzgeber auch die nützlichen Anwendungsfälle sehen und die Gesetze so anpassen, dass sie Missbrauch ins Visier nehmen, statt generative KI insgesamt grob zu blockieren.
Seamless Translation ist ziemlich beeindruckend.
Ich spreche Englisch und Spanisch, habe einen englischen Satz aufgenommen und mir die spanische Ausgabe angehört; sie kam meinem Spanisch ziemlich nahe.
Natürlich hat mein Spanisch mehr kastilische Ausdrücke, aber ich hätte nicht erwartet, dass das erkannt wird.
- Der eigentliche Test wäre wohl, es einen Freund aus Mendoza, Argentinien, ausprobieren zu lassen.
  Ich bin zweisprachig, verstehe ihn aber immer noch nicht, und bei der Hälfte seiner Wörter bin ich mir nicht einmal sicher, ob es echte Wörter sind.
- Ich habe es ausprobiert, und es klang überhaupt nicht wie meine Stimme; es war eher irgendeine „generische“ Männerstimme, die das, was ich gesagt hatte, ins Deutsche übersetzte.
  Meine Frau sagte: „Nicht besonders gut, klingt überhaupt nicht wie deine Stimme“, und das reicht mir.
- Der entscheidende Punkt ist, ob die Stimme tatsächlich wie man selbst klang; bei mir war das überhaupt nicht der Fall.
- Ob Übersetzungstechnologie „jetzt angekommen“ ist, ist noch umstritten, aber irgendwann wird sie für die meisten praktischen Zwecke wohl als gut genug gelten und Sprachbarrieren faktisch beseitigen.
  Dann wird sie sicher auch die gesprochene Sprache in gewissem Maße beeinflussen; das ist zugleich beängstigend und spannend.
- Schade, dass die bereitgestellten Beispiele so schlecht und roboterhaft waren.
  Das hat mir die Lust genommen, es selbst auszuprobieren, aber vielleicht überlege ich es mir noch einmal.
Ich frage mich, ob es wie im HN-Titel absichtlich als Aidemos zusammengeschrieben wurde oder ob AI Demos gemeint ist.
- Da HN die Groß- und Kleinschreibung von eingereichten Titeln automatisch neu anpasst, scheint es möglich, dass es ursprünglich als „AIDemos by Meta“ eingereicht wurde.
Die Seamless Translation-Demo ist großartig.
Die übersetzte Stimme geht auch als meine echte Stimme durch, und wenn das in Echtzeit möglich wird, dürfte das enorm sein.
- Das ist bereits möglich.
  Kyutai hat letzte Woche eine auf dem Gerät laufende Demo für Echtzeit-Sprachübersetzung veröffentlicht; derzeit funktioniert sie auf dem iPhone 16 Pro nur für Französisch→Englisch: https://x.com/neilzegh/status/1887498102455869775
  Inferenzcode und Gewichte wurden ebenfalls veröffentlicht und sind auf GitHub zu finden: https://github.com/kyutai-labs/hibiki
Ich verstehe nicht so recht, worauf Meta mit AI eigentlich hinauswill
Sie scheinen viel Forschung zu betreiben, aber das Endziel bleibt unklar; bei Google oder MSFT kann ich es nachvollziehen, bei Meta kommt es nicht wirklich an
- Meta scheint zu glauben, dass am Ende des AI-Wettlaufs das Geld nicht bei Rechenzentren oder Modellen liegt, sondern in geschlossenen Ökosystemen und proprietären Daten
  Solange Modelle und Rechenzentren die Engpässe sind, wird Meta alles Mögliche tun, damit niemand Meta ins Wanken bringen kann
  Ähnlich wie Google die Anwendungsschicht des Webs schwer monetarisierbar gemacht hat, um geschlossene Ökosysteme zu verhindern, die die Suche blockieren
  Wenn Modelle und Hardware am Ende des Wettbewerbs zu Commoditys geworden sind, verfügt Meta über vollständige psychologische Profile auf individueller und Gruppenebene und kann sie erforschen sowie extrem präzise zugeschnittene Inhalte ausliefern
  Die wirklichen Konkurrenten könnten Apps wie „her“ sein, die Menschen aus sozialen Medien herausziehen und in ihre jeweils isolierten Welten schicken; in gewisser Weise ist Discord eine alternative Welt zum Meta-Ökosystem. Nämlich als hochfokussierte, nur per Einladung zugängliche kleine Communities
- https://gwern.net/complement
  Das große Muster im Technologiegeschäft, das Joel Spolsky 2002 beschrieb, ist die Kommodifizierung von Komplementärgütern
  Statt vertikaler Integration geht es um eine Strategie, bei der man in einem Produkt aus mehreren unverzichtbaren Schichten eine Schicht kontrolliert und den Wettbewerb in den darüber- und darunterliegenden Schichten fördert, damit dort kein monopolistischer Wettbewerber entsteht; dadurch senkt man die Preise an anderer Stelle im Stack bis auf Grenzkosten, senkt den Gesamtpreis und steigert die Nachfrage
  Selbst wenn das ursprüngliche Produkt sehr wertvoll ist und man Geld dafür verlangen könnte, kann es wertvoller sein, es kostenlos zu machen, wenn dadurch die Gewinne an anderer Stelle wachsen
  Das klassische Beispiel ist, dass Microsofts OS-Monopol PC-Hardware zur Commodity machte, was IBM schadete und Microsoft nützte
  Dieses Muster erklärt auch, warum große Tech-Unternehmen in Bereiche einsteigen, die oberflächlich betrachtet irrelevant oder selbstschädigend wirken. Die hohen Open-Source-Beiträge von Internetunternehmen und Googles Einstieg als Werbeunternehmen in Smartphone-Herstellung, Webbrowser-Entwicklung, Statistiksoftware, Glasfasernetze, kommunales WLAN, Funkfrequenzauktionen und DNS lassen sich alle als präventive Kommodifizierung anderer Unternehmen im Stack sehen – oder als Verteidigung dagegen, selbst so behandelt zu werden
- Ich habe mich das auch gefragt; im Moment wirkt das meiste wie eine Erkundungsphase
  Ähnlich wie sie früher ein wenig mit Crypto herumexperimentiert haben und dann das inzwischen fast beendete „Metaverse“-Experiment starteten. Natürlich kann auch solche Erkundung manchmal enorme Summen verschlingen
  Diese Demos zeigen zwar, wofür AI eingesetzt werden könnte, aber ob das für Metas Geschäft wirklich spielentscheidend ist und ob es für normale Nutzer eine gute Sache ist, ist noch offen
  Die veralteten und schlechten UIs von Facebook und Instagram haben sich seit über zehn Jahren kaum verändert, und obwohl dort 70.000 Menschen arbeiten, scheint der Fokus heute eher darauf zu liegen, Werbung aggressiver hineinzudrücken, statt die Nützlichkeit zu verbessern
  Selbst wenn das Geschäft weiter aus dem alten, fehlerhaften, 20 Jahre alten Facebook und der über zehn Jahre alten Instagram-App besteht: Wenn Meta wie damals bei React zur Entwicklung von Open-Source-Modellen beiträgt, sehe ich das insgesamt als Gewinn
- Nach dem Scheitern des „Metaverse“ könnte Meta versessen darauf sein, Geld in etwas anderes zu stecken, das vielleicht das nächste The Future(TM) wird
  Selbst wenn man es für unwahrscheinlich hält, dass LLMs der nächste große Trend sind, kann das aus Metas Sicht ziemlich rational sein. Sie haben sehr viel Geld und Umsatz, also können sie bei jedem neuen Hype mitmachen; wenn einer davon echt ist, bleiben sie nicht zurück, und wenn nicht, können sie es verkraften
  Ich vermute, dass das Interesse der meisten Big-Tech-Unternehmen an LLMs letztlich eher eine Form von Risikomanagement ist
- Wenn ich wiedergebe, was ich von jemandem gehört habe, der damit zu tun hat: Metas Ziel mit AI ist besseres Ad-Targeting
  Bessere Klassifizierung und Clusterbildung, bessere „Empfehlungen“ für Werbetreibende, inklusive visueller Elemente, Text und Video
  Solche Demos sind Nebeneffekte oder fast eine Art „Greenwashing“. Metas Kern- und einziges Geschäft ist Werbung, und jede andere Monetarisierung ist gescheitert
Die Segment Anything-Demo ist ziemlich beeindruckend; ich frage mich, ob sie irgendwo in ein echtes Produkt integriert ist
Als Hobby schneide ich für Freunde einfache Videos, und das sieht ziemlich nützlich aus
[0] https://sam2.metademolab.com/
- Photoroom [0] stammt aus Y Combinator, und das Produkt ist im Kern ziemlich nah an SAM mit viel Feinschliff und guter User Experience
  Ich weiß nicht, ob sie es tatsächlich nutzen, aber wenn nicht, sollten sie es meiner Meinung nach tun
  [0] https://www.photoroom.com/
- SwarmUI, ein Frontend für Bildgenerierungsmodelle, hat SAM2 integriert, sodass man bei Aufgaben wie Inpainting schnell Teile eines Bildes maskieren kann
  Sehr gut
- Es wird wahrscheinlich schon verwendet, aber vermutlich nicht auf diese Weise beworben
Für alle, die es interessiert: Meta FAIR stand für „Facebook Artificial Intelligence Research“ und wurde später in „Meta AI“ umbenannt[1]
[1]: https://en.wikipedia.org/wiki/Meta_AI
Die Liste ist nicht vollständig
Zum Beispiel fehlt die Demo von Meta Motivo, einem Modell zur Steuerung humanoider Körper: https://metamotivo.metademolab.com/
Meta versteht die Wirkung des Unterschieds zwischen GPT-3 und ChatGPT sehr gut
Das Modell ist der Ausgangspunkt; die User Experience, die Menschen dazu bringt, mit diesem Modell etwas zu tun, bringt die Intelligenz zum Vorschein
Besonders deutlich ist das bei visuellen Modellen: Zu sagen, SAM2 könne „alles sehen“, ist interessant, aber zu sehen, wie es einen Fußball nach einem Klick auch bei Verdeckung nahtlos durch das ganze Video verfolgt, ist beeindruckend
Es erscheint die Meldung „Die Website ist in dieser Region derzeit nicht verfügbar“
- Da es auf internationalen Märkten und in einigen US-Bundesstaaten unterschiedliche KI-Regulierungen gibt, müssen Unternehmen mit KI-Produkten sehr vorsichtig umgehen.
  Deshalb werden hochmoderne Modelle in bestimmten Regionen oft erst später bereitgestellt.
  Bei jeder kleinen Demo die gesamte Compliance zu prüfen und zu dokumentieren, lohnt sich im Verhältnis zum Aufwand kaum; vermutlich wurde sie daher so gekennzeichnet, dass sie nur in den USA und einigen Regionen erlaubt ist.
- Diese Meldung erscheint auch in den USA.
- Ich habe diese Meldung innerhalb der USA gesehen, konnte sie aber umgehen, als ich mein VPN auf LA eingestellt habe.
  Vielleicht, weil dort Meta-Ingenieure sitzen ¯_(ツ)_/¯
  Nach dem Zugriff stand dort folgender Hinweis:
  „Diese Forschungsdemo steht Einwohnern von Illinois oder Texas sowie Personen, die aus diesen Bundesstaaten darauf zugreifen, nicht offen.“
  Ich bin in Texas.

Meta AI Demos

Metas Erkundungsraum für KI-Experimente

Aufbau der Demos

Featured Experiments

Featured Segment Anything tools

Playful Ideas

Technical Explorations

Verwandte Beiträge

1 Kommentare

Meinungen auf Hacker News