In der ersten Informatikvorlesung bekamen wir die Aufgabe, mit einem Raspberry Pi ohne Programmiererfahrung oder Anleitung "irgendetwas" zu bauen.
Drei Teammitglieder kauften einen Feuchtigkeitssensor, entwickelten die Idee eines Hochwasser-Erkennungssystems, installierten es unter einer Brücke und wollten bei Hochwasser den zuständigen Personen eine E-Mail schicken.
In der Vorführung führten sie ein einfaches Skript aus, das Meldungen wie "Warten auf Feuchtigkeit" und "Feuchtigkeit erkannt" ausgab, und inszenierten es so, als wäre eine E-Mail verschickt worden, wodurch sie das Projekt erfolgreich abschlossen.
Es wird Enttäuschung darüber ausgedrückt, dass Google trotz der Erfindung des Transformers in mehreren Bereichen gegenüber Konkurrenten zurückfällt.
Bei Google Docs, Cloud-Services und autonomer Fahrtechnik verliert Google Marktanteile an Microsoft, Amazon, Tesla und andere.
Es wird infrage gestellt, ob Sundar Pichai dem AI-Modell Fragen gestellt hat, bei denen sich der Wahrheitsgehalt schwer beurteilen lässt, was Zweifel an der Genauigkeit des Modells aufwirft.
Die Benchmark-Ergebnisse zeigten keine große Verbesserung, in der Demo wirkte es jedoch so, als liefere das Modell korrekte Informationen.
Multimodale Modelle werden zwar als wichtig für den Fortschritt der AI gesehen, doch es brauche einen Beleg dafür, dass das Modell tatsächlich Kausalzusammenhänge modelliert.
Die Gemini-Webseite und ihr Inhalt wirken wie eine Nachahmung von Apple-Marketing.
Übertriebene Sprache, ein zu starker Fokus auf Diversität und unnötige Animationen wirken wie der Versuch eines kleinen Unternehmens, größer zu erscheinen, als es ist.
Es wird darauf hingewiesen, dass Googles Modellankündigung den Eindruck vermittelte, Video- und Audioeingaben verarbeiten zu können, obwohl die Demo in Wirklichkeit geschnitten war.
Der Teil zur Musikgenerierung war ebenfalls kein tatsächlicher Output des Modells, sondern nur eine einfache Beschreibung.
Google wird dafür kritisiert, Benchmarks und Demos zu manipulieren und sich nur auf übertriebene PR für Aktionäre zu konzentrieren.
Jemand teilt seine langjährige Erfahrung mit der Swype-Texteingabe.
Anfangs mag sie ungewohnt sein, doch wenn man sich daran gewöhnt hat, ist sie sehr effizient.
Alle Produkte können anfangs Schwierigkeiten haben, aber mit der Zeit zeigen sich ihre Vorteile.
Es wird berichtet, dass die über Twitter verlinkte Bloomberg-Seite nicht mehr verfügbar ist.
Auf der neuen Seite wird erwähnt, dass einige Inhalte manipuliert wurden.
Es wird das Vertrauensproblem angesprochen, ob Videos, Audio und Bilder echt sind oder nicht.
Es wird die Frage aufgeworfen, wie man feststellen kann, ob ein Remote-Mitarbeiter tatsächlich ein Mensch oder ein teilweise generiertes Wesen ist.
Man könnte einen falschen Eindruck von den Gemini-Funktionen bekommen, aber es wird erwartet, dass Echtzeit-Interaktion bald in die App aufgenommen wird.
Es könnte Missverständnisse über die AI-Funktionen geben, aber im Video gibt es einen Disclaimer zur Bearbeitung.
Gute Spracherkennung und Text-to-Speech-Technologie existieren bereits, daher ist dieser Teil kein Problem.
Die zentrale Frage betrifft den Teil mit dem Becherspiel und ob das Modell kurze Videoeingaben verarbeitet.
1 Kommentare
Hacker-News-Kommentare
In der ersten Informatikvorlesung bekamen wir die Aufgabe, mit einem Raspberry Pi ohne Programmiererfahrung oder Anleitung "irgendetwas" zu bauen.
Es wird Enttäuschung darüber ausgedrückt, dass Google trotz der Erfindung des Transformers in mehreren Bereichen gegenüber Konkurrenten zurückfällt.
Es wird infrage gestellt, ob Sundar Pichai dem AI-Modell Fragen gestellt hat, bei denen sich der Wahrheitsgehalt schwer beurteilen lässt, was Zweifel an der Genauigkeit des Modells aufwirft.
Die Gemini-Webseite und ihr Inhalt wirken wie eine Nachahmung von Apple-Marketing.
Es wird darauf hingewiesen, dass Googles Modellankündigung den Eindruck vermittelte, Video- und Audioeingaben verarbeiten zu können, obwohl die Demo in Wirklichkeit geschnitten war.
Jemand teilt seine langjährige Erfahrung mit der Swype-Texteingabe.
Es wird berichtet, dass die über Twitter verlinkte Bloomberg-Seite nicht mehr verfügbar ist.
Es wird das Vertrauensproblem angesprochen, ob Videos, Audio und Bilder echt sind oder nicht.
Man könnte einen falschen Eindruck von den Gemini-Funktionen bekommen, aber es wird erwartet, dass Echtzeit-Interaktion bald in die App aufgenommen wird.
Es könnte Missverständnisse über die AI-Funktionen geben, aber im Video gibt es einen Disclaimer zur Bearbeitung.