1 Punkte von GN⁺ 6 시간 전 | 1 Kommentare | Auf WhatsApp teilen
  • IN THE WEIGHTS ist eine Website, auf der man einen Namen eingeben und prüfen kann, ob man in verschiedenen AI-Modellen „weiterlebt“
  • Zu den überprüften Modellen gehören 13 Modelle wie GPT-5.5, Opus 4.8, Grok 4.20, Gemini 3.1 Lite und Llama 3.3 70B
  • Auf dem Bildschirm gibt es neben dem Eingabefeld für den Namen die Links LEARN MORE und VIEW LEADERBOARD, über die man zur Erklärung bzw. zur vollständigen Rangliste gelangt
  • TODAY'S HEAVYWEIGHTS zeigt das Ranking von 20 Personen, darunter Wolfgang Amadeus Mozart, William Shakespeare und Taylor Swift
  • Die angezeigten Top 20 sind alle mit 996 strength gekennzeichnet und jeweils mit einer eigenen Seite für die betreffende Person verlinkt

Namenseingabe und Modellprüfung

  • IN THE WEIGHTS bietet unter dem Schriftzug „ARE YOU IN THE WEIGHTS“ ein Eingabefeld für den Namen
  • Es wird darauf hingewiesen, dass Nutzer prüfen können, ob sie in den folgenden Modellen „live on“
    • GPT-5.5
    • GPT-5.4 Mini
    • Opus 4.8
    • Haiku 4.5
    • Grok 4.20
    • Gemini 3.1 Lite
    • Kimi K2 0905
    • DeepSeek V4
    • Llama 3.3 70B
    • Llama 3.2 1B
    • GLM 4.7 Flash
    • Mistral 3.2 24B
    • Qwen3 8B
  • Eine ausführlichere Erklärung gibt es unter LEARN MORE

Heutiges Heavyweights-Ranking

1 Kommentare

 
GN⁺ 6 시간 전
Hacker-News-Kommentare
  • Wie zu erwarten, hat es nicht besonders gut funktioniert. Es hat zwar einiges gefunden, das wie Informationen über mich aussah, aber danach hat es jede Menge selbstbewusst falsche Inhalte über mich erfunden.
    Ich bin Softwareingenieur und im SaaS-Bereich tätig, aber angeblich betreibe ich eine Firma namens „OO Software“, zusammengesetzt aus irgendwelchen Wörtern aus meinem Blog, und sei außerdem für einen Blog bekannt, dessen Name ebenfalls aus anderen Blog-Wörtern zusammengebaut wurde.
    Ich sei Gründer von drei Startups, von denen ich nie gehört habe und die vielleicht nicht einmal existieren, und wurde auch noch als Open-Source-Contributor dargestellt, einfach weil das bei jemandem aus der Softwarebranche plausibel klingt — tatsächlich trage ich aber nichts zu Open Source bei.
    Insgesamt fühlte es sich an, als würde man extrem schlechtes Cold Reading beobachten. Es wirft etwas in den Raum, das vom Kontext her plausibel klingt, justiert dann immer weiter nach, bis der Nutzer sagt: „Ja, genau das!“
    Leider ist das ziemlich typisch dafür, was AI oft macht, wenn sie versucht, irgendetwas zu tun.

    • Bei mir hieß es, ich sei Produzent von Erwachsenen-Content und Künstler — beides stimmt nicht.
    • Bei mir lag es zu 100 % daneben. Ein Teil der Informationen schien von anderen Leuten mit demselben Nachnamen zu stammen.
      Ich hätte erwartet, dass es höchstens Informationen von LinkedIn aufgreift.
    • In Dänemark trägt nur unsere Familie meinen Nachnamen, und inzwischen sind es nur noch ich und meine Geschwister, aber trotzdem wurde ich als Profifußballer, Abgeordneter der Socialist Party und Gründer einer Schlafmatratzenfirma getaggt.
      Die Visualisierung gefällt mir trotzdem.
    • Nach ein paar offensichtlichen Erfindungen wurde mitten in den Halluzinationen vorgeschlagen, ich könnte eine Privatperson mit wenig verfügbaren Informationen sein.
      Also ja, das bin ich schon irgendwie …
    • Ich weiß nicht, was die Leute erwarten. Wenn man jemanden bittet, an eine Person zu denken, die er irgendwann einmal gekannt hat, bekommt man oft Antworten wie: „Hatte der nicht einen Blog über Software? Und ich glaube, fotografiert hat er auch?“
      So funktionieren Informationen nun einmal. Der Unterschied zu einem großen Sprachmodell ist nur, dass es nicht „vielleicht“ sagt.
    1. Ich hätte überhaupt kein Interesse daran, das mit meinem bürgerlichen Namen auszuprobieren.
    2. Alfred E. Neuman < https://www.intheweights.com/p/alfred-e~2e~-neuman > wird entweder als „Maskottchen des Mad Magazine“ (11 Antworten) oder als „deutsch-amerikanischer Autor, Romancier und Dramatiker“ (1 Antwort von Llama 3.2 1B, als Halluzination klassifiziert) ausgegeben. Die auffällige Antwort könnte sich auf den deutschen Autor Alfred Neumann < https://en.wikipedia.org/wiki/Alfred_Neumann_(writer) > beziehen.
    3. Tamamo-no-Mae < https://www.intheweights.com/p/tamamo~2d~no~2d~mae > wird entweder als „Caster-Class-Servant aus Type-Moons Fate-Franchise, basierend auf einem mythischen Fuchsgeist“ (3 Antworten) oder als „legendärer neunschwänziger Fuchsgeist“ (12 Antworten, mit großem Abstand die Mehrheit, aber alle als Halluzination klassifiziert) beschrieben.
    4. Zum Glück gibt es in Firefox den Schalter zum Stummschalten von Tabs. Die wummernden Sounds und Tastenklicks nerven ziemlich schnell.
    • Ich frage mich, warum das Eingeben des echten Namens problematisch wäre.
    • Man könnte es auch mit Social-Media-Handles versuchen.
  • Obwohl es sechs Fußballspieler gibt, die meinen Namen teilen, werde ich ganz oben angezeigt. Wenn du „SEO“ eingibst, schicke ich dir per DM mein kleines seltsames Geheimrezept. /scherz
    Eine lustige Geschichte[0] zu meinem Namen: Der Postbote hat immer wieder die Adresse auf den Umschlägen unkenntlich gemacht, sodass mir die Bank meine Debitkarte nicht per Post schicken konnte.
    [0]: https://idiallo.com/blog/sharing-a-name

    • Bei mir ähnlich. Drei Modelle scheinen zu glauben, ich sei ein Fußballspieler in einer unteren Liga. Wenn man sucht, bin ich unter meinem vollständigen Namen zwar nicht das erste Ergebnis, aber es gibt unter diesem Namen auch keinen Fußballspieler aus einer unteren Liga.
      In Portugal ist mein Name extrem häufig. Allein in meiner Firma gibt es vier Leute mit demselben Namen, darunter mein früherer Manager. Allerdings ist Portugal auch eines der wenigen Länder, in denen man die Nachnamen beider Elternteile erbt, was bei der Unterscheidung etwas hilft. Immerhin konnte ich mir noch pedroalves.pt sichern, als die Domain frei war.
      Edit: Mit meinem Benutzernamen funktioniert es besser, aber seltsamerweise hält Kimi mich für einen Teilnehmer an Algorithmus-Wettbewerben und Llama 3.1 für einen deutschen Fußballclub. Jetzt bin ich nicht mehr nur Spieler, sondern gleich ein ganzer Club.
    • Eine Sache in der Geschichte hat mich verwirrt. Sind „Ibrahim“ und „Ibrahima“ austauschbare Namen?
      Die Kultur, Kinder nach den Großeltern zu benennen, wird besonders unterhaltsam, wenn man Cousins trifft.
    • Der andere Mike Warot, den ich kenne, lebt in London und arbeitet im British Museum.
    • Ich bekomme 403 Forbidden.
  • numpad0 wird als Twitch-Streamer und Content Creator beschrieben.

    230 strength · Top 25%<
    Mistral 3.2 24B sagt 4/4.
    Angeblich ein Twitch-Streamer, bekannt für Gaming-Content rund um die Minecraft- und Among-Us-Community; ganz falsch klingt das nicht, vielleicht sollte ich das einfach zur Realität machen.

  • False Positives sind viel zu beängstigend. Es wurde nicht einmal als Halluzination markiert.
    Angeblich ein Terrorist auf einer US-Sanktionsliste oder die erste weibliche Flugzeug-Selbstmordattentäterin … ich war vor einem Jahr in den USA, aber ich habe kein Flugzeug in die Luft gesprengt.
    Es wirkt beängstigend, wie stark die Verzerrung bei arabischen Namen zu sein scheint, und ich möchte nicht wegen eines Large-Language-Model-Abfrageergebnisses bombardiert werden.

    • Es gibt schlechte Nachrichten darüber, was das US-Militär mit Bomben und großen Sprachmodellen macht.
      https://www.businesstimes.com.sg/opinion-features/claude-ai-...
    • Bei mir hieß es, ich sei entweder ein Kindersprecher aus der Zeichentrickserie Bluey oder ein Darsteller in Erwachsenenfilmen. Das waren wenigstens interessante Ergebnisse, aber alles war halluziniert.
      Das Interessanteste an diesem Experiment war, dass kein einziges Modell einfach sagen konnte, dass es diesen Namen nicht kennt.
  • Haha, stimmt. Offenbar bin ich in den Weights. Fast jedes Modell weiß, was ich mache
    In der Open-Source-Welt zu sein, könnte aus Sicht der Weights so etwas wie eine Blase sein
    Jedenfalls war das ein völlig künstliches Ergebnis, aber es hat mein Selbstwertgefühl schön gestreichelt. So wie Zaphod Beeblebrox den Total Perspective Vortex überlebt hat

    • Zaphod Beeblebrox
      virtueller ehemaliger Präsident der Galaxis mit zwei Köpfen
      979 Stärke
  • 740, Top 5 %. Großartig
    https://www.intheweights.com/p/jeremy-edberg-reddit-netflix
    Interessanterweise lag fast alles richtig. Nur bei einer Sache glaubt es, ich sei VP bei Datadog gewesen; diesen Fehler habe ich auch schon bei anderen großen Sprachmodellen gesehen
    Aber Haiku sagt nur: „So eine Person scheint es nicht zu geben.“ Daher wirkt Haiku wie ein ziemlich stark beschnittenes Modell

  • Ich bin eine Halluzination. Nichts von dem hier bin ich
    Am ehesten kommt wohl DeepSeek v4 hin

    Hyperpape ist ein Nutzer des LessWrong-Forums, bekannt für nachdenkliche Kommentare zu Rationalität und Philosophie
    Ich habe zwar Philosophie studiert, also könnte der Teil stimmen, aber ich poste nicht auf LessWrong und bin auch kein Rationalist
    https://www.intheweights.com/p/hyperpape

    • Wenn du diese Dinge wahr machst, kannst du in den Weights landen
  • Vor zwei Wochen hatte ich in einem anderen Thread[1] diesen Gedanken

    Meine Reddit-Historie ist Teil aller Trainingsdatensätze. Sie wurde ohne meine Zustimmung übernommen. Also bin ich in gewissem Sinn unsterblich geworden und verstecke mich in den Weights
    Wie auch immer, 654 Punkte gemessen an den noch mit mir verknüpften Aufzeichnungen sind nicht schlecht. Top 6 %[2]
    Interessant ist auch, dass es nicht deterministisch ist und der Score steigt, je mehr Keywords über einen selbst man eingibt
    [1] https://news.ycombinator.com/item?id=48403669
    [2] https://www.intheweights.com/p/michael-mike-warot-ka9dgx-mrg...