- Ein von Jan Leike, dem Leiter des Alignment-Teams von OpenAI, im Blog veröffentlichter Beitrag, mit DeepL übersetzt
- Alignment bedeutet, „ein KI-System auf einen Menschen auszurichten“
- Es gibt zwei Kategorien der Ausrichtung: auf „individuelle Präferenzen (jeder möchte eine auf sich ausgerichtete KI)“ und auf „kollektive Präferenzen (wofür kann KI verwendet werden und wie sollte ihr Standardverhalten sein?)“
- Dieser Beitrag behandelt die zweite Kategorie
Vorschlag: simulierte deliberative Demokratie
- Die Kernidee ist, große Sprachmodelle zum Training zu verwenden, um „deliberative Demokratie“ nachzuahmen
- Deliberative Demokratie ist ein Entscheidungs- oder Politikgestaltungsprozess, bei dem eine zufällig ausgewählte kleine Gruppe der Öffentlichkeit („Mini-Public“) ausdrücklich deliberiert
- Wie man simulierte deliberative Demokratie aufbaut
- Datensätze mit Wertefragen sammeln
- Aufzeichnungen menschlicher Deliberation
- hintergrundkonditioniertes Imitationslernen
- Simulation: Fragen zu neuen Werten
1 Kommentare
Bitte lesen Sie auch den Beitrag von Seungjun Choi „Ergänzende Erläuterung zum Kontext dieses Artikels“. (Ein Link dazu befindet sich auch am Anfang des Dokuments)
https://facebook.com/seungjoon.choi/posts/…