32 Punkte von xguru 2023-02-13 | Noch keine Kommentare. | Auf WhatsApp teilen
  • Ein Tutorial, das unter der Annahme, dass man mit Python und NumPy vertraut ist, GPT einfach implementiert und anschließend das von OpenAI veröffentlichte GPT-2-Modell lädt, um Text zu generieren

Inhaltsverzeichnis

  • Was ist GPT?
  • Setup: Encoder, Hyperparameter, Parameter
  • Grundlegende Layer: GeLU, Softmax, Layer Normalization, Linear
  • GPT-Architektur
    • Embeddings
    • Decoder-Stack
    • Projektion auf das Vokabular
    • Decoder-Block
    • Positionsweises Feed-Forward-Netzwerk
    • Multi-Head Causal Self-Attention
  • Alles zusammenfügen
  • What's Next?
    • GPU/TPU-Unterstützung
    • Backpropagation
    • Batching
    • Inference-Optimierung
    • Training
    • Evaluation
    • Architekturverbesserungen

Noch keine Kommentare.

Noch keine Kommentare.