Eine von Ilya Sutskever empfohlene Leseliste zu Machine Learning/KI
- The Annotated Transformer
- The First Law of Complexodynamics
- The Unreasonable Effectiveness of RNNs
- Understanding LSTM Networks
- Recurrent Neural Network Regularization
- Keeping Neural Networks Simple by Minimizing the Description Length of the Weights
- Pointer Networks
- ImageNet Classification with Deep CNNs
- Order Matters: Sequence to sequence for sets
- GPipe: Efficient Training of Giant Neural Networks using Pipeline Parallelism
- Deep Residual Learning for Image Recognition
- Multi-Scale Context Aggregation by Dilated Convolutions
- Neural Quantum Chemistry
- Attention Is All You Need
- Neural Machine Translation by Jointly Learning to Align and Translate
- Identity Mappings in Deep Residual Networks
- A Simple NN Module for Relational Reasoning
- Variational Lossy Autoencoder
- Relational RNNs
- Quantifying the Rise and Fall of Complexity in Closed Systems: The Coffee Automaton
- Neural Turing Machines
- Deep Speech 2: End-to-End Speech Recognition in English and Mandarin
- Scaling Laws for Neural LMs
- A Tutorial Introduction to the Minimum Description Length Principle
- Machine Super Intelligence Dissertation
- Ab Seite 434: Kolmogorov-Komplexität
- CS231n Convolutional Neural Networks for Visual Recognition
Linksammlung: https://arc.net/folder/D0472A20-9C20-4D3F-B145-D2865C0A9FEE
3 Kommentare
Es scheint ein Problem mit dem Crawling durch den Neo-Bot zu geben.
Reddit blockiert es wohl. Ich habe es manuell eingefügt ;)
Hacker-News-Diskussion
Zusammenfassung der Hacker-News-Kommentare
Die Überschrift verschleiert den Umfang dieser Aufgabe. Wenn man hineinklickt, um zu sehen, was das ist:
Vor einiger Zeit habe ich die Liste auch unter Link gespiegelt, damit sie sich leichter mit wget herunterladen lässt (z. B. alle arXiv-PDFs)
wget-Befehl kann man alle arXiv-PDFs herunterladen.pdfunitezu einer einzigen PDF zusammengefügt und in einer Druckerei als Spiralbindung drucken lassen. Das Ergebnis war sehr gut.Man sollte im Hinterkopf behalten, dass es keine Bestätigung gibt, dass dies die tatsächliche Liste ist.
Wie lange dauert es, die Voraussetzungen dafür zu lernen, wenn man noch keinen CS-Hintergrund hat?
Was viele vergessen: Ohne ein ordentliches, greifbares Ziel wird man sich, egal wie viele grundlegende oder interessante Papers man liest, am Ende trotzdem an nichts erinnern.
Es gibt einige frühere Diskussionen dazu, die bis auf Oktober 2022 zurückgehen. Ich frage mich, wie veraltet die Liste inzwischen ist.
Das ist doch nur der Bookmark-Ordner von irgendjemandem. Wo ist der Beweis, dass diese Dinge von Ilya empfohlen wurden?
Die Behauptung, das seien 90 % von dem, was im Machine Learning wichtig ist, wirkt etwas gewagt.
Darauf steht überhaupt nichts zu LLMs, dabei passiert gerade bei In-Context Learning, Retrieval Augmentation, Tool Use und Multimodalität besonders viel.
30 Studien zu lesen bedeutet nicht, dass man sie auch „gelernt und verstanden“ hat. Vor allem nicht, wenn man bei null anfängt.