- Mitgründer und CSO Thomas Wolf hat Physik und Jura studiert
- Dies ist die Leseliste, die er 2016–17 gelesen hat, als er in die Bereiche NLP/AI/ML einstieg
- Man sollte also beachten, dass dies vor den Umwälzungen durch ChatGPT/Transformer/Diffusion war
- Das Buch "Deep Learning" ist eine gute Ressource, um sich einen schnellen Überblick über die aktuellen Werkzeuge zu verschaffen
- "Artificial Intelligence: A Modern Approach" ist eine hervorragende Ressource für alle Werkzeuge und Methoden aus der Zeit vor neuronalen Netzen
- "Machine Learning: A Probabilistic Perspective" ist eine hervorragende Ressource, um tiefer in probabilistische Ansätze einzutauchen und einen guten Einblick in Bayes’sche Werkzeuge zu bekommen
- "Information Theory, Inference and Learning Algorithms" ist ein kleines Juwel, das Wahrscheinlichkeit und Informationstheorie fast unglaublich klar erklärt
- "The Book of Why: The New Science of Cause and Effect" ist eine gute Einführung in Kausalität
- "Reinforcement Learning: An Introduction(Robustes Reinforcement Learning)" ist eine hervorragende Ressource für einen einführenden Überblick über Reinforcement Learning
- Drei hervorragende Ressourcen zu Natural Language Processing fand er interessant
- Ergänzt wurde dies durch einige Online-Kurse
- Wenn man nach der Revolution durch Transformer und großskaliges Training in dieses Feld einsteigt, würde man vermutlich einen anderen Weg wählen wollen
- Ein paar Ratschläge für 2024:
- Unser Buch zu NLP und Transformern lesen: Natural Language Processing with Transformers. Es stammt aus der Zeit vor ChatGPT, ist aber immer noch sehr relevant und behandelt am Ende sogar das Training von LLMs
- Einige Online-Kurse zu Deep Learning von bekannten Leuten aus dem Feld belegen
- Man kann aus der obigen Liste weiterhin einige Bücher zur allgemeinen Bildung lesen; insbesondere "Information Theory, Inference and Learning Algorithms" hält er nach wie vor für ein Juwel
- Hugging Face beitreten, um durch Praxis zu lernen :)
4 Kommentare
Der Name kam mir irgendwie bekannt vor, also habe ich nachgesehen und festgestellt, dass ich mir wohl Ende März das Video zu den Trends bei der Entwicklung von LLM-Modellen angeschaut hatte. (Ich habe es allerdings noch nicht ganz zu Ende gesehen ;_;)
Es handelt sich um ein YouTube-Video mit dem Titel 'A Little guide to building Large Language Models in 2024', das verschiedene Aspekte der LLM-Entwicklung behandelt, von der Datenaufbereitung bis hin zu Trainings- und Evaluierungsmethoden.
Video: https://youtube.com/watch/…
Folien: https://docs.google.com/presentation/d/…
⚠️Werbung⚠️ Zusammengefasster Beitrag: https://discuss.pytorch.kr/t/2024-llm/3890
<Deep Learning> - Ian Goodfellow, Yoshua Bengio, Aaron Courville http://aladin.kr/p/OLwph
<Künstliche Intelligenz 1~2 - 2 Bände> - Stuart Russell, Peter Norvig http://aladin.kr/p/g4yZY
<Machine Learning maschinelles Lernen> - Kevin Murphy http://aladin.kr/p/RGGL8
<Information Theory, Inference and Learning Algorithms (Hardcover)> - David MacKay http://aladin.kr/p/LFEp0
<The Book of Why: The New Science of Cause and Effect (Paperback)> - Dana Mackenzie, Judea Pearl http://aladin.kr/p/cLywB
<Solides Reinforcement Learning> - Richard Sutton, Andrew Barto http://aladin.kr/p/3NQoU
Natural Language Processing with Representation Learning - Kyunghyun Cho
https://github.com/nyu-dl/NLP_DL_Lecture_Note/…
<Neural Network Methods in Natural Language Processing (Paperback)> - Yoav Goldberg http://aladin.kr/p/non6R
<Der Standard der natürlichen Sprachverarbeitung> - Jacob Eisenstein http://aladin.kr/p/rPoLB
Vielen Dank fürs Zusammenfassen!!
Ich habe beim Weiterverbreiten des Beitrags auch die von Ihnen zusammengestellte Liste mit übernommen; falls das nicht gewünscht ist, werde ich sie wieder entfernen. 🙇♂️
https://discuss.pytorch.kr/t/gn-huggingface-ai-txt/4439/2
Vielen Dank T_T