- Ein Artikel darüber, wie sich mit der ChatGPT-API Buchempfehlungen aus Hacker-News-(HN)-Threads extrahieren lassen
- Der Autor analysierte fast 200 HN-Stories, deren Titel das Wort "book" enthielten und die nicht auf andere Seiten verlinkten
- Der Autor nutzte die GPT-API, um die Daten zu klassifizieren und die Informationen im JSON-Format auszugeben
- Die Daten wurden über die Hacker-News-API abgerufen; anschließend rief der Autor die Chat Completions API auf, um Buchtitel, Autoren und URLs aus dem Text zu extrahieren
- Die 50 wichtigsten Buchempfehlungen wurden aufgelistet; am häufigsten empfohlen wurde "Structure and Interpretation of Computer Programs" von Abelson und Sussman
- Es wurde festgestellt, dass die API gelegentlich kein gültiges JSON zurückgab, insbesondere wenn ChatGPT auf einen Kommentar wie "thanks" antwortete oder eine Frage stellte
- Der Autor gestaltete den Prompt so, dass Antworten ohne Titel verworfen werden, weil ChatGPT gelegentlich Erwähnungen von Autoren ohne den Titel des betreffenden Buchs einfügte
- Die Verarbeitung von 57.000 Kommentaren verursachte mit der GPT-3.5-Turbo-API Kosten von etwa 40 US-Dollar
- Der Autor stellte fest, dass die Ergebnisse von GPT selbst bei einer Temperatur von 0 zwischen einzelnen Aufrufen variieren und im Vergleich zum früheren GPT-3-Modell stärker schwanken
- Der Autor fand außerdem heraus, dass GPT zwar Links im Text erkennen kann, HTML-Tags jedoch entfernt werden müssen, damit statt abgeschnittener Linktexte tatsächlich URLs ausgewählt werden
- Der Autor teilte Beispiele für von ChatGPT erzeugte JSON-Ausgaben sowie den für die Aufgabe verwendeten Prompt
- Die von GPT erzeugten Rohdaten wurden nach Titeln sortiert und zur weiteren Analyse bereitgestellt
- Als Übung fügte der Autor den Amazon-URLs in der Tabelle Amazon-Affiliate-Links hinzu
1 Kommentare
Hacker-News-Kommentare