3 Punkte von GN⁺ 2024-02-07 | 1 Kommentare | Auf WhatsApp teilen
  • Frage, was mit LLMs gebaut oder entwickelt wird
  • Der Fragesteller
    • entwickelt eine Chrome-Erweiterung: Implementierung einer Funktion, die Untertitel liest, um Sponsoring-Abschnitte in YouTube-Videos zu überspringen
    • experimentiert mit der Erklärung von Funktionsaufrufketten in verschiedenen Programmiersprachen: Versuch von Erklärungen durch ein LLM mit MakeFile, Python und Bash
    • betreibt einen Telegram-Bot: Prompts so eingerichtet, dass bestimmte Befehle ausgeführt werden, etwa Hilfe bei Steuerfragen

1 Kommentare

 
GN⁺ 2024-02-07
Hacker-News-Kommentare
  • Ein Nutzer, der Verkaufen nicht mag, hat eine Telefonnummer eingerichtet, unter der man mit einer KI telefonieren kann, um Cold Calling auf realistische Weise zu üben.

    • Diese KI simuliert Verkaufsgespräche.
    • Der Nutzer stellte fest, dass freihändige Gespräche mit der KI nützlich sind, und verwendet sie inzwischen auch für allgemeine Zwecke.
    • Der Dienst ist derzeit offline, aber der Code mit Stack- und Deployment-Informationen ist auf GitHub verfügbar.
    • Alles läuft auf einem Raspberry Pi für 35 $.
  • Ein anderer Nutzer half dabei, ein Kochbuch auf Basis der Rezepte seiner Großmutter zu „schreiben“.

    • Zum 100. Geburtstag der Großmutter wurden über 250 Seiten an Rezepten restauriert, die der Vater über Jahre gesammelt hatte.
    • Ein Teil war mit der Schreibmaschine geschrieben, ein anderer Teil handschriftlich von der Großmutter.
    • Der Vater scannte die getippten Rezepte und „diktierte“ die handschriftlichen Rezepte.
    • Mit Google OCR wurden die gescannten Rezepte verarbeitet, und mit GPT-4 wurden unformatierte Rezepte in gut strukturierte Markdown-Dokumente umgewandelt.
    • Tippfehler und Fehler von Google OCR wurden erfolgreich korrigiert.
    • Der gesamte gut strukturierte Text wurde in Google Docs eingefügt und mit Bildern ergänzt.
    • Mit der Bildgenerierung von OpenAI wurden Bilder für mehr als 250 Rezepte erstellt.
    • Einiges musste manuell kuratiert werden, besonders bei mexikanischen Gerichten.
    • Das Ergebnis war ein sehr ansehnliches Buch, und als digitale Kopien in der Familie verteilt wurden, waren alle beeindruckt.
  • Ein Nutzer hat mit Apple Shortcuts einen „Stack“ aufgebaut, der per HTTP-POST-API-Aufruf an OpenAI Aufgaben unter macOS ausführt.

    • Jede Aufgabe wird per Shortcut oder über Spotlight-Eingabe via Alfred ausgelöst.
    • Zu den Funktionen gehören das Zusammenfassen von YouTube-URLs, das Korrigieren von Grammatik und Stil in Texten sowie die Nutzung von OpenAI Whisper statt Spracheingabe.
    • Jedes Mal, wenn der Nutzer eine Aufgabe entdeckt, bei der er ein LLM wiederholt verwendet, baut er dafür einen Apple Shortcut und integriert ihn wie eine macOS-Funktion in seinen Workflow.
  • Ein weiterer Nutzer setzt mehrere Hardware- + LLM-Projekte um.

    • Er hat einen Pokédex gebaut, der echte Pokémon erkennt.
    • Er filtert gute Kommentare im Büro heraus und druckt sie aus.
    • Er hat auf einer alten Gegensprechanlage einen allgemeinen Chat-Assistenten aufgebaut.
    • Diese Projekte sind nicht besonders nützlich, machen aber alle Spaß.
  • Ein Nutzer hat einen interaktiven KI-Chatbot als Lebenslauf erstellt, dem man Fragen zu seiner Erfahrung und seinen Fähigkeiten stellen kann.

    • Das Backend nutzt Python FastAPI und speichert Lebenslauf sowie Frage-und-Antwort-Paare in ChromaDB; OpenAI und Airtable werden verwendet, um Anfragen und Antworten zu protokollieren.
    • Die UI verwendet Sveltekit.
    • Der Nutzer baut derzeit weitere Tools und plant, statt Airtable LangSmith zu verwenden.
    • Er schreibt einen Substack-Artikel, der Teil seiner #buildinpublic-Bemühungen zum Markenaufbau ist.
    • Der Nutzer ist seit September arbeitslos und hofft, angesichts des schwierigen Marktes durch die Konzentration auf diese Arbeit eine Anstellung oder Aufträge zu bekommen.
  • Ein anderer Nutzer möchte den Prozess zur Erstellung selbstgeführter Touren durch Städte und Gemeinden sowie von Online-Schatzsuchen automatisieren.

    • Gewünscht ist ein vollständiger Marktplatz, auf dem jeder Touren erstellen und verkaufen kann.
    • Der Erstellungsprozess für Touren ist sehr umständlich.
    • GPT-4 wird mit lokalen Informationen versorgt, damit es Fragen und Multiple-Choice-Antworten erstellt.
    • Das Frontend verwendet React Typescript, das Backend Net Core Web API auf Linux, MySQL, EF Core sowie Integrationen mit GPT4 und Stripe.
    • Gehostet wird das Ganze auf treasuretours.org.
    • Wegen der Kosten haben derzeit nur Superuser Zugriff auf die KI-Tools, aber teilweise KI-generierte vorgefertigte Hunts können ausprobiert werden.
  • Ein Nutzer begann damit, ein Produkt zu bauen, und endete schließlich bei einer Entwicklungsplattform für LLM-basierte Produkte.

    • Zunächst baute er ein Tool zur Aktienanalyse. Nutzer konnten in natürlicher Sprache Unternehmen und Zeiträume angeben, die sie vergleichen wollten, und die Aktien wurden in einem Diagramm dargestellt.
    • Während der Entwicklung stieß er auf besondere Herausforderungen und entschied sich gegen einen Produktlaunch, um stattdessen an der Entwicklungsplattform zu arbeiten.
    • Er verwendet „LLM Structured Tasks“, um Aufgaben anhand von Nutzereingaben auszuführen und JSON auszugeben, mit dem im Backend weitergearbeitet werden kann.
    • Prompts sind fragil und brechen leicht schon bei kleinen Änderungen an Prompt oder Modellkonfiguration.
    • Um dabei zu helfen, entwickelte er eine Plattform, die Prompt-Versionen und Modellkonfigurationen über ganze Eingabesammlungen hinweg testet, damit im Entwicklungsprozess keine Probleme auftreten.
    • Das Ganze kann man sich auf promptotype.io ansehen.
  • Ein Team baut verschiedene Daten-Tools auf Basis von LLMs und ist dabei, sein Hauptprodukt neu zu positionieren und zu launchen.

    • Es entwickelt verschiedene Tools und Produkte wie sketch, datadm und julyp.
    • Es nutzt unterschiedliche Stacks und Werkzeuge, hat teils eigene Tools gebaut, setzt in letzter Zeit aber eher direkt geschriebene Logik im Produkt ein.
    • Das Hauptprodukt hat seinen Code in einer next-App und wird auf vercel deployt.
  • Ein Nutzer hat mehrere Dinge gebaut, darunter einen Bot zur Codegenerierung.

    • Aktuell arbeitet er an einem KI-Mock-Interview. Er mag keine LeetCode-Vorbereitung und hat das Gefühl, durch Interaktion besser zu lernen.
    • comp.lol bietet KI-gestützte Mock-Coding-Interviews an. Es werden Alpha-Tester gesucht, und da alles auf dem kostenlosen Tarif läuft, kann das Laden langsam sein.
  • Ein anderer Nutzer baute einen KI-Recruiting-Assistenten, der ein erstes Screening durchführt, Kandidateninformationen sammelt, Fragen zur Rolle beantwortet und mehrere verhaltensorientierte Interviewfragen stellt.

    • Er wurde an einem Tag mit Vercel und OpenAI gebaut.
    • Die Einrichtung des Google-Logins war der schwierigste Teil.
    • Dutzende Kandidaten haben ihn verwendet, wodurch viel Zeit gespart wurde und Gespräche besser priorisiert werden konnten.
    • Gestern wurde ein kurzer Beitrag darüber geschrieben.