Extrem teuer, das Preis-Leistungs-Verhältnis stimmt nicht. Im praktischen Einsatz scheint mir o3-mini eher die bessere Wahl zu sein, aber wenn man es fürs Coding nutzen will, sind die kurze Inferenzphase und die Lösung für die Zwischentokens entscheidend, und für diesen Zweck scheint es das Beste zu sein. Der Preis allerdings ...
Ich bin hahnlee, der hwp.js (https://github.com/hahnlee/hwp.js) entwickelt hat :)
Ich mochte HWP während der Entwicklung dieses Projekts nicht besonders, und ehrlich gesagt auch jetzt nicht. Vor allem nicht, was den Grad der Offenheit angeht.
Dem Punkt „Das HWP-Format hat Elemente, die für AI-Training vorteilhaft sind“ stimme ich allerdings bis zu einem gewissen Grad zu.
Wenn ich von meinen Erfahrungen beim Aufbau von RAG ausgehe: In Korea werden besonders häufig Tabellen verwendet. Im Fall von PDF handelt es sich um ein Format, das für den Druck gedacht ist, daher gibt es in PDFs keine „Tabelle“ als solche. Es gibt nur Linien und Text.
Deshalb war es schwierig, aus komplexen Tabelleninformationen auf Basis von PDF-Dokumenten Daten zu extrahieren. Das galt besonders dann, wenn sich Tabellen über mehrere Seiten erstreckten.
Grob gesagt fühlte es sich so an: Wenn HWP eine Art Rich-Text-Dokument ist, dann ist PDF eher wie ein txt-Dokument. Das bezieht sich natürlich nur auf „Tabellen“.
Ob das nun aber ein besonderer Vorteil des HWP-Formats ist? Ich denke nicht. Für einfache Dinge reicht Markdown völlig aus, und wenn es etwas komplexer wird, halte ich es für besser, es in HTML zu definieren.
Und entscheidend ist außerdem, dass docx und odt dieselben Vorteile haben.
Nachdem Netscape von IE komplett plattgemacht worden war, haben sie den Source Code offengelegt und dergleichen – reichlich spät und mit viel Aktionismus im Nachhinein.
Ich mag HWP nicht und kann über die Produkte des heutigen Unternehmens Hancom nichts Gutes sagen, aber früher war das Produkt selbst meiner Meinung nach eine deutlich bessere Software als Word.
Um eine genaue Antwort zu geben: Selbst beim gleichen Buch muss, wenn das Format unterschiedlich ist, eine separate ISBN vergeben werden. Sogar für epub- und pdf-E-Books muss jeweils eine eigene ISBN ausgestellt werden.
Als Antwort auf den obigen Kommentar: Bei koreanischen E-Books ist es, wie im Artikel erwähnt, eher das Konzept, ein „Servicerecht“ zu kaufen, und unterscheidet sich damit etwas von dem Konzept, den Inhalt selbst zu besitzen. Außerdem wenden die einzelnen Buchhandlungen jeweils unterschiedliche DRM-Systeme an. Deshalb kann man das E-Book, das man mit eigenem Geld gekauft hat, nicht in jeder Umgebung bequem nutzen; wir brauchen ein Gesetz, das zur heutigen Zeit passt. seufz seufz
Persönlich fände ich es gut, wenn man digitale Materialien – ähnlich wie bei MyData im Finanzsektor – unabhängig davon, wo man sie gekauft hat, in der Form nutzen könnte, die man selbst möchte.
Ich verstehe nicht, warum Caching nötig sein soll. Im klassischen Ansatz brauchte man so etwas wie Caching gar nicht, und die Situationen, in denen man Caching einsetzen muss, sind äußerst begrenzt — warum klammert man sich also unnötig so verbissen an Caching?
Ich denke, die Zerstörung von Sicherheit durch Politiker ist nichts anderes als die Haltung: Ich allein werde sie nutzen. Wenn man mit mehreren Mitarbeitern unterwegs ist und dieses Maß an Technologie trotzdem nicht versteht, dann ist das schlicht Arbeitsverweigerung.
Ich habe zwar Textverarbeitung mit 아래아 한글 gelernt, aber inzwischen ist es wohl eher ein Relikt, das zum Wohl der Weiterentwicklung Südkoreas verschwinden sollte.
Sogar in Russland wurde Telegram so stark unterdrückt, aber im Krieg nutzt man dann ausgerechnet Telegram; auch die koreanische Regierung hat Telegram als Wurzel allen Übels dargestellt, während bekannt wurde, dass sie selbst dann doch Telegram und sogar Signal nutzt. So etwas wie Sicherheit, die nur mir nützt, gibt es auf der Welt nicht, daher frage ich mich, ob es nicht einfach an mangelndem Verständnis für die Technologie liegt.
Das fühlt sich ein bisschen wie bei AlphaGo an. Man weiß zwar nicht, warum so ein Zug gemacht wird, aber die Gewinnwahrscheinlichkeit ist damit höher. Wenn man gut herausfindet, in welchen Fällen Menschen das Wesen der Sache verzerren, um sie verständlich zu machen (?), könnte das bei der Optimierung sehr hilfreich sein.
Sie schreiben sehr gut.
Ich habe es gern gelesen!
Extrem teuer, das Preis-Leistungs-Verhältnis stimmt nicht. Im praktischen Einsatz scheint mir o3-mini eher die bessere Wahl zu sein, aber wenn man es fürs Coding nutzen will, sind die kurze Inferenzphase und die Lösung für die Zwischentokens entscheidend, und für diesen Zweck scheint es das Beste zu sein. Der Preis allerdings ...
Zum Vergleich mit Flash 2 ist der Preisunterschied einfach zu groß … genau zwischen o1pro und o3-mini angesiedelt
Ich bin hahnlee, der
hwp.js(https://github.com/hahnlee/hwp.js) entwickelt hat :)Ich mochte HWP während der Entwicklung dieses Projekts nicht besonders, und ehrlich gesagt auch jetzt nicht. Vor allem nicht, was den Grad der Offenheit angeht.
Dem Punkt „Das HWP-Format hat Elemente, die für AI-Training vorteilhaft sind“ stimme ich allerdings bis zu einem gewissen Grad zu.
Wenn ich von meinen Erfahrungen beim Aufbau von RAG ausgehe: In Korea werden besonders häufig Tabellen verwendet. Im Fall von PDF handelt es sich um ein Format, das für den Druck gedacht ist, daher gibt es in PDFs keine „Tabelle“ als solche. Es gibt nur Linien und Text.
Deshalb war es schwierig, aus komplexen Tabelleninformationen auf Basis von PDF-Dokumenten Daten zu extrahieren. Das galt besonders dann, wenn sich Tabellen über mehrere Seiten erstreckten.
Grob gesagt fühlte es sich so an: Wenn HWP eine Art Rich-Text-Dokument ist, dann ist PDF eher wie ein txt-Dokument. Das bezieht sich natürlich nur auf „Tabellen“.
Ob das nun aber ein besonderer Vorteil des HWP-Formats ist? Ich denke nicht. Für einfache Dinge reicht Markdown völlig aus, und wenn es etwas komplexer wird, halte ich es für besser, es in HTML zu definieren.
Und entscheidend ist außerdem, dass docx und odt dieselben Vorteile haben.
Nachdem Netscape von IE komplett plattgemacht worden war, haben sie den Source Code offengelegt und dergleichen – reichlich spät und mit viel Aktionismus im Nachhinein.
Ich mag HWP nicht und kann über die Produkte des heutigen Unternehmens Hancom nichts Gutes sagen, aber früher war das Produkt selbst meiner Meinung nach eine deutlich bessere Software als Word.
Um eine genaue Antwort zu geben: Selbst beim gleichen Buch muss, wenn das Format unterschiedlich ist, eine separate ISBN vergeben werden. Sogar für
epub- undpdf-E-Books muss jeweils eine eigene ISBN ausgestellt werden.Als Antwort auf den obigen Kommentar: Bei koreanischen E-Books ist es, wie im Artikel erwähnt, eher das Konzept, ein „Servicerecht“ zu kaufen, und unterscheidet sich damit etwas von dem Konzept, den Inhalt selbst zu besitzen. Außerdem wenden die einzelnen Buchhandlungen jeweils unterschiedliche DRM-Systeme an. Deshalb kann man das E-Book, das man mit eigenem Geld gekauft hat, nicht in jeder Umgebung bequem nutzen; wir brauchen ein Gesetz, das zur heutigen Zeit passt. seufz seufz
Persönlich fände ich es gut, wenn man digitale Materialien – ähnlich wie bei MyData im Finanzsektor – unabhängig davon, wo man sie gekauft hat, in der Form nutzen könnte, die man selbst möchte.
Aha … jetzt verstehe ich es … hahahahaha
Was soll das?
Ich verstehe nicht, warum Caching nötig sein soll. Im klassischen Ansatz brauchte man so etwas wie Caching gar nicht, und die Situationen, in denen man Caching einsetzen muss, sind äußerst begrenzt — warum klammert man sich also unnötig so verbissen an Caching?
Eine unglückliche Existenz, die nie zum Weltstandard wurde
Ich denke, die Zerstörung von Sicherheit durch Politiker ist nichts anderes als die Haltung: Ich allein werde sie nutzen. Wenn man mit mehreren Mitarbeitern unterwegs ist und dieses Maß an Technologie trotzdem nicht versteht, dann ist das schlicht Arbeitsverweigerung.
Ich habe zwar Textverarbeitung mit
아래아 한글gelernt, aber inzwischen ist es wohl eher ein Relikt, das zum Wohl der Weiterentwicklung Südkoreas verschwinden sollte.Sogar in Russland wurde Telegram so stark unterdrückt, aber im Krieg nutzt man dann ausgerechnet Telegram; auch die koreanische Regierung hat Telegram als Wurzel allen Übels dargestellt, während bekannt wurde, dass sie selbst dann doch Telegram und sogar Signal nutzt. So etwas wie Sicherheit, die nur mir nützt, gibt es auf der Welt nicht, daher frage ich mich, ob es nicht einfach an mangelndem Verständnis für die Technologie liegt.
Ich habe den Teil auch gelesen und fand ihn seltsam, aber als ich die Domain des Originals gesehen habe, konnte ich es nachvollziehen lol
"Das HWP-Format verfügt über Eigenschaften, die für das KI-Training vorteilhaft sind"
Ist das wirklich so..?
Dem kann ich nicht wirklich zustimmen. Wenn es um das im Text ebenfalls erwähnte
hwpxginge, vielleicht, aber ...Jank Jank~!
Das ist wirklich ein Manifest voller Kampfgeist, haha. Großartig.
Das fühlt sich ein bisschen wie bei AlphaGo an. Man weiß zwar nicht, warum so ein Zug gemacht wird, aber die Gewinnwahrscheinlichkeit ist damit höher. Wenn man gut herausfindet, in welchen Fällen Menschen das Wesen der Sache verzerren, um sie verständlich zu machen (?), könnte das bei der Optimierung sehr hilfreich sein.