Die koreanische Eingabemethode war so unbequem, dass sie für mich praktisch unbenutzbar war. Ist das heutzutage deutlich besser geworden? Bei Chrome gab es zum Beispiel oft schwere Probleme, etwa dass Eingaben verschluckt wurden oder das letzte Zeichen wieder gelöscht wurde.
Das war eine Arbeitsweise, die ich vor 25 Jahren, als ich bei einer Spielefirma arbeitete, mit Debug-Code umgesetzt habe – und es war sicher nicht nur strcpy. Im Release wurde das für mehr Geschwindigkeit wieder gelockert und so in den Service übernommen. Tatsächlich ist man gerade im Games-Bereich bei Speicherkonflikten am empfindlichsten, deshalb arbeitet man auch extrem sorgfältig und aufmerksam, und wir haben sogar eigene Memory-Debugger gebaut und verwendet. Aber wenn ich heute darüber nachdenke, merke ich: Das war im Grunde schon dabei, eine Garbage Collection zu bauen. Eine wehmütige Erinnerung.
Oh, das war sehr interessant zu lesen. Sie schrieben, dass Sie anhand der Zuverlässigkeit entscheiden, ob eine zusätzliche Validierung durchgeführt wird. Mich würde auch interessieren, wie dieser Zuverlässigkeitswert gemessen wurde.
Ein Artikel, der das Problem mit VLM gut gelöst hat – ich habe ihn mit Interesse gelesen.
Beim Lesen ist bei mir eine Frage aufgekommen:
YOLO-Erkennung – nur das Hauptobjekt zuschneiden, um den Analysebereich zu verkleinern
Mich würde interessieren, wie Sie diesen Schritt eingebaut haben.
Beim Lesen dachte ich, dass VLM wahrscheinlich eine bessere Leistung als YOLO hat. Wenn man also zuschneidet, könnte es nicht sein, dass das YOLO-Modell eine falsche Entscheidung trifft und dadurch wichtige Informationen verloren gehen, noch bevor sie an das VLM weitergegeben werden?
Aus welchem Problem heraus sind Sie auf die Idee mit dem Zuschneiden gekommen, und wie haben Sie die Genauigkeit überprüft und diesen Schritt schließlich eingeführt?
Es wirkt auf mich weniger so, als wäre das Problem durch die Umstellung auf ein Strukturproblem gelöst worden, sondern eher so, als hätten Sie ein neues Modell entwickelt.
Bei einigen High-End-MCUs lassen sich, wie Sie erwähnt haben, über die MPU nicht nur Zugriffsrechte, sondern auch Cache-bezogene Attribute pro Speicherbereich konfigurieren. Das folgende ST-Material ist dafür eine gute Referenz: https://community.st.com/t5/stm32-mcus/…
Allerdings wird beim in diesem Beitrag verwendeten ESP32-S3 keine Methode angeboten, mit der sich cacheable-/non-cacheable-Eigenschaften für einzelne Speicherbereiche über die MPU oder einen ähnlichen Mechanismus festlegen lassen, wie man es von allgemeinen CPUs oder einigen MCUs kennt.
Beim ESP32-S3 ist der Zugriff auf externen Speicher (Flash/PSRAM) so ausgelegt, dass er über Cache/MMU erfolgt (TRM 4.3.3 External Memory). Die Steuerung der Zugriffsrechte erfolgt zwar über das PMS (Permission Management System) (TRM Kapitel 15), dieses dient jedoch dem Zugriffsschutz und hat nicht die Aufgabe, festzulegen, ob der Zugriff über den Cache erfolgt oder den Zugriffspfad selbst zu ändern.
Fehler C4996: 'strcpy': Diese Funktion oder Variable ist möglicherweise unsicher. Erwägen Sie stattdessen die Verwendung von strcpy_s. Um die Veraltungsmeldung zu deaktivieren, verwenden Sie _CRT_SECURE_NO_WARNINGS. Weitere Details finden Sie in der Onlinehilfe.
Es gibt zwar keine MMU, aber mit der MPU lassen sich Speicherbereiche und deren Eigenschaften festlegen.
Es wäre gut, wenn Sie das einmal prüfen könnten.
Es mag sein, dass man aufgrund des großen Einflusses entsprechend viel Vergütung mitnehmen kann, aber das kann nicht einfach mit der Person gleichgesetzt werden, die im Unternehmen als Einzige „aktives Risiko“ trägt. Je nachdem, ob die Person, die sie ausgewählt hat, Großaktionär ist oder nicht, erst recht nicht.
In derselben Logik hätten Mitarbeitende wegen ihres geringeren Einflusses eine kleinere Verantwortung und ein niedrigeres Gehalt, wären aber ebenso Beschäftigte, die aktive Verantwortung tragen, und ebenso gibt es keinen Grund, warum auch ein CEO nicht durch AI ersetzt werden könnte.
War der Punkt, den Sie in Ihrem ersten Kommentar gemacht hatten, nicht genau dieser: dass der CEO die einzige Person ist, die aktives Risiko trägt, und deshalb nicht durch AI ersetzt werden kann?
Ah, anders als bei Universalcomputern stellen MCUs wie der ESP32 keine MMU bereit, mit der sich Speichereigenschaften zur Laufzeit auf Seitenebene ändern lassen, und ob ein Bereich cacheable oder non-cacheable ist, wird vorab pro Speicherbereich festgelegt, sodass sich das wie von Ihnen beschrieben leider nicht nutzen lässt (internes SRAM ist vollständig fest als non-cacheable konfiguriert, PSRAM vollständig als cacheable Memory).
Wie Sie erwähnt haben, müsste man wegen der Cache-Konsistenz wohl jedes Mal ein cache invalidate durchführen. Mich hat deshalb interessiert, warum man nicht einfach einen nicht cachebaren Bereich verwendet.
Darum sagen die Gurus dieser Tage wohl, dass Berufseinsteiger Agenten viel besser nutzen. Es hat ihnen lange gutes Geld eingebracht, deshalb verlernen sie es nicht.
Ich erwarte, dass sich das Pareto-Prinzip erneut bestätigt: Das Verhältnis von „spielenden Ameisen“ zu „arbeitenden Ameisen“ unterscheidet sich zwischen den beiden Gruppen Führungskräfte/Mitarbeitende an sich kaum.
Berücksichtigt man jedoch die Verfügbarkeit von Macht, Informationsvorteilen, Mitteln und Ressourcen, mit denen sich unvermeidbare Misserfolge frühzeitig erkennen und Verantwortung vermeiden lässt, denke ich, dass die Wahrscheinlichkeit, mit der CEOs und andere Führungskräfte einem solchen Ausweichen erfolgreich sind, im Vergleich zu normalen Mitarbeitenden signifikant höher ist. Es ist eine Struktur, in der es leichtfällt, überzogene Belohnungen für Erfolg zu rechtfertigen, indem die erwartete Verantwortung unrealistisch höher bewertet wird als der tatsächlich zu erleidende Schaden, und zugleich gibt es starke Anreize, genau so zu handeln.
Die koreanische Eingabemethode war so unbequem, dass sie für mich praktisch unbenutzbar war. Ist das heutzutage deutlich besser geworden? Bei Chrome gab es zum Beispiel oft schwere Probleme, etwa dass Eingaben verschluckt wurden oder das letzte Zeichen wieder gelöscht wurde.
Eine treffende Beobachtung. Die Fehlerrate des Menschen ist höher..
Das war eine Arbeitsweise, die ich vor 25 Jahren, als ich bei einer Spielefirma arbeitete, mit Debug-Code umgesetzt habe – und es war sicher nicht nur
strcpy. Im Release wurde das für mehr Geschwindigkeit wieder gelockert und so in den Service übernommen. Tatsächlich ist man gerade im Games-Bereich bei Speicherkonflikten am empfindlichsten, deshalb arbeitet man auch extrem sorgfältig und aufmerksam, und wir haben sogar eigene Memory-Debugger gebaut und verwendet. Aber wenn ich heute darüber nachdenke, merke ich: Das war im Grunde schon dabei, eine Garbage Collection zu bauen. Eine wehmütige Erinnerung.Oh, das war sehr interessant zu lesen. Sie schrieben, dass Sie anhand der Zuverlässigkeit entscheiden, ob eine zusätzliche Validierung durchgeführt wird. Mich würde auch interessieren, wie dieser Zuverlässigkeitswert gemessen wurde.
Übrigens sind beim Modell gpt-4o-mini die Eingabe-Token bei Bildeingaben übermäßig teuer, daher würde ich empfehlen, auch andere leichte Modelle in Betracht zu ziehen!
Ein Artikel, der das Problem mit VLM gut gelöst hat – ich habe ihn mit Interesse gelesen.
Beim Lesen ist bei mir eine Frage aufgekommen:
Mich würde interessieren, wie Sie diesen Schritt eingebaut haben.
Beim Lesen dachte ich, dass VLM wahrscheinlich eine bessere Leistung als YOLO hat. Wenn man also zuschneidet, könnte es nicht sein, dass das YOLO-Modell eine falsche Entscheidung trifft und dadurch wichtige Informationen verloren gehen, noch bevor sie an das VLM weitergegeben werden?
Aus welchem Problem heraus sind Sie auf die Idee mit dem Zuschneiden gekommen, und wie haben Sie die Genauigkeit überprüft und diesen Schritt schließlich eingeführt?
Oh, sieht gut aus. Wäre schön, wenn es in verschiedene Sprachen portiert würde!
Es wirkt auf mich weniger so, als wäre das Problem durch die Umstellung auf ein Strukturproblem gelöst worden, sondern eher so, als hätten Sie ein neues Modell entwickelt.
Bei einigen High-End-MCUs lassen sich, wie Sie erwähnt haben, über die MPU nicht nur Zugriffsrechte, sondern auch Cache-bezogene Attribute pro Speicherbereich konfigurieren. Das folgende ST-Material ist dafür eine gute Referenz: https://community.st.com/t5/stm32-mcus/…
Allerdings wird beim in diesem Beitrag verwendeten ESP32-S3 keine Methode angeboten, mit der sich cacheable-/non-cacheable-Eigenschaften für einzelne Speicherbereiche über die MPU oder einen ähnlichen Mechanismus festlegen lassen, wie man es von allgemeinen CPUs oder einigen MCUs kennt.
Beim ESP32-S3 ist der Zugriff auf externen Speicher (Flash/PSRAM) so ausgelegt, dass er über Cache/MMU erfolgt (TRM 4.3.3 External Memory). Die Steuerung der Zugriffsrechte erfolgt zwar über das PMS (Permission Management System) (TRM Kapitel 15), dieses dient jedoch dem Zugriffsschutz und hat nicht die Aufgabe, festzulegen, ob der Zugriff über den Cache erfolgt oder den Zugriffspfad selbst zu ändern.
Link zum TRM (Technical Reference Manual): https://documentation.espressif.com/esp32-s3_technical_reference_manua….
Fehler C4996:
'strcpy': Diese Funktion oder Variable ist möglicherweise unsicher. Erwägen Sie stattdessen die Verwendung vonstrcpy_s. Um die Veraltungsmeldung zu deaktivieren, verwenden Sie_CRT_SECURE_NO_WARNINGS. Weitere Details finden Sie in der Onlinehilfe.Es gibt zwar keine MMU, aber mit der MPU lassen sich Speicherbereiche und deren Eigenschaften festlegen.
Es wäre gut, wenn Sie das einmal prüfen könnten.
Es mag sein, dass man aufgrund des großen Einflusses entsprechend viel Vergütung mitnehmen kann, aber das kann nicht einfach mit der Person gleichgesetzt werden, die im Unternehmen als Einzige „aktives Risiko“ trägt. Je nachdem, ob die Person, die sie ausgewählt hat, Großaktionär ist oder nicht, erst recht nicht.
In derselben Logik hätten Mitarbeitende wegen ihres geringeren Einflusses eine kleinere Verantwortung und ein niedrigeres Gehalt, wären aber ebenso Beschäftigte, die aktive Verantwortung tragen, und ebenso gibt es keinen Grund, warum auch ein CEO nicht durch AI ersetzt werden könnte.
War der Punkt, den Sie in Ihrem ersten Kommentar gemacht hatten, nicht genau dieser: dass der CEO die einzige Person ist, die aktives Risiko trägt, und deshalb nicht durch AI ersetzt werden kann?
Sieht nicht so aus, als gäbe es dafür viel Verwendung..
Ah, anders als bei Universalcomputern stellen MCUs wie der ESP32 keine MMU bereit, mit der sich Speichereigenschaften zur Laufzeit auf Seitenebene ändern lassen, und ob ein Bereich cacheable oder non-cacheable ist, wird vorab pro Speicherbereich festgelegt, sodass sich das wie von Ihnen beschrieben leider nicht nutzen lässt (internes SRAM ist vollständig fest als non-cacheable konfiguriert, PSRAM vollständig als cacheable Memory).
Vielen Dank für die gute Frage!
Wow, das wird tatsächlich verteilt … wirklich ein furchteinflößendes Unternehmen.
Wann wird dieses Chaos endlich abklingen, in die eine oder andere Richtung,,
Die Kennzeichnung der Feiertage gefällt mir sehr.
> Luck = [Doing Things] × [Telling People]
Ich glaube, ich habe diese Formel schon vor ein paar Jahren gesehen, aber ich habe sie in der Zwischenzeit nicht wirklich umgesetzt.
Wie Sie erwähnt haben, müsste man wegen der Cache-Konsistenz wohl jedes Mal ein
cache invalidatedurchführen. Mich hat deshalb interessiert, warum man nicht einfach einen nicht cachebaren Bereich verwendet.Darum sagen die Gurus dieser Tage wohl, dass Berufseinsteiger Agenten viel besser nutzen. Es hat ihnen lange gutes Geld eingebracht, deshalb verlernen sie es nicht.
Ich erwarte, dass sich das Pareto-Prinzip erneut bestätigt: Das Verhältnis von „spielenden Ameisen“ zu „arbeitenden Ameisen“ unterscheidet sich zwischen den beiden Gruppen Führungskräfte/Mitarbeitende an sich kaum.
Berücksichtigt man jedoch die Verfügbarkeit von Macht, Informationsvorteilen, Mitteln und Ressourcen, mit denen sich unvermeidbare Misserfolge frühzeitig erkennen und Verantwortung vermeiden lässt, denke ich, dass die Wahrscheinlichkeit, mit der CEOs und andere Führungskräfte einem solchen Ausweichen erfolgreich sind, im Vergleich zu normalen Mitarbeitenden signifikant höher ist. Es ist eine Struktur, in der es leichtfällt, überzogene Belohnungen für Erfolg zu rechtfertigen, indem die erwartete Verantwortung unrealistisch höher bewertet wird als der tatsächlich zu erleidende Schaden, und zugleich gibt es starke Anreize, genau so zu handeln.