3 Punkte von GN⁺ 4 시간 전 | 1 Kommentare | Auf WhatsApp teilen
  • Apple Intelligence wird in VoiceOver, Lupe, Sprachsteuerung und Accessibility Reader integriert und verbessert Bildbeschreibungen, Navigation in natürlicher Sprache und Lesehilfen
  • VoiceOver und Lupe ermöglichen mit Image Explorer und Live Recognition Fragen und Antworten zu Inhalten im Kamerabild, sollten aber nicht in Hochrisikosituationen als verlässliche Grundlage genutzt werden
  • Sprachsteuerung unterstützt die Navigation auf iPhone und iPad mit Befehlen in natürlicher Sprache wie „tap the purple folder“ statt exakter Labels oder Nummern
  • Bei Videos ohne Untertitel werden on-device generierte Untertitel automatisch eingeblendet; verfügbar auf iPhone, iPad, Mac, Apple TV und Apple Vision Pro
  • Apple Vision Pro kann mit Blickverfolgung alternative Fahrsysteme von Tolt und LUCI steuern; außerdem erscheint der Hikawa Grip & Stand weltweit

Zeitplan zur Einführung und Datenschutz

  • Die neuen Funktionen und Apple-Intelligence-basierten Updates sollen später in diesem Jahr verfügbar werden
  • Apple erklärt, bei der Integration von Apple Intelligence in Bedienungshilfen das Prinzip privacy by design beizubehalten
  • Hikawa Grip & Stand for iPhone erscheint im Apple Store online in drei neuen Farben

Erkundung visueller Informationen mit VoiceOver und Lupe

  • VoiceOver und Lupe beschreiben Bildschirminhalte und die Umgebung detaillierter für Nutzer mit Blindheit oder Sehschwäche
  • Der Image Explorer in VoiceOver liefert mit Apple Intelligence Bildbeschreibungen systemweit für Fotos, gescannte Rechnungen, persönliche Aufzeichnungen und mehr
  • Mit dem Live-Recognition-Update können VoiceOver-Nutzer die Action button des iPhone drücken, Fragen zu den im Kamerasucher sichtbaren Inhalten stellen und Antworten erhalten
  • Nutzer können in eigenen Worten Anschlussfragen stellen und so weitere visuelle Informationen abrufen
  • Lupe bietet dieselben unterstützten Navigations- und visuellen Beschreibungsfunktionen in einer Oberfläche mit hohem Kontrast für Nutzer mit Sehschwäche
  • Lupe arbeitet ebenfalls mit der Action button zusammen und lässt sich mit Sprachbefehlen wie „zoom in“ oder „turn on flashlight“ steuern
  • Auf VoiceOver und Lupe sollte nicht vertraut werden, wenn Personen verletzt oder geschädigt werden könnten, in Hochrisikosituationen, bei der Wegfindung oder bei Diagnose bzw. Behandlung medizinischer Zustände

Eingabe in natürlicher Sprache mit der Sprachsteuerung

  • Sprachsteuerung nutzt Apple Intelligence, damit Nutzer mit körperlichen Behinderungen iPhone und iPad allein per Stimme intuitiver bedienen können
  • Die neue flexible Eingabe erlaubt die Steuerung, indem Buttons und Bedienelemente auf dem Bildschirm in natürlicher Sprache beschrieben werden, statt exakte Labels oder Nummern zu nennen
  • Der Ansatz „say what you see“ funktioniert in allen Apps, auch in Apps mit visuellem Layout wie Apple Maps oder Dateien
  • Beispielbefehle sind „tap the guide about best restaurants“ oder „tap the purple folder“, die sichtbare Objekte direkt beschreiben
  • Das kann auch Barrieren verringern, die entstehen, wenn Elemente für Bedienungshilfen nicht korrekt beschriftet sind
  • Die auf Apple Intelligence basierende Sprachsteuerung soll in englischen Umgebungen in den USA, Kanada, dem Vereinigten Königreich und Australien verfügbar sein

Accessibility Reader und generierte Untertitel

  • Accessibility Reader bietet ein anpassbares Leseerlebnis für Nutzer mit unterschiedlichen Behinderungen, von Dyslexie bis Sehschwäche
  • Durch Apple Intelligence kann er auch komplexere Originalmaterialien wie wissenschaftliche Arbeiten verarbeiten
  • Auch Texte mit mehreren Spalten, Bildern und Tabellen können verarbeitet werden
  • Zusammenfassungen auf Abruf ermöglichen es, zuerst einen Überblick über ein Dokument zu sehen, bevor Details gelesen werden
  • Eine neue integrierte Übersetzung erlaubt das Lesen von Texten in der eigenen Muttersprache unter Beibehaltung benutzerdefinierter Formatierung, Schriftarten und Farben
  • Neue generierte Untertitel blenden automatisch Transkriptionen der gesprochenen Audiospur bei Videos ohne Captions oder Untertitel ein
  • Dazu gehören mit dem iPhone aufgenommene Clips, von Freunden und Familie erhaltene Videos sowie online gestreamte Inhalte
  • Die Untertitel werden privat durch Spracherkennung auf dem Gerät erzeugt und bei Videos ohne Untertitel automatisch auf iPhone, iPad, Mac, Apple TV und Apple Vision Pro angezeigt
  • Das Erscheinungsbild der Untertitel kann im Videowiedergabemenü oder in den Settings angepasst werden
  • Generierte Untertitel sollen in englischen Umgebungen in den USA und Kanada verfügbar sein

Steuerung von Elektrorollstühlen mit Apple Vision Pro

  • Einige Nutzer von Elektrorollstühlen können nicht mit einem Joystick fahren; alternative Fahrsteuerungen können daher für unabhängige Mobilität entscheidend sein
  • Das präzise Blickverfolgungssystem von Apple Vision Pro dient als reaktionsschnelle Eingabemethode für kompatible alternative Fahrsysteme
  • Die Blickverfolgung von Vision Pro benötigt keine häufige Neukalibrierung und funktioniert unter unterschiedlichen Lichtbedingungen
  • Die Funktion startet in den USA mit den alternativen Fahrsystemen Tolt und LUCI
  • Die Zubehörunterstützung umfasst sowohl Bluetooth- als auch Kabelverbindungen; für Kabelverbindungen ist der Kauf des Apple Vision Pro Developer Strap erforderlich
  • Apple will weiterhin mit Entwicklern zusammenarbeiten, um mehr Rollstuhl-Fahrsysteme zu unterstützen
  • Diese Funktion und Apple Vision Pro sind für die Nutzung in kontrollierten Umgebungen vorgesehen; weitere Informationen gibt es unter support.apple.com/en-us/118507
  • Pat Dolan, der seit zehn Jahren mit ALS lebt, sagt, eine Möglichkeit zur selbstständigen Steuerung seines Elektrorollstuhls sei für ihn „Gold wert“

Hikawa Grip & Stand for iPhone

  • Hikawa Grip & Stand for iPhone erscheint weltweit im Apple Store online und ist in drei neuen Farben erhältlich
  • Es ist ein MagSafe-Zubehör, das vom in Los Angeles ansässigen Designer Bailey Hikawa mit Blick auf Barrierefreiheit entwickelt wurde
  • An der Entwicklung waren Menschen mit verschiedenen Behinderungen beteiligt, die Griffkraft, Stärke und Mobilität beeinflussen
  • Es handelt sich um einen anpassungsfähigen Griff mit Standfunktion, der Nutzern hilft, das iPhone so zu halten, wie es für sie am besten passt
  • Durch die Zusammenarbeit von Hikawa und PopSockets wird dieses anpassungsfähige Zubehör erstmals weltweit verfügbar
  • Im Apple The Grove in Los Angeles findet eine Today at Apple-Session mit Hikawa, Shane Burcaw und Alex Barone statt
  • Verfügbar ist es in Australia, Austria, Belgium, Canada, China, Denmark, France, Hong Kong, Italy, Japan, the Netherlands, Singapore, South Korea, Spain, Sweden, Switzerland, Taiwan, the United Arab Emirates, the UK und the U.S.; gekauft werden kann es auf apple.com

Weitere Updates zur Barrierefreiheit

  • Vehicle Motion Cues kommt zu visionOS und kann helfen, Reisekrankheit zu reduzieren, wenn Apple Vision Pro als Mitfahrer in einem fahrenden Fahrzeug genutzt wird
  • Vision Pro unterstützt Gesichtsgesten zum Ausführen von Taps und Systemaktionen
  • Für Vision Pro kommt außerdem eine neue Möglichkeit hinzu, Elemente mit den Augen auszuwählen, während Dwell Control verwendet wird
  • Touch Accommodations bietet eine neue Möglichkeit, Einstellungen in iOS und iPadOS zu personalisieren
  • Made for iPhone hearing aids sorgen in iOS, iPadOS, macOS und visionOS für stabileres Pairing und Handoff zwischen Apple-Geräten und verbessern auch das Setup-Erlebnis
  • Unterstützung für Larger Text wird zu tvOS hinzugefügt, damit Zuschauer mit Sehschwäche die Bildschirmtexte vergrößern und leichter lesen können
  • Name Recognition benachrichtigt Nutzer mit Gehörlosigkeit oder Hörminderung, wenn jemand ihren Namen sagt, und funktioniert in mehr als 50 Sprachen weltweit
  • Eine neue API für Entwickler von Apps für Gebärdensprachdolmetschen unterstützt Nutzer dabei, laufenden FaceTime-Videoanrufen menschliche Dolmetscher hinzuzufügen
  • Der Sony Access controller kann unter iOS, iPadOS und macOS als Gamecontroller verbunden werden
  • Auf dem Sony Access controller lassen sich Thumbstick, neun integrierte Buttons sowie bis zu vier zusätzliche externe Buttons oder Spezialschalter konfigurieren, um das Layout zu personalisieren
  • Nutzer können zwei Controller kombinieren, um ein noch stärker personalisiertes Spielerlebnis zu schaffen

Verfügbare Sprachen und regionale Einschränkungen

  • Apple Intelligence wird als Beta bereitgestellt; unterstützte Sprachen sind English, Danish, Dutch, French, German, Italian, Norwegian, Portuguese, Spanish, Swedish, Turkish, Vietnamese, Chinese (simplified), Chinese (traditional), Japanese und Korean
  • Einige Funktionen sind möglicherweise nicht in allen Regionen oder Sprachen verfügbar
  • Informationen zur Verfügbarkeit von Funktionen und Sprachen sowie zu den Systemanforderungen gibt es unter support.apple.com/en-us/121115

1 Kommentare

 
GN⁺ 4 시간 전
Hacker-News-Kommentare
  • Apple mag es, neue Technologien an unscheinbaren Stellen einzuschleusen und öffentlich heimlich zu testen, daher wirkt es sehr nach Apple, agentische KI zuerst als Bedienungshilfe auszurollen
    Die Touch Bar war nicht einfach nur ein OLED-Streifen, sondern der erste Schritt hin zu Macs mit Apple Silicon, und der Apple-T1-Chip im Touch-Bar-MacBook von 2016 war der erste vollständig von Apple entworfene Prozessor in einem Mac
    Er übernahm Aufgaben vom Intel-Chipsatz wie Energieverwaltung, Lüfter, Ruhezustand/Aufwachen, Kamera- und Mikrofonzugriff sowie die Secure Enclave für Touch ID, und später kümmerte sich der T2 zusätzlich um SSD-Verschlüsselung, Audiomanagement, Kamerabildverarbeitung und Manipulationsschutz im Bootprozess
    Im iPhone 3G lag ein Liquidmetal-SIM-Auswurftool bei, eine maßgeschneiderte Metalllegierung, die man mit der Hand fast nicht verbiegen konnte; Apple brachte danach zwar keine Produkte mit dieser Legierung heraus, aber fast 20 Jahre später gibt es Gerüchte über Flüssigmetall in einem faltbaren iPhone
    Auch RealityKit hatte jahrelang 3D-Scanning und verschiedene AR-Funktionen, deren Bedeutung erst mit dem Apple Vision Pro klar wurde

    • Das ist wohl überinterpretiert; es wirkt eher wie gescheiterte Kommerzialisierungsversuche
      Die Touch Bar wurde von den Leuten gehasst und erst Jahre später von Technikfans geschätzt, als sie sie hackten und anpassten, um tiefere Funktionen hinzuzufügen
      Ein SIM-Auswurftool aus einer teuren Legierung ergab ebenfalls keinen Sinn, und RealityKit und Vision wirken wie Lösungen auf der Suche nach einem Problem, wobei Vision selbst ebenfalls zu scheitern scheint
      3D Touch hatte auch Probleme mit Auffindbarkeit und Bedienbarkeit, und Beispiele wie diese gibt es noch mehr
    • Apples erstes eigenes Modem kam ebenfalls zuerst im günstigsten Modell, dem iPhone 16e, zum Einsatz
    • „liquid metal“ klingt cool, aber wahrscheinlich ist eher metallisches Glas gemeint
      Diese Materialien gibt es seit Jahrzehnten, und trotzdem scheinen sie durch den Apple-Markennamen fast zum Synonym geworden zu sein, was ich ziemlich unerquicklich finde
      Dass sie nicht häufiger eingesetzt werden, liegt vor allem daran, dass sie sehr teuer sind; wer aber wie Apple einen Bedarf von zig Millionen Bauteilen garantieren kann, bekommt die Wirtschaftlichkeit viel leichter hin
    • Ich frage mich, ob „LiquidMetal“ jemals mehr war als eine gute Aluminiumlegierung
    • Apples Smart Glasses, die bald kommen sollen, könnten in fast allen Situationen aus dem Video, in denen der Nutzer sein iPhone hochhalten musste, die bessere User Experience bieten
      Ich habe gelesen, dass beim Filmen oder Fotografieren die Linse sichtbarer aufleuchtet oder blinkt als bei Meta, was bei Datenschutzbedenken helfen könnte, und zumindest ist es nicht Meta
      Ich mag meine Meta-Smart-Glasses, aber beide Paare sind kaputtgegangen und es gibt kein Geschäft für Support, daher würde ich bei einem Apple-Produkt schnell wechseln
  • Aus Entwicklersicht sind Apples Accessibility-APIs auf Betriebssystemebene wirklich gut
    Kaputt geht es an der Grenze, wo WebKit in native Apps eingebettet wird
    Ich habe eine Tauri-App mit dem Monaco-Editor in einer WKWebView ausgeliefert und mühsam herausgefunden, dass der VoiceOver-Modus accessibilitySupport: auto stillschweigend die rückwärtige Textauswahl in Monaco zerstört
    Mit "off" funktionierte die Auswahl korrekt, und am Ende musste ich mich zwischen normaler Textauswahl und VoiceOver-Support entscheiden, wobei die Wahl auf die Auswahlfunktion fiel
    In AppKit/UIKit ist es robust, aber an der eingebetteten-WebView-Grenze, wo heute die meisten Desktop-Apps tatsächlich leben, bricht es auseinander

  • Früher habe ich mich als sehender Mensch bei Be My Eyes angemeldet
    Es kamen nicht so viele Anrufe wie erhofft, aber ich konnte ein paarmal helfen, was schön war
    Ich habe einmal einen Briefumschlag vorgelesen, einmal eine Medikamentenflasche, und es gab zwei lustige Männer, die in großen weichen Sesseln saßen und Einkaufstaschen voller Müslischachteln mitgebracht hatten und wissen wollten, welche welche war
    Ich erinnere mich, dass einer von ihnen eine bestimmte Sorte wirklich hasste
    Die App hatte die einzigartige Funktion, dass eine sehende Person die Kamera eines blinden Nutzers aktivieren konnte
    https://www.bemyeyes.com

    • Ich habe die Be-My-Eyes-App noch installiert, aber seit über einem Jahr keinen Anruf mehr bekommen, und das wirkt fast wie ein Beleg dafür, wie leistungsfähig KI-Vision-Modelle geworden sind
      Ich finde es großartig, dass KI für blinde Menschen inzwischen gut genug funktioniert, um ihre Probleme selbst zu lösen
      Trotzdem hatte es etwas sehr Menschliches und Schönes, ab und zu kleinen, zufälligen Dingen im Leben eines Fremden zu helfen
      Besonders gut erinnere ich mich an eine ältere Frau, die eine Schachtel Blaubeeren auf ihrem Küchenboden verschüttet hatte und der ich mit Richtungsangaben half, alle wiederzufinden
      Es waren 10 Minuten mit einem Fremden, in denen wir etwas Interessantes taten, und selbst 4 Jahre später ist mir das warm in Erinnerung geblieben
    • Soweit ich weiß, braucht Be My Eyes seit der Einführung der KI-Funktionen deutlich weniger Freiwillige
      Als vollständig blinder Mensch habe ich die App erst nach der KI-Erweiterung genutzt, und sie funktioniert sehr gut, um Lebensmitteletiketten zu lesen, nachdem die Kinder Dinge umgestellt haben, oder um zu prüfen, ob der Fernseher eingeschaltet ist
      Würde ich noch allein leben, hätte ich die Freiwilligenfunktion vermutlich auch genutzt, aber derzeit ist das nicht nötig
    • Es gab schon immer viel mehr Hilfsbereite als Menschen, die Hilfe brauchten
      Das ist natürlich etwas Gutes, und ich will mich nicht beklagen, aber ich habe mich vor Jahren angemeldet, nie einen Anruf bekommen und die App schließlich gelöscht
    • Ich frage mich, wer angerufen hat. Waren es blinde Menschen?
  • Eine Sache, die Apple wirklich in Ordnung bringen muss, ist Speech-to-Text
    Bei Bedienungshilfen haben sie vieles richtig gemacht, aber bei der Transkription wirken sie nicht 10, aber mindestens 5 Jahre zurück
    Texteingabe auf dem iPhone ist inzwischen schrecklich
    Die Erkennung von versehentlichen Handballenberührungen ist eindeutig schlechter als früher, weshalb Tippfehler häufiger sind, und auch die Autokorrektur-Algorithmen beim Tippen sind schlechter geworden und ersetzen oft falsch Wörter mehrere Wörter vor der Stelle, an der ich gerade tippe
    Die Spracherkennung ist ebenfalls nicht besser geworden, und schon die Form des Telefons macht die Finger müde
    Ich wünschte, die iPhone-Nutzung wäre nicht so unerquicklich

    • Wispr Flow ist ein Paradebeispiel für Speech-to-Text
      Apples Lösung fühlt sich im Vergleich wie aus dem letzten Jahrhundert an
      Dasselbe gilt für Apples Text-to-Speech, wenn ElevenLabs und OpenAI weit voraus sind
      Ich brauche nur, dass das iPhone solche Dinge nativ in derselben Qualität unterstützt, denn in Apples geschlossenem Ökosystem ist das die einzige Möglichkeit, es überall nutzen zu können
    • Solange Siri nicht zuverlässig „Navigate to “ mit offline vorgeladenen Karten verarbeiten kann, halte ich schwierigere Speech-to-Text- oder Konversationsfunktionen für eine Luftnummer
      Gestern habe ich noch ein weiteres schreckliches iPhone-Eingabe-„Feature“ entdeckt
      Wenn man in einer Drittanbieter-CarPlay-App durch eine Liste blättert und kurz vor dem Antippen zur Auswahl zuerst aufs Gaspedal drückt, wird die Liste auf nur wenige Einträge beschnitten und nach oben gescrollt
      Ein großartiger Weg, Ablenkung beim Fahren zu reduzieren. Ändert sich als Nächstes das Kartenziel, sobald das Auto fährt?
      Ich wünschte, Human-Computer-Interaction-Forschung würde breiter angewendet, und ich finde, für Dummheiten wie im Auto-/CarPlay-Ökosystem sollte man vor Gericht haften
      Früher fuhr ich einmal ein Auto, das jedes Mal beim Einschalten der Rückfahrkamera hinter einem rechtlichen Hinweis verschwand, und während dieser Bildschirm eingeblendet war, ist mit Sicherheit mindestens ein Fußgänger von einem rückwärtsfahrenden Auto erfasst worden
      Hersteller sollten für solche schlechten UI-Entscheidungen zu 100 % verantwortlich sein
    • Was bei mir enorm geholfen hat, die iPhone-Tastatur zu verbessern, war Slide to Type zu deaktivieren
      Auch diesen Tipp habe ich auf HN gelernt
      Öffne die Einstellungen-App, tippe auf General, scrolle zu Keyboard und deaktiviere Slide to Type
    • Das iPhone lässt mich jeden Tag den ganzen Tag wie einen Idioten fühlen
      Fast jedes zweite Wort, das ich tippe, oder das das iPhone glaubt, dass ich es getippt habe, muss ich korrigieren
      Und während ich korrigiere, erzeugt die Autokorrektur neue und noch unverständlichere Tippfehler
      Manchmal erreicht das plötzlich ein Maß an Fiebertraum-Wahnsinn, bei dem ich alltägliche Dinge nicht mehr vernünftig erledigen kann
      Am schlimmsten ist, dass es früher gut war
      Auf dem iPhone 4S tippte ich fast mit der Geschwindigkeit und Genauigkeit einer vollwertigen Tastatur
    • Ich glaube nicht, dass sich auf dieser Seite viel verbessert hat, seit Colin Hughes vor ein paar Jahren die Probleme mit Voice Control zusammengefasst hat
      https://www.theregister.com/on-prem/2023/08/16/those-who-rel...
      Wenigstens zwei große Bugs sollten sie beheben
      Selbst dort, wo es unterstützt wird, schlägt die Eingabe scheinbar zufällig fehl, und viele Apps großer Anbieter wie OneNote unterstützen Diktateingabe überhaupt nicht
      In solchen Fällen sollte es wenigstens einen Fallback geben, wie früher bei Dragon Dictate vor Jahrzehnten
      Auch die Großschreibung ist weiterhin zufällig, es bleiben also viele Fehler zu beheben
      Apple scheint Accessibility eher als Stoff für prestigeträchtige Pressemitteilungen zu sehen als als echtes Feature
  • Interessante Tatsache: Dieses Video wurde so zugänglich gemacht, dass es für sehende Menschen passt
    Kein tatsächlich blinder Mensch würde sich Sprache in diesem Tempo anhören, und wenn man blinde Menschen am Computer beobachtet, ist man oft verblüfft über ihre Fähigkeit, Audio in Geschwindigkeiten zu verstehen, die man sich kaum vorstellen kann

    • https://youtu.be/wKISPePFrIs?si=ahGfFp0U7-pTU9w6&t=43
      Mein Standardbeispiel ist dieses Video, in dem Saqib Shaikh, ein blinder Software Engineer bei Microsoft, über Visual Studio spricht
      Der Link springt direkt zu der Stelle
    • Ich habe vor langer Zeit in einem Gemeindezentrum im IT-Bereich gearbeitet, und der Leiter des Zentrums war blind
      Ich war völlig verblüfft, wie schnell sein Screenreader Inhalte vorlas, und für mich war es überhaupt nicht verständlich
      Seine Effizienz mit Tastaturkürzeln hätte selbst die Elite von vim/emacs beschämt
    • Das liegt wahrscheinlich daran, dass es Werbung ist
      Eine extrem schnelle Roboterstimme kann ziemlich rau und nervig wirken, und selbst blinde Menschen, die darauf angewiesen sind, fühlen sich davon manchmal überreizt
    • Stimmt. Sie ist nicht nur schnell, sondern oft auch sehr robotisch, weshalb viele Sehende schon bei 1,5-facher Geschwindigkeit Mühe haben, sie zu verstehen
      Ich habe über blinde Menschen gelesen, die Echoortung mit Schall gelernt haben, und das wirkte wie eine echte Superkraft, sodass ich irgendwann vielleicht mal den Monitor ausstecken und lernen möchte, Werkzeuge richtig zu benutzen
      Ein blinder Kollege, mit dem ich vor einigen Jahren arbeitete, ließ den Bildschirm immer ausgeschaltet, wodurch der Laptop-Akku fast doppelt so lange hielt wie bei allen anderen, und allein das war schon ein nettes Feature
      Selbst wenn ich nie dieses gewaltige Echoortungsniveau erreiche, wäre schon die Hälfte davon cool, und als Bonus könnte ich Accessibility-Änderungen tatsächlich QA-testen
    • Vor 20 Jahren machte ich First-Level-Support am Telefon, und es dauerte etwa 3,2 Sekunden, bis ich merkte, dass mein Gegenüber sehbehindert war, und zugleich, dass das dank seines Screenreaders für die Computernutzung überhaupt kein Hindernis darstellte
  • Das wirkt wie ein wirklich nützlicher Anwendungsfall für LLMs
    Ich wünschte, mehr Unternehmen würden sich darauf konzentrieren, Menschen zu helfen, statt unter dem Banner der Produktivität Menschen zu ersetzen oder maximal auszupressen

    • Ich finde, man sollte mit dem Urteil warten, bis das wirklich bei den Menschen ankommt, denen es helfen soll
      Meine Erfahrung beschränkt sich auf ältere Eltern mit nachlassendem Sehvermögen, aber wenn man die Schriftgröße auf das stellt, was Apple erlaubt, kann man das Telefon oft nicht mehr lesen
      In jeder App, ob First-Party oder Drittanbieter, läuft Text aus dem Bildschirm heraus
      Im Rechnungsbeispiel wird dem Nutzer gesagt, er solle beim Versorger nachfragen, aber ich verstehe nicht, warum nicht einfach die Nummer auf der Rechnung angerufen wird
      Warum sagt man der Person, sie solle Text Detection verwenden, statt es direkt selbst zu tun? Wenn es Apple Intelligence ist, sollte diese Fähigkeit doch bereits da sein
      Ich fürchte, am Ende ist es höchstens ein Blendwerk-Feature
      Nebenbei: Der Griff sieht gut aus, und ich hoffe, Apple schlägt darauf keine Apple-Steuer drauf
    • Genau das ist Apples größte Stärke
      Neue Branchenentwicklungen werden nicht als Produkt an sich behandelt, sondern als Technologie
      KI wird kein Produkt an sich sein, sondern eine Funktion zur Verbesserung der Customer Experience
    • Stimme zu. Selbst aus Außenperspektive scheint das hier ein Bereich mit großem Potenzial zu sein
      Ich hoffe nur wirklich, dass das Problem aus dem vorherigen Beitrag(https://news.ycombinator.com/item?id=48178378) nicht so verbreitet wird, dass solche nützlichen Funktionen darunter leiden
      Kurzfristig wirkt das zwar unwahrscheinlich, aber mit mehr Einsatzmöglichkeiten werden auch mehr böswillige Akteure auftauchen
    • Läuft das über Server? Ich frage mich, ob man sein Leben einem iPhone anvertraut oder eher einem Datacenter
    • Ehrlich gesagt muss man nur das Geld vergleichen, das Unternehmen damit verdienen können, blinden Menschen zu helfen, mit dem Geld, das sie verdienen können, indem sie Softwareentwickler und Finanzanalysten ersetzen
      Dass Apple diese Technologie nutzt, um Menschen zu helfen, die Unterstützung brauchen, ist lobenswert
      Aber wir müssen nicht so tun, als wüssten wir nicht, warum die meisten Unternehmen nicht in diese Richtung gehen
      Ehrlich gesagt kennt jeder den Grund, und solche Dinge werden immer irgendeinem vagen „jemand anderen“ überlassen
  • Es scheint, als hätten alle diesen Teil übersprungen, aber Blicksteuerung für elektrische Rollstühle klingt nach einer coolen Idee
    Vielleicht geht das nur mir so, und vielleicht ist die Idee auch schon uralt
    Vollwertiges VR hat sich nicht wirklich durchgesetzt, aber es lässt mich weiter darüber nachdenken, ob es einen Markt für leichtere, dünnere Geräte gibt
    Wenn das in die Größe normaler Brillen passt, könnte ich mich für ein Blicksteuerungsgerät interessieren
    Mit einem HUD-System wäre ich noch interessierter, und selbst ein sehr einfaches Niveau mit nur ein paar Symbolen wäre schon okay
    Ein bisschen grundlegendes Audio wäre noch besser, aber wichtiger als HUD oder Audio ist für mich, dass es wie eine normale Brille bleibt

    • Die Technologie gibt es bereits seit einiger Zeit
      Wenn man dem referenzierten Link folgt, findet man Beispiele wie https://www.tolt.tech
      Interessant ist, dass Apple sie ins Betriebssystem integriert hat
    • Das wirkt wie ein ziemlich starkes Signal dafür, dass AR-Brillen weiterentwickelt werden
      Es fühlt sich sehr nach einer dieser Funktionen an, die Apple zuerst veröffentlicht und verfeinert, bevor die eigentliche Hardware bereit ist
  • Der zu zahlende Gesamtbetrag Ihrer Rechnung beträgt 83,89 $. Bitte prüfen Sie diesen Betrag vor der Zahlung beim Versorgungsunternehmen oder verwenden Sie Text Detection, um ihn zu bestätigen

    1. KI ermittelt den Rechnungsbetrag
    2. Man ruft die Rechnungssteller an und fragt, wie viel berechnet wurde
    3. Man zahlt den berechneten Betrag
    • Schon dass man die Information sofort bekommt und später noch verifizieren kann, ist weiterhin nützlich
      Vielleicht ist es besser, eine vertrauenswürdige Person zu bitten, die Zahl vorzulesen, statt bei einem Unternehmen anzurufen, aber nicht jeder hat diese Möglichkeit
    • Wenn man monatelang dieselbe Rechnung bezahlt, weiß man ungefähr, wie hoch etwa die Handyrechnung sein sollte, daher muss man das wohl nicht jedes Mal tun
      Dieser Satz ist natürlich ein notwendiger Hinweis, ähnlich wie wenn ChatGPT in die Fußzeile schreibt: „Bitte überprüfen Sie alles, was wir Ihnen mitteilen“
    • Ich denke, beim Kundensupport anzurufen ist für behinderte Menschen mindestens genauso frustrierend wie für alle anderen
    • Es könnte nützlich sein, wenn Rechnungen zum Beispiel 60 Tage lang gespeichert würden und auch die prozentuale Veränderung gegenüber der letzten Rechnung genannt würde
      Etwa so: „Der zu zahlende Gesamtbetrag dieser Rechnung beträgt 83,89 $ und liegt 4 % über der Rechnung desselben Unternehmens vom letzten Monat“
  • Schade, dass Apple in der YouTube-Version der Werbung den Screenreader-Hinweis „the Apple logo“ entfernt hat
    https://www.youtube.com/watch?v=B3SmsSCvoss
    Meiner Meinung nach war genau das der Teil, der die Werbung besonders gemacht hat

    • Man muss die Audiosprache auf "English descriptive" umstellen
  • Ehrlich gesagt: Als blinde Person und blinder Entwickler ist mir das meiste davon im besten Fall ziemlich egal
    Drittanbieter-Apps wie Seeing AI, Envision AI, BeMyEyes und Aira machen das meiste davon bereits
    Im besten Fall erledigt Apple also nur das, was diese Apps schon können, schneller und on-device, was aber auch bedeuten könnte, dass es ungenauer ist, also muss man abwarten
    Unterdessen wurde VoiceOver, der Screenreader von macOS, praktisch im Wartungsmodus liegen gelassen, und Nutzer mussten selbst ziemlich beeindruckende Drittanbieterlösungen bauen, um Funktionen nachzurüsten, die vergleichbare Screenreader unter Windows schon seit langer Zeit haben
    Aus dieser Perspektive wirkt das alles etwas nach Show, aber vielleicht werde ich ja positiv überrascht
    Ein wenig Hoffnung setze ich in Verbesserungen bei Voice Control
    Denn ständig den programmatischen Namen von Buttons erraten oder Zahlenraster verwenden zu müssen, um Elemente anzusteuern, klingt überhaupt nicht angenehm
    Was Sprechgeschwindigkeit angeht: Es braucht ziemlich viel Übung, um sie stark zu erhöhen, und auch bei einem Stimmenwechsel ist eine gewisse Neugewöhnung nötig
    „Menschlichere“ Stimmen sind bei extrem hoher Geschwindigkeit oft schwerer nachzuvollziehen, weshalb viele lieber robotischere, aber konsistentere Stimmen bevorzugen und KI-basiertem TTS noch nicht trauen
    Solche Stimmen brechen oft zusammen, wenn man die Sprechgeschwindigkeit über ein gewisses Maß erhöht
    Der Punkt, dass man auf das Urteil der eigentlichen Zielgruppe warten sollte, ist wirklich wichtig
    Immer mehr Unternehmen und Einzelpersonen reden über Accessibility, bauen Accessibility-Lösungen und evangelisieren KI für Accessibility, ohne jemals mit den Menschen gesprochen zu haben, denen sie angeblich helfen wollen
    So macht man fast zwangsläufig Fehler, und im schlimmsten Fall schadet man mehr, als man hilft
    Wer Accessibility richtig machen will, auch bei KI-Produkten, muss Menschen mit echter lived experience einstellen
    Sonst endet man bei maschinell übersetzten Texten, mit einem Klick hackerfester Sicherheit oder einer KI-Kaffeebar, die Tausende Gummihandschuhe bestellt
    Nebenbei bemerkt: Ich habe gerade Zeit für ein neues Projekt :P

    • Stimme zu. Wenn sich eine Stunde nach meinem ersten Lesen dieses Beitrags nichts geändert hat, ist das hier der erste Top-Level-Kommentar von einer tatsächlich blinden oder sehbehinderten Person
      Als jemand, der von „schlecht, aber korrigierbar“ zu Low Vision übergeht, war das für mich ebenfalls wertvoll
      Ich wusste nicht, dass es diese Apps gibt, und habe genau nach solcher Hilfstechnologie gesucht
    • Es gibt einem Zuversicht, von jemandem, den man nie getroffen hat, zu hören, dass er zu denselben Schlüssen gekommen ist wie man selbst
      Apple wirkt, als hätte das Unternehmen bei der Entwicklung solcher Produkte nie mit jemandem gesprochen, der dieses Problem wirklich hat
      Lustigerweise bauen wir ein Konkurrenzprodukt zu den erwähnten Drittanbieter-Apps, und mein Kollege bringt als Kind blinder Eltern viel Erfahrung mit
      Es gibt bereits ein MVP online, aber noch nichts Besonderes, und ich möchte nicht der Typ sein, der mit „Äh, ich habe übrigens diese App gebaut?“ daherkommt
    • Es ist gut, die Einschätzung aus Perspektive Betroffener zu hören
      Was mich allerdings etwas verwirrt, ist die Stelle, an der es so klang, als könnte On-Device-Verarbeitung ein Blendwerk sein
      Naiv betrachtet dachte ich, das sei ein großer Vorteil, weil es damit unabhängig vom Mobilfunknetz immer funktioniert
      Also auch in der U-Bahn, im Flugzeug, an abgelegenen Orten usw.
      Davon getrennt würde mich interessieren, welche App im Alltag den größten Unterschied macht