Apple stellt neue Bedienungshilfen vor
(apple.com)- Apple Intelligence wird in VoiceOver, Lupe, Sprachsteuerung und Accessibility Reader integriert und verbessert Bildbeschreibungen, Navigation in natürlicher Sprache und Lesehilfen
- VoiceOver und Lupe ermöglichen mit Image Explorer und Live Recognition Fragen und Antworten zu Inhalten im Kamerabild, sollten aber nicht in Hochrisikosituationen als verlässliche Grundlage genutzt werden
- Sprachsteuerung unterstützt die Navigation auf iPhone und iPad mit Befehlen in natürlicher Sprache wie „tap the purple folder“ statt exakter Labels oder Nummern
- Bei Videos ohne Untertitel werden on-device generierte Untertitel automatisch eingeblendet; verfügbar auf iPhone, iPad, Mac, Apple TV und Apple Vision Pro
- Apple Vision Pro kann mit Blickverfolgung alternative Fahrsysteme von Tolt und LUCI steuern; außerdem erscheint der Hikawa Grip & Stand weltweit
Zeitplan zur Einführung und Datenschutz
- Die neuen Funktionen und Apple-Intelligence-basierten Updates sollen später in diesem Jahr verfügbar werden
- Apple erklärt, bei der Integration von Apple Intelligence in Bedienungshilfen das Prinzip privacy by design beizubehalten
- Hikawa Grip & Stand for iPhone erscheint im Apple Store online in drei neuen Farben
Erkundung visueller Informationen mit VoiceOver und Lupe
- VoiceOver und Lupe beschreiben Bildschirminhalte und die Umgebung detaillierter für Nutzer mit Blindheit oder Sehschwäche
- Der Image Explorer in VoiceOver liefert mit Apple Intelligence Bildbeschreibungen systemweit für Fotos, gescannte Rechnungen, persönliche Aufzeichnungen und mehr
- Mit dem Live-Recognition-Update können VoiceOver-Nutzer die Action button des iPhone drücken, Fragen zu den im Kamerasucher sichtbaren Inhalten stellen und Antworten erhalten
- Nutzer können in eigenen Worten Anschlussfragen stellen und so weitere visuelle Informationen abrufen
- Lupe bietet dieselben unterstützten Navigations- und visuellen Beschreibungsfunktionen in einer Oberfläche mit hohem Kontrast für Nutzer mit Sehschwäche
- Lupe arbeitet ebenfalls mit der Action button zusammen und lässt sich mit Sprachbefehlen wie „zoom in“ oder „turn on flashlight“ steuern
- Auf VoiceOver und Lupe sollte nicht vertraut werden, wenn Personen verletzt oder geschädigt werden könnten, in Hochrisikosituationen, bei der Wegfindung oder bei Diagnose bzw. Behandlung medizinischer Zustände
Eingabe in natürlicher Sprache mit der Sprachsteuerung
- Sprachsteuerung nutzt Apple Intelligence, damit Nutzer mit körperlichen Behinderungen iPhone und iPad allein per Stimme intuitiver bedienen können
- Die neue flexible Eingabe erlaubt die Steuerung, indem Buttons und Bedienelemente auf dem Bildschirm in natürlicher Sprache beschrieben werden, statt exakte Labels oder Nummern zu nennen
- Der Ansatz „say what you see“ funktioniert in allen Apps, auch in Apps mit visuellem Layout wie Apple Maps oder Dateien
- Beispielbefehle sind „tap the guide about best restaurants“ oder „tap the purple folder“, die sichtbare Objekte direkt beschreiben
- Das kann auch Barrieren verringern, die entstehen, wenn Elemente für Bedienungshilfen nicht korrekt beschriftet sind
- Die auf Apple Intelligence basierende Sprachsteuerung soll in englischen Umgebungen in den USA, Kanada, dem Vereinigten Königreich und Australien verfügbar sein
Accessibility Reader und generierte Untertitel
- Accessibility Reader bietet ein anpassbares Leseerlebnis für Nutzer mit unterschiedlichen Behinderungen, von Dyslexie bis Sehschwäche
- Durch Apple Intelligence kann er auch komplexere Originalmaterialien wie wissenschaftliche Arbeiten verarbeiten
- Auch Texte mit mehreren Spalten, Bildern und Tabellen können verarbeitet werden
- Zusammenfassungen auf Abruf ermöglichen es, zuerst einen Überblick über ein Dokument zu sehen, bevor Details gelesen werden
- Eine neue integrierte Übersetzung erlaubt das Lesen von Texten in der eigenen Muttersprache unter Beibehaltung benutzerdefinierter Formatierung, Schriftarten und Farben
- Neue generierte Untertitel blenden automatisch Transkriptionen der gesprochenen Audiospur bei Videos ohne Captions oder Untertitel ein
- Dazu gehören mit dem iPhone aufgenommene Clips, von Freunden und Familie erhaltene Videos sowie online gestreamte Inhalte
- Die Untertitel werden privat durch Spracherkennung auf dem Gerät erzeugt und bei Videos ohne Untertitel automatisch auf iPhone, iPad, Mac, Apple TV und Apple Vision Pro angezeigt
- Das Erscheinungsbild der Untertitel kann im Videowiedergabemenü oder in den Settings angepasst werden
- Generierte Untertitel sollen in englischen Umgebungen in den USA und Kanada verfügbar sein
Steuerung von Elektrorollstühlen mit Apple Vision Pro
- Einige Nutzer von Elektrorollstühlen können nicht mit einem Joystick fahren; alternative Fahrsteuerungen können daher für unabhängige Mobilität entscheidend sein
- Das präzise Blickverfolgungssystem von Apple Vision Pro dient als reaktionsschnelle Eingabemethode für kompatible alternative Fahrsysteme
- Die Blickverfolgung von Vision Pro benötigt keine häufige Neukalibrierung und funktioniert unter unterschiedlichen Lichtbedingungen
- Die Funktion startet in den USA mit den alternativen Fahrsystemen Tolt und LUCI
- Die Zubehörunterstützung umfasst sowohl Bluetooth- als auch Kabelverbindungen; für Kabelverbindungen ist der Kauf des Apple Vision Pro Developer Strap erforderlich
- Apple will weiterhin mit Entwicklern zusammenarbeiten, um mehr Rollstuhl-Fahrsysteme zu unterstützen
- Diese Funktion und Apple Vision Pro sind für die Nutzung in kontrollierten Umgebungen vorgesehen; weitere Informationen gibt es unter support.apple.com/en-us/118507
- Pat Dolan, der seit zehn Jahren mit ALS lebt, sagt, eine Möglichkeit zur selbstständigen Steuerung seines Elektrorollstuhls sei für ihn „Gold wert“
Hikawa Grip & Stand for iPhone
- Hikawa Grip & Stand for iPhone erscheint weltweit im Apple Store online und ist in drei neuen Farben erhältlich
- Es ist ein MagSafe-Zubehör, das vom in Los Angeles ansässigen Designer Bailey Hikawa mit Blick auf Barrierefreiheit entwickelt wurde
- An der Entwicklung waren Menschen mit verschiedenen Behinderungen beteiligt, die Griffkraft, Stärke und Mobilität beeinflussen
- Es handelt sich um einen anpassungsfähigen Griff mit Standfunktion, der Nutzern hilft, das iPhone so zu halten, wie es für sie am besten passt
- Durch die Zusammenarbeit von Hikawa und PopSockets wird dieses anpassungsfähige Zubehör erstmals weltweit verfügbar
- Im Apple The Grove in Los Angeles findet eine Today at Apple-Session mit Hikawa, Shane Burcaw und Alex Barone statt
- Verfügbar ist es in Australia, Austria, Belgium, Canada, China, Denmark, France, Hong Kong, Italy, Japan, the Netherlands, Singapore, South Korea, Spain, Sweden, Switzerland, Taiwan, the United Arab Emirates, the UK und the U.S.; gekauft werden kann es auf apple.com
Weitere Updates zur Barrierefreiheit
- Vehicle Motion Cues kommt zu visionOS und kann helfen, Reisekrankheit zu reduzieren, wenn Apple Vision Pro als Mitfahrer in einem fahrenden Fahrzeug genutzt wird
- Vision Pro unterstützt Gesichtsgesten zum Ausführen von Taps und Systemaktionen
- Für Vision Pro kommt außerdem eine neue Möglichkeit hinzu, Elemente mit den Augen auszuwählen, während Dwell Control verwendet wird
- Touch Accommodations bietet eine neue Möglichkeit, Einstellungen in iOS und iPadOS zu personalisieren
- Made for iPhone hearing aids sorgen in iOS, iPadOS, macOS und visionOS für stabileres Pairing und Handoff zwischen Apple-Geräten und verbessern auch das Setup-Erlebnis
- Unterstützung für Larger Text wird zu tvOS hinzugefügt, damit Zuschauer mit Sehschwäche die Bildschirmtexte vergrößern und leichter lesen können
- Name Recognition benachrichtigt Nutzer mit Gehörlosigkeit oder Hörminderung, wenn jemand ihren Namen sagt, und funktioniert in mehr als 50 Sprachen weltweit
- Eine neue API für Entwickler von Apps für Gebärdensprachdolmetschen unterstützt Nutzer dabei, laufenden FaceTime-Videoanrufen menschliche Dolmetscher hinzuzufügen
- Der Sony Access controller kann unter iOS, iPadOS und macOS als Gamecontroller verbunden werden
- Auf dem Sony Access controller lassen sich Thumbstick, neun integrierte Buttons sowie bis zu vier zusätzliche externe Buttons oder Spezialschalter konfigurieren, um das Layout zu personalisieren
- Nutzer können zwei Controller kombinieren, um ein noch stärker personalisiertes Spielerlebnis zu schaffen
Verfügbare Sprachen und regionale Einschränkungen
- Apple Intelligence wird als Beta bereitgestellt; unterstützte Sprachen sind English, Danish, Dutch, French, German, Italian, Norwegian, Portuguese, Spanish, Swedish, Turkish, Vietnamese, Chinese (simplified), Chinese (traditional), Japanese und Korean
- Einige Funktionen sind möglicherweise nicht in allen Regionen oder Sprachen verfügbar
- Informationen zur Verfügbarkeit von Funktionen und Sprachen sowie zu den Systemanforderungen gibt es unter support.apple.com/en-us/121115
1 Kommentare
Hacker-News-Kommentare
Apple mag es, neue Technologien an unscheinbaren Stellen einzuschleusen und öffentlich heimlich zu testen, daher wirkt es sehr nach Apple, agentische KI zuerst als Bedienungshilfe auszurollen
Die Touch Bar war nicht einfach nur ein OLED-Streifen, sondern der erste Schritt hin zu Macs mit Apple Silicon, und der Apple-T1-Chip im Touch-Bar-MacBook von 2016 war der erste vollständig von Apple entworfene Prozessor in einem Mac
Er übernahm Aufgaben vom Intel-Chipsatz wie Energieverwaltung, Lüfter, Ruhezustand/Aufwachen, Kamera- und Mikrofonzugriff sowie die Secure Enclave für Touch ID, und später kümmerte sich der T2 zusätzlich um SSD-Verschlüsselung, Audiomanagement, Kamerabildverarbeitung und Manipulationsschutz im Bootprozess
Im iPhone 3G lag ein Liquidmetal-SIM-Auswurftool bei, eine maßgeschneiderte Metalllegierung, die man mit der Hand fast nicht verbiegen konnte; Apple brachte danach zwar keine Produkte mit dieser Legierung heraus, aber fast 20 Jahre später gibt es Gerüchte über Flüssigmetall in einem faltbaren iPhone
Auch RealityKit hatte jahrelang 3D-Scanning und verschiedene AR-Funktionen, deren Bedeutung erst mit dem Apple Vision Pro klar wurde
Die Touch Bar wurde von den Leuten gehasst und erst Jahre später von Technikfans geschätzt, als sie sie hackten und anpassten, um tiefere Funktionen hinzuzufügen
Ein SIM-Auswurftool aus einer teuren Legierung ergab ebenfalls keinen Sinn, und RealityKit und Vision wirken wie Lösungen auf der Suche nach einem Problem, wobei Vision selbst ebenfalls zu scheitern scheint
3D Touch hatte auch Probleme mit Auffindbarkeit und Bedienbarkeit, und Beispiele wie diese gibt es noch mehr
Diese Materialien gibt es seit Jahrzehnten, und trotzdem scheinen sie durch den Apple-Markennamen fast zum Synonym geworden zu sein, was ich ziemlich unerquicklich finde
Dass sie nicht häufiger eingesetzt werden, liegt vor allem daran, dass sie sehr teuer sind; wer aber wie Apple einen Bedarf von zig Millionen Bauteilen garantieren kann, bekommt die Wirtschaftlichkeit viel leichter hin
Ich habe gelesen, dass beim Filmen oder Fotografieren die Linse sichtbarer aufleuchtet oder blinkt als bei Meta, was bei Datenschutzbedenken helfen könnte, und zumindest ist es nicht Meta
Ich mag meine Meta-Smart-Glasses, aber beide Paare sind kaputtgegangen und es gibt kein Geschäft für Support, daher würde ich bei einem Apple-Produkt schnell wechseln
Aus Entwicklersicht sind Apples Accessibility-APIs auf Betriebssystemebene wirklich gut
Kaputt geht es an der Grenze, wo WebKit in native Apps eingebettet wird
Ich habe eine Tauri-App mit dem Monaco-Editor in einer WKWebView ausgeliefert und mühsam herausgefunden, dass der VoiceOver-Modus
accessibilitySupport: autostillschweigend die rückwärtige Textauswahl in Monaco zerstörtMit
"off"funktionierte die Auswahl korrekt, und am Ende musste ich mich zwischen normaler Textauswahl und VoiceOver-Support entscheiden, wobei die Wahl auf die Auswahlfunktion fielIn AppKit/UIKit ist es robust, aber an der eingebetteten-WebView-Grenze, wo heute die meisten Desktop-Apps tatsächlich leben, bricht es auseinander
Früher habe ich mich als sehender Mensch bei Be My Eyes angemeldet
Es kamen nicht so viele Anrufe wie erhofft, aber ich konnte ein paarmal helfen, was schön war
Ich habe einmal einen Briefumschlag vorgelesen, einmal eine Medikamentenflasche, und es gab zwei lustige Männer, die in großen weichen Sesseln saßen und Einkaufstaschen voller Müslischachteln mitgebracht hatten und wissen wollten, welche welche war
Ich erinnere mich, dass einer von ihnen eine bestimmte Sorte wirklich hasste
Die App hatte die einzigartige Funktion, dass eine sehende Person die Kamera eines blinden Nutzers aktivieren konnte
https://www.bemyeyes.com
Ich finde es großartig, dass KI für blinde Menschen inzwischen gut genug funktioniert, um ihre Probleme selbst zu lösen
Trotzdem hatte es etwas sehr Menschliches und Schönes, ab und zu kleinen, zufälligen Dingen im Leben eines Fremden zu helfen
Besonders gut erinnere ich mich an eine ältere Frau, die eine Schachtel Blaubeeren auf ihrem Küchenboden verschüttet hatte und der ich mit Richtungsangaben half, alle wiederzufinden
Es waren 10 Minuten mit einem Fremden, in denen wir etwas Interessantes taten, und selbst 4 Jahre später ist mir das warm in Erinnerung geblieben
Als vollständig blinder Mensch habe ich die App erst nach der KI-Erweiterung genutzt, und sie funktioniert sehr gut, um Lebensmitteletiketten zu lesen, nachdem die Kinder Dinge umgestellt haben, oder um zu prüfen, ob der Fernseher eingeschaltet ist
Würde ich noch allein leben, hätte ich die Freiwilligenfunktion vermutlich auch genutzt, aber derzeit ist das nicht nötig
Das ist natürlich etwas Gutes, und ich will mich nicht beklagen, aber ich habe mich vor Jahren angemeldet, nie einen Anruf bekommen und die App schließlich gelöscht
Eine Sache, die Apple wirklich in Ordnung bringen muss, ist Speech-to-Text
Bei Bedienungshilfen haben sie vieles richtig gemacht, aber bei der Transkription wirken sie nicht 10, aber mindestens 5 Jahre zurück
Texteingabe auf dem iPhone ist inzwischen schrecklich
Die Erkennung von versehentlichen Handballenberührungen ist eindeutig schlechter als früher, weshalb Tippfehler häufiger sind, und auch die Autokorrektur-Algorithmen beim Tippen sind schlechter geworden und ersetzen oft falsch Wörter mehrere Wörter vor der Stelle, an der ich gerade tippe
Die Spracherkennung ist ebenfalls nicht besser geworden, und schon die Form des Telefons macht die Finger müde
Ich wünschte, die iPhone-Nutzung wäre nicht so unerquicklich
Apples Lösung fühlt sich im Vergleich wie aus dem letzten Jahrhundert an
Dasselbe gilt für Apples Text-to-Speech, wenn ElevenLabs und OpenAI weit voraus sind
Ich brauche nur, dass das iPhone solche Dinge nativ in derselben Qualität unterstützt, denn in Apples geschlossenem Ökosystem ist das die einzige Möglichkeit, es überall nutzen zu können
Gestern habe ich noch ein weiteres schreckliches iPhone-Eingabe-„Feature“ entdeckt
Wenn man in einer Drittanbieter-CarPlay-App durch eine Liste blättert und kurz vor dem Antippen zur Auswahl zuerst aufs Gaspedal drückt, wird die Liste auf nur wenige Einträge beschnitten und nach oben gescrollt
Ein großartiger Weg, Ablenkung beim Fahren zu reduzieren. Ändert sich als Nächstes das Kartenziel, sobald das Auto fährt?
Ich wünschte, Human-Computer-Interaction-Forschung würde breiter angewendet, und ich finde, für Dummheiten wie im Auto-/CarPlay-Ökosystem sollte man vor Gericht haften
Früher fuhr ich einmal ein Auto, das jedes Mal beim Einschalten der Rückfahrkamera hinter einem rechtlichen Hinweis verschwand, und während dieser Bildschirm eingeblendet war, ist mit Sicherheit mindestens ein Fußgänger von einem rückwärtsfahrenden Auto erfasst worden
Hersteller sollten für solche schlechten UI-Entscheidungen zu 100 % verantwortlich sein
Auch diesen Tipp habe ich auf HN gelernt
Öffne die Einstellungen-App, tippe auf General, scrolle zu Keyboard und deaktiviere Slide to Type
Fast jedes zweite Wort, das ich tippe, oder das das iPhone glaubt, dass ich es getippt habe, muss ich korrigieren
Und während ich korrigiere, erzeugt die Autokorrektur neue und noch unverständlichere Tippfehler
Manchmal erreicht das plötzlich ein Maß an Fiebertraum-Wahnsinn, bei dem ich alltägliche Dinge nicht mehr vernünftig erledigen kann
Am schlimmsten ist, dass es früher gut war
Auf dem iPhone 4S tippte ich fast mit der Geschwindigkeit und Genauigkeit einer vollwertigen Tastatur
https://www.theregister.com/on-prem/2023/08/16/those-who-rel...
Wenigstens zwei große Bugs sollten sie beheben
Selbst dort, wo es unterstützt wird, schlägt die Eingabe scheinbar zufällig fehl, und viele Apps großer Anbieter wie OneNote unterstützen Diktateingabe überhaupt nicht
In solchen Fällen sollte es wenigstens einen Fallback geben, wie früher bei Dragon Dictate vor Jahrzehnten
Auch die Großschreibung ist weiterhin zufällig, es bleiben also viele Fehler zu beheben
Apple scheint Accessibility eher als Stoff für prestigeträchtige Pressemitteilungen zu sehen als als echtes Feature
Interessante Tatsache: Dieses Video wurde so zugänglich gemacht, dass es für sehende Menschen passt
Kein tatsächlich blinder Mensch würde sich Sprache in diesem Tempo anhören, und wenn man blinde Menschen am Computer beobachtet, ist man oft verblüfft über ihre Fähigkeit, Audio in Geschwindigkeiten zu verstehen, die man sich kaum vorstellen kann
Mein Standardbeispiel ist dieses Video, in dem Saqib Shaikh, ein blinder Software Engineer bei Microsoft, über Visual Studio spricht
Der Link springt direkt zu der Stelle
Ich war völlig verblüfft, wie schnell sein Screenreader Inhalte vorlas, und für mich war es überhaupt nicht verständlich
Seine Effizienz mit Tastaturkürzeln hätte selbst die Elite von vim/emacs beschämt
Eine extrem schnelle Roboterstimme kann ziemlich rau und nervig wirken, und selbst blinde Menschen, die darauf angewiesen sind, fühlen sich davon manchmal überreizt
Ich habe über blinde Menschen gelesen, die Echoortung mit Schall gelernt haben, und das wirkte wie eine echte Superkraft, sodass ich irgendwann vielleicht mal den Monitor ausstecken und lernen möchte, Werkzeuge richtig zu benutzen
Ein blinder Kollege, mit dem ich vor einigen Jahren arbeitete, ließ den Bildschirm immer ausgeschaltet, wodurch der Laptop-Akku fast doppelt so lange hielt wie bei allen anderen, und allein das war schon ein nettes Feature
Selbst wenn ich nie dieses gewaltige Echoortungsniveau erreiche, wäre schon die Hälfte davon cool, und als Bonus könnte ich Accessibility-Änderungen tatsächlich QA-testen
Das wirkt wie ein wirklich nützlicher Anwendungsfall für LLMs
Ich wünschte, mehr Unternehmen würden sich darauf konzentrieren, Menschen zu helfen, statt unter dem Banner der Produktivität Menschen zu ersetzen oder maximal auszupressen
Meine Erfahrung beschränkt sich auf ältere Eltern mit nachlassendem Sehvermögen, aber wenn man die Schriftgröße auf das stellt, was Apple erlaubt, kann man das Telefon oft nicht mehr lesen
In jeder App, ob First-Party oder Drittanbieter, läuft Text aus dem Bildschirm heraus
Im Rechnungsbeispiel wird dem Nutzer gesagt, er solle beim Versorger nachfragen, aber ich verstehe nicht, warum nicht einfach die Nummer auf der Rechnung angerufen wird
Warum sagt man der Person, sie solle Text Detection verwenden, statt es direkt selbst zu tun? Wenn es Apple Intelligence ist, sollte diese Fähigkeit doch bereits da sein
Ich fürchte, am Ende ist es höchstens ein Blendwerk-Feature
Nebenbei: Der Griff sieht gut aus, und ich hoffe, Apple schlägt darauf keine Apple-Steuer drauf
Neue Branchenentwicklungen werden nicht als Produkt an sich behandelt, sondern als Technologie
KI wird kein Produkt an sich sein, sondern eine Funktion zur Verbesserung der Customer Experience
Ich hoffe nur wirklich, dass das Problem aus dem vorherigen Beitrag(https://news.ycombinator.com/item?id=48178378) nicht so verbreitet wird, dass solche nützlichen Funktionen darunter leiden
Kurzfristig wirkt das zwar unwahrscheinlich, aber mit mehr Einsatzmöglichkeiten werden auch mehr böswillige Akteure auftauchen
Dass Apple diese Technologie nutzt, um Menschen zu helfen, die Unterstützung brauchen, ist lobenswert
Aber wir müssen nicht so tun, als wüssten wir nicht, warum die meisten Unternehmen nicht in diese Richtung gehen
Ehrlich gesagt kennt jeder den Grund, und solche Dinge werden immer irgendeinem vagen „jemand anderen“ überlassen
Es scheint, als hätten alle diesen Teil übersprungen, aber Blicksteuerung für elektrische Rollstühle klingt nach einer coolen Idee
Vielleicht geht das nur mir so, und vielleicht ist die Idee auch schon uralt
Vollwertiges VR hat sich nicht wirklich durchgesetzt, aber es lässt mich weiter darüber nachdenken, ob es einen Markt für leichtere, dünnere Geräte gibt
Wenn das in die Größe normaler Brillen passt, könnte ich mich für ein Blicksteuerungsgerät interessieren
Mit einem HUD-System wäre ich noch interessierter, und selbst ein sehr einfaches Niveau mit nur ein paar Symbolen wäre schon okay
Ein bisschen grundlegendes Audio wäre noch besser, aber wichtiger als HUD oder Audio ist für mich, dass es wie eine normale Brille bleibt
Wenn man dem referenzierten Link folgt, findet man Beispiele wie https://www.tolt.tech
Interessant ist, dass Apple sie ins Betriebssystem integriert hat
Es fühlt sich sehr nach einer dieser Funktionen an, die Apple zuerst veröffentlicht und verfeinert, bevor die eigentliche Hardware bereit ist
Der zu zahlende Gesamtbetrag Ihrer Rechnung beträgt 83,89 $. Bitte prüfen Sie diesen Betrag vor der Zahlung beim Versorgungsunternehmen oder verwenden Sie Text Detection, um ihn zu bestätigen
Vielleicht ist es besser, eine vertrauenswürdige Person zu bitten, die Zahl vorzulesen, statt bei einem Unternehmen anzurufen, aber nicht jeder hat diese Möglichkeit
Dieser Satz ist natürlich ein notwendiger Hinweis, ähnlich wie wenn ChatGPT in die Fußzeile schreibt: „Bitte überprüfen Sie alles, was wir Ihnen mitteilen“
Etwa so: „Der zu zahlende Gesamtbetrag dieser Rechnung beträgt 83,89 $ und liegt 4 % über der Rechnung desselben Unternehmens vom letzten Monat“
Schade, dass Apple in der YouTube-Version der Werbung den Screenreader-Hinweis „the Apple logo“ entfernt hat
https://www.youtube.com/watch?v=B3SmsSCvoss
Meiner Meinung nach war genau das der Teil, der die Werbung besonders gemacht hat
"English descriptive"umstellenEhrlich gesagt: Als blinde Person und blinder Entwickler ist mir das meiste davon im besten Fall ziemlich egal
Drittanbieter-Apps wie Seeing AI, Envision AI, BeMyEyes und Aira machen das meiste davon bereits
Im besten Fall erledigt Apple also nur das, was diese Apps schon können, schneller und on-device, was aber auch bedeuten könnte, dass es ungenauer ist, also muss man abwarten
Unterdessen wurde VoiceOver, der Screenreader von macOS, praktisch im Wartungsmodus liegen gelassen, und Nutzer mussten selbst ziemlich beeindruckende Drittanbieterlösungen bauen, um Funktionen nachzurüsten, die vergleichbare Screenreader unter Windows schon seit langer Zeit haben
Aus dieser Perspektive wirkt das alles etwas nach Show, aber vielleicht werde ich ja positiv überrascht
Ein wenig Hoffnung setze ich in Verbesserungen bei Voice Control
Denn ständig den programmatischen Namen von Buttons erraten oder Zahlenraster verwenden zu müssen, um Elemente anzusteuern, klingt überhaupt nicht angenehm
Was Sprechgeschwindigkeit angeht: Es braucht ziemlich viel Übung, um sie stark zu erhöhen, und auch bei einem Stimmenwechsel ist eine gewisse Neugewöhnung nötig
„Menschlichere“ Stimmen sind bei extrem hoher Geschwindigkeit oft schwerer nachzuvollziehen, weshalb viele lieber robotischere, aber konsistentere Stimmen bevorzugen und KI-basiertem TTS noch nicht trauen
Solche Stimmen brechen oft zusammen, wenn man die Sprechgeschwindigkeit über ein gewisses Maß erhöht
Der Punkt, dass man auf das Urteil der eigentlichen Zielgruppe warten sollte, ist wirklich wichtig
Immer mehr Unternehmen und Einzelpersonen reden über Accessibility, bauen Accessibility-Lösungen und evangelisieren KI für Accessibility, ohne jemals mit den Menschen gesprochen zu haben, denen sie angeblich helfen wollen
So macht man fast zwangsläufig Fehler, und im schlimmsten Fall schadet man mehr, als man hilft
Wer Accessibility richtig machen will, auch bei KI-Produkten, muss Menschen mit echter lived experience einstellen
Sonst endet man bei maschinell übersetzten Texten, mit einem Klick hackerfester Sicherheit oder einer KI-Kaffeebar, die Tausende Gummihandschuhe bestellt
Nebenbei bemerkt: Ich habe gerade Zeit für ein neues Projekt :P
Als jemand, der von „schlecht, aber korrigierbar“ zu Low Vision übergeht, war das für mich ebenfalls wertvoll
Ich wusste nicht, dass es diese Apps gibt, und habe genau nach solcher Hilfstechnologie gesucht
Apple wirkt, als hätte das Unternehmen bei der Entwicklung solcher Produkte nie mit jemandem gesprochen, der dieses Problem wirklich hat
Lustigerweise bauen wir ein Konkurrenzprodukt zu den erwähnten Drittanbieter-Apps, und mein Kollege bringt als Kind blinder Eltern viel Erfahrung mit
Es gibt bereits ein MVP online, aber noch nichts Besonderes, und ich möchte nicht der Typ sein, der mit „Äh, ich habe übrigens diese App gebaut?“ daherkommt
Was mich allerdings etwas verwirrt, ist die Stelle, an der es so klang, als könnte On-Device-Verarbeitung ein Blendwerk sein
Naiv betrachtet dachte ich, das sei ein großer Vorteil, weil es damit unabhängig vom Mobilfunknetz immer funktioniert
Also auch in der U-Bahn, im Flugzeug, an abgelegenen Orten usw.
Davon getrennt würde mich interessieren, welche App im Alltag den größten Unterschied macht