Wir wollen die Menschen nicht zurücklassen": KI hilft behinderten Menschen auf überraschend neue Weise
Sherwood hat schon mehr als 15 Jahre lang blind gewesen; er hat eine Familie, eine erfolgreiche Investmentkarriere und einen Hund, Chris, der ihm in der Welt hilft, sich zu orientieren. Aber er sagt, alltägliche Aufgaben wie Einkaufen noch immer Hindernisse für seine Unabhängigkeit darstellen.
Künstliche Intelligenz könnte bald helfen.
Derzeit sagt Sherwood, dass er manchmal eine App wie Be My Eyes nutzt, die visuell benachteiligte Nutzer mit gesichtsbeschränkten Sighted-Volunteern verbindet, die über Live-Video-Anrufe mit Hilfe geben, wie ein Hemd mit dem Rest der Ausstattung passt oder ob eine Milchkarton abgelaufen ist. Aber Fortschritte in der Technologie der künstlichen Intelligenz beginnen bereits, die Notwendigkeit von Helfern auf der anderen Seite zu beseitigen.
Be My Eyes arbeitet seit letztem Jahr mit OpenAI zusammen, um die AI-Modelle, statt weiteren Menschen, sehen und beschreiben, was vor einem Benutzer steht. In den neuesten Produktvorführungen von OpenAI zeigte die Firma ein Beispiel eines Menschen, der die AI-gestützte Version von Be My Eyes verwendet, um ein Taxi zu bestellen – das App gab dem Benutzer genau an, wann er seine Hand heben sollte, um das Fahrzeug zu hailen. Google hat im Mai ähnliche Funktion für sein App „Lookout“ angekündigt, das für visuell benachteiligte Nutzer entwickelt wurde.
Anwendungen für blindbenachteiligte Nutzer sind nur eine der Bereiche, in denen AI zur Vervollkommnung von „assistive Technology“ beiträgt, den Werkzeugen, die Menschen mit Behinderungen oder Alter helfen.
Apple, Google und andere Tech-Unternehmen haben in den letzten Jahren eine Reihe von AI-gestützten Werkzeugen vorgestellt, um das Leben für Menschen mit einer Vielzahl von Hinderungen leichter zu machen, von Augen-Blicksteuerungen, die physikalisch behinderten Nutzer ihre iPhones mit ihren Augen steuern lassen, bis hin zu ausführlichen Stimmenführungen für blinde Nutzer von Google Maps.
Seit dem beeindruckenden Start von ChatGPT mehr als ein Jahr her ist klar, dass AI unsere Welt verändern wird, indem sie unsere Arbeit, unsere Kommunikation und sogar unser Wahrnehmungsvermögen auf den Kopf stellt. Aber für Menschen mit Behinderungen bietet AI auch das Potenzial, in einer ganz anderen Weise das Leben zu verändern.
„Es gab einmal Zeiten, wenn Sie in Geschäften und blind waren, Sie mussten eine Sekretärin mit Lesefähigkeit haben“, sagte Sherwood. „Aber jetzt haben Sie diese neue Macht … Für einige ist dieses Technologie großartig. Für Blinde Menschen ist das eine Chance auf Beschäftigung und eine Chance, in Geschäften konkurrenzfähig zu sein, eine Chance auf Erfolg.“
Die Vorteile der AI für die Zugänglichkeit
Tech-Unternehmen haben lange Zeit AI verwendet, um ihre Produkte für Menschen zugänglicher zu machen – denken an automatisierte Untertitel auf Videos oder Bildschirmsprachausgaben.
Aber Experten sagen, dass die großen Datenmengen und mächtigen Rechner hinter den neuesten AI-Modellen das Mögliche im Bereich der zugänglichen Technologie beschleunigen. Zum Beispiel benötigt eine AI-Werkzeug zuverlässig, blinden Menschen Taxis zu hailen, sehr gut sein, was ein Taxi aussehen oder nicht aussehen lässt, was eine große Menge an Beispielen erfordert.
Ein weiteres Beispiel: ein Google-Werkzeug, das blinden oder niedrigsehenden Benutzern mitteilt, was auf ihrem Bildschirm ist, wurde mit einer „Frage-und-Antwort“-Funktion ausgestattet, die das Unternehmens generative AI-Technologie einbezieht.
„Das Versprechen der AI war lange Zeit offensichtlich, aber sie muss diese Qualitätsebene erreichen, bevor sie in Produkte aufgenommen werden kann“, erzählte Eve Andersson, Google's Senior Director of Product Inclusion, Equity, and Accessibility, CNN.
Neue generative AI-Tools sind besonders versprechend für zugänglichkeitsrelevante Anwendungen, weil sie informativen Formaten verstehen und produzieren können, einschließlich Textes, Audios, Bilder und Videos. Das bedeutet, wenn ein Benutzer Information in bestimmter Medium verbrauchen muss, kann AI als Vermittler fungieren; z. B. durch die Umwandlung eines Stückes von Audio in Schrift für hörbehinderte Nutzer.
„(Leute) Zugänglichkeitsbedürfnisse nehmen viele verschiedene Formen an, aber eine große Klasse von Behinderungen sind wirklich darum, an der Informationseingangseite und an der Informationaustragseite, es geht um, wie eine Person Information wahrnimmt“, Andersson sagte. „Es gibt Hörbehinderungen, Sehbehinderungen, Motorbehinderungen, Sprachbehinderungen und alle diese können eine Bedürfnis für bestimmte Modalitäten (der Information) einbeinhalten und eine Sache, die AI hervorragend ist, ist, zwischen Modalitäten übersetzen.“
Die Entwicklung von einschließlich AI-Systemen
Das Fortbestehen, dass AI-Systeme allen Nutzern dienen, erfordert fortgesetzte Investitionen.
Da AI-Modelle auf menschliches Schöpfungsdaten trainiert werden, haben Experten gewarnt, dass sie möglicherweise die gleichen Biasse aufweisen, die bei Menschen vorhanden sind. Und erste Beispiele sind bereits aufgetreten, wie AI-Bildgeneratoren, die mit dem Begriff Rasse scheinbar Probleme hatten, oder ein Algorithmus, der angeblich geschlechterspezifische Werbeanzeigen zeigte.
Um dieses Risiko zu minimieren, haben einige große Tech-Unternehmen, darunter Apple, Google, Microsoft und andere, mit Forschern der University of Illinois Urbana-Champaign zusammengearbeitet, um eine Ausbildungsdatenbank für AI-Sprecherkennungswerkzeuge zu erstellen, die eine Vielfalt an Sprachmuster umfasst. Spracherkennungswerkzeuge, wie Übersetzer, Stimmenassistenten und Sprach-Text-Apps können für Nutzer mit Behinderungen besonders wichtig und nützlich sein.
Das Projekt, das Speech Accessibility Project heißt, sammelt Aufnahmen von Freiwilligen mit Bedingungen wie Parkinson, Down-Syndrom, ALS und anderen Behinderungen, die den Sprachausdruck beeinflussen können. Mit Hilfe der Projektdaten eines Probe-Sprecherkennungstools der Forscher versteht der Fehlerquote nur 12% der Zeiten, gegenüber den 20% vor der Ausbildung auf dem neuen Datensatz.
"Die vielfältigere Art von Sprache, die wir in diese maschinellen Lernsysteme einbringen und die größere Vielfalt an Schweregraden, desto besser werden diese Systeme bei der Verständigung von Individuen, die kein 'Hörbuchsprecher'-Sprechen haben, sein," sagte Clarion Mendes, eine Logopäde und klinische Assistentin, die das Projekt leitet.
"Ich habe mich mit so vielen Menschen während dieses Projekts gesprochen, die wegen ihrer Kommunikationsbarrieren große Hindernisse für das Leben mit sich bringen, Menschen mit beeindruckenden Abschlüssen, die aufgrund ihrer Kommunikationsbarrieren keine Arbeit finden konnten," sagte Mendes. "Sollte etwas wie assistives Technik es ermöglichen, Individuen in ihren Hobbys, in ihren Jobs ... plötzlich sind diese Aktivitäten, die früher eine unverhältnismäßige Menge an Zeit in Anspruch genommen hatten oder die Person dazu veranlasst hatten, auf andere Personen zu vertrauen, haben ihre Unabhängigkeit enorm erhöht."
Andersson fügte hinzu, dass es sich nicht nur moralisch, sondern auch wirtschaftlich rechtfertigen lässt, AI für die Barrierefreiheit zu investieren.
"Wir wollen keine Menschen zurücklassen ... Technik allgemein hat die Fähigkeit, das Spielfeld auszugleichen," sagte Andersson. "Aber es gibt auch finanzielle Gründe, wie die Möglichkeit, Ihre Produkte an Regierungen, an Bildungseinrichtungen zu verkaufen."
Sherwood erwähnte, dass blindgeschlagene Geschäftsleute in der Vergangenheit oft Administrativassistenten benötigten, um ihnen vorzulesen, aber mit den Fortschritten in AI sieht er dies als neue Chance für Beschäftigung und Konkurrenz. (Vorteile von AI für Barrierefreiheit)
Das Speech Accessibility Project, eine Zusammenarbeit zwischen Tech-Unternehmen und der University of Illinois Urbana-Champaign, will ein vielfältiges Spracherkennungsdatensatz erstellen, um die Verständigung von Individuen mit verschiedenen Sprachbedingungen durch AI-Systeme zu verbessern. (Entwicklung einschließlich AI-Systeme)