GI-Radar 234: Den Ton gibt der Rechner an

 

Sehr geehrte Leserinnen und Leser,

im Thema im Fokus haben wir dieses Mal – Achtung – gute Nachrichten aus dem Hause Google. In den Kurzmitteilungen geht es unter anderem um die sogenannte Gender-Pay-Gap in der IT-Branche. Nachdem wir Ihnen im letzten Fundstück etwas für's Auge geboten haben, gibt es dieses Mal etwas „auf die Ohren“.

Wir wünschen Ihnen viel Spaß bei der Lektüre!

auf gi-radar.de weiterlesen

Gender-Pay-Gap + Momo auf WhatsApp + alte GPS-Geräte + Gesichtserkennung beim Shopping + Schweiz: Sicherheitstest eines E-Voting-Systems + Kennzeichenscanner in Brandenburg + Google: Transkription und Audioverstärkung + GI-Präsident: nationale Sicherheit versus Handelspolitik + neue Fachgruppe: Digital Health + Niedersachsen: Pflichtfach Informatik + Sprachsynthese anschaulich erklärt

KURZMITTEILUNGEN

Gehaltsunterschiede zwischen Männern und Frauen in der Tech-Branche besonders groß (FAZ). Je stärker ein Beruf digitalisiert ist, desto größer sind die Gehaltsunterschiede zwischen Männern und Frauen. Das geht aus einer Studie des IAB (Institut für Arbeits- und Berufsforschung) hervor.  weiterlesen

Momo: Kann ein Kettenbrief Kinder in den Suizid treiben? (ZEIT, 9 min) Bereits vor einiger Zeit machte Momo Schlagzeilen: eine Gruselfigur, die WhatsApp-Nutzerinnen und Nutzer zu verschiedenen Aufgaben verpflichtet und damit droht, dass andernfalls etwas Schlimmes passieren würde. Eine Analyse, was solche Kettenbriefe auslösen.  weiterlesen

GPS weckt Erinnerungen an das Jahr-2000-Problem (The Register, engl.). Ältere Geräte, die GPS zur Lokalisierung verwenden, funktionieren bald nicht mehr. Der 10-bittige Wochenzähler wird dort am 6. April „überlaufen“. Beim Entwurf von IT-Systemen sollte man niemals unterschätzen, wie lange diese im Einsatz sein werden.  weiterlesen

Shoppingerlebnisse der anderen Art (Wirtschaftswoche, 6 min). Gesichtserkennung war bislang eher Thema bei der Überwachung. Nun überlegt der Handel, wie er mittels Gesichtserkennung in Geschäften den Bezahlvorgang optimieren und Käuferinnen und Käufer zu mehr Einkäufen motivieren kann.  weiterlesen

Kritik an geplantem schweizerischen E-Voting-System (swissinfo.ch). Die Schweizer Post führt aktuell einen öffentlichen Belastungstest an ihrem E-Voting-System durch. Interessierte Hacker und unabhängige IT-Spezialisten sollen die Plattform auf Herz und Nieren prüfen. Erste – durchweg negativ gestimmte – Einschätzungen liegen bereits vor.  weiterlesen

Datenschutz versus Verfolgung von Straftaten (Netzpolitik). Der Fall Rebecca sorgt für Aufregung in Deutschland. Nun wurde bekannt, dass mittels Autobahnüberwachung in Brandenburg der Standort eines bestimmten Autos zu einer bestimmten Zeit gespeichert und ausgewertet werden konnte. Hier stellt sich die schwierige Frage, ob und wie Überwachungstechnologie eingesetzt werden kann, darf und sollte.  weiterlesen

THEMA IM FOKUS

Google-Apps zur Transkription und Audioverstärkung. Die Weltgesundheitsorganisation WHO erwartet bis zum Jahre 2055 über 900 Millionen Gehörlose. Allein in Deutschland leben schätzungsweise derzeit 80.000 gehörlose und ca. 16 Millionen schwerhörige Menschen. In diesem Kontext hat Google nun in Zusammenarbeit mit der Gallaudet Universität, der weltweit ersten Universität für Gehörlose und Schwerhörige, zwei neue Applikationen vorgestellt (Google Blog), die es solchen Menschen leichter machen, am alltäglichen Leben teilzuhaben. Die beiden Apps „Automatische Transkription“ und „Audioverstärkung“ sind frei verfügbar. Sie sollen auf künftigen Google Smartphones bereits vorinstalliert sein. Auch Apple hat eine „live listening“ Funktion für ihre Smartphones vorgestellt, die ähnlich wie die Audioverstärkung von Google funktioniert und ab iOS 12 verfügbar ist. (apple.com).

Die automatische Transkription (Google Play Store) wandelt Gesprochenes beinahe in Echtzeit in Text um und zeigt diesen auf dem Smartphone-Display an. Die Textgröße und das Design lassen sich einstellen, ebenso die Option „vulgäre Sprache ausblenden“. Insgesamt ist die Oberfläche sehr minimalistisch und einfach gehalten, sodass sie grundsätzlich von jedem bedient werden kann. Es werden derzeit 70 Sprachen und Dialekte unterstützt. Es lassen sich eine Standard- und Zweitsprache festlegen, um per einfachem Antippen zwischen ihnen wechseln zu können. Bei kurzen Abschnitten wird automatisch zwischen den Sprachen gewechselt. Bei größerem Sprachinput muss die Sprache allerdings manuell gewechselt werden. 

Die Anwendung zeigt an, ob Laute als Sprachinput oder als Hintergrundgeräusche wahrgenommen werden, sodass gegebenenfalls das Smartphone passend ausgerichtet werden kann. Für eine genauere Transkription ist es auch möglich auf ein externes Mikrofon zurückzugreifen. Des Weiteren nimmt die Anwendung Textinput über die Tastatureingabe an, sodass man auf diese Weise auf das Gesprochene antworten kann. Optional kann eingestellt werden, dass die Anwendung das Smartphone vibrieren lässt, um nach einer längeren Stille wieder auf Sprachinput aufmerksam zu machen. Da für die Spracherkennung Googles Cloud-Dienst eingesetzt wird, ist eine bestehende Internetverbindung während der Nutzung erforderlich.  

Der Audioverstärker (Google Play Store) passt den über das Mikrofon aufgenommenen Ton an, um ihn verständlicher zu machen. Dies funktioniert indem leise, nicht jedoch laute Töne verstärkt werden. Für die Wiedergabe sind kabelgebundene Kopfhörer notwendig im Gegensatz zur ähnlichen Funktion, die Apple kabellos für AirPods bereitstellt. 

Mikrofon- und Audioeinstellungen wie etwa Tonverstärkung, Stärke der Ausblendung von Hintergrundgeräuschen, Lautstärke, etc. ermöglichen eine Feinabstimmung auf die Bedürfnisse der Nutzer. Darüber hinaus können verschiedene Einstellungen getrennt für das linke und rechte Ohr angepasst werden. Optional kann ein externes Mikrofon mit größerer Empfindlichkeit genutzt werden. Hier erlaubt Google auch externen Entwicklern die Anwendung über die Dynamic Processing API in ihre eigenen Apps einzubinden. Die Anwendung funktioniert lokal und benötigt daher keine Internetverbindung (The Verge).

Wir haben die oben genannten Features in der Redaktion Sozioinformatik getestet, um eine genauere Vorstellung davon zu bekommen, wie gut die Anwendungen funktionieren. Insgesamt haben wir acht verschiedene Hochsprachen (Arabisch, Chinesisch, Deutsch, Englisch, Französisch, Niederländisch, Spanisch und Türkisch) ausprobiert. 

Positiv anzumerken, bei der Anwendung Automatisches Transkribieren, ist das Herausfiltern von Hintergrundgeräuschen. Bei einem Gespräch mit Musik und anderen Menschen im Hintergrund wurden nur die Worte des Gesprächspartners transkribiert. Es lassen sich mit der Anwendung auch Videoaufnahmen transkribieren, wenn die Aufnahme deutlich besprochen wurde. Jedoch stößt die Anwendung bei Liedern an ihre Grenzen, da die Musik im Gesamten als Hintergrundgeräusch eingestuft und so der Liedtext nicht separat erkannt wird. Der Sprachfilter für vulgäre Sprache funktioniert gut und zensiert entsprechende Wörter mit Sternen nach dem Anfangsbuchstaben. 

Die Anwendung zur Audioverstärkung funktioniert ebenfalls sehr gut. Auch hier werden Hintergrundgeräusche wirksam herausgefiltert, sodass Gesprochenes klar und deutlich zu verstehen ist. Allerdings werden auch leise Nebengeräusche, die nahe am Mikrofon entstehen, ebenfalls verstärkt. Dies kann sich mitunter irritierend auswirken.

Beim automatischen Transkribieren von Gesprächen kommt natürlich die Frage des Datenschutzes auf. Google versichert, die Audiodateien weder lokal noch auf Servern aufzubewahren. Weiterhin würden keinerlei Daten gespeichert oder verwendet, um den Algorithmus zu verbessern. Ferner sei es nicht möglich, den Text der Transkription auf dem Smartphone zu speichern. Ein solcher Angriff auf die Privatsphäre der Sprecher wäre ohnehin nicht mit dem Recht auf informationelle Selbstbestimmung vereinbar.

Trotz aller (oft durchaus berechtigten) Kritik an Google kommen wir zu einem positiven Ergebnis. Mit den neuen Apps können sich Gehörlose und Schwerhörige einfacher in den Alltag integrieren und Veranstaltungen oder Vorträgen beiwohnen, die nicht barrierefrei gestaltet sind. Maßnahmen für die Erweiterung der Barrierefreiheit sind oft sehr kostspielig und aufwändig umzusetzen. Eine kostenfreie App für Smartphones ist hier ein effektives Mittel, um einen Beitrag für die Inklusion von Minderheiten in unsere Gesellschaft zu leisten.

Dieser Überblick wurde verfasst von Yasmina Adams, Elrike van den Heuvel, Shun-Jie Yan und Johannes Korz aus unserer „Redaktion Sozioinformatik“. Vielen Dank! Sie erreichen die Autoren unter redaktion.sozioinformatik@cs.uni-kl.de.

GI-MELDUNGEN

GI-Präsident zur Diskussion um nationale Sicherheit versus Handelspolitik (Deutschlandfunk, 12 min). Im Wettbewerb um die 5G-Lizenzen gibt es viele Stimmen – und viel Geld zu verdienen. Hier wägen derzeit Regierungen, Sicherheitsbehörden Unternehmen und Wissenschaftler ab, wer warum zum Zuge kommen soll und darf – und wer eventuell nicht. GI-Präsident Federrath weist darauf hin, dass eine nationale oder zumindest europäische Unabhängigkeit von den großen Wirtschaftsmächten wünschenswert ist.  weiterlesen

Neue Fachgruppe Digital Health. In der GI werden sich künftig Fachleute mit dem Einsatz von IT im Gesundheitswesen und der Medizin beschäftigen. Die neue Gruppe will Interessierten aus Informatik, Medizin und Wirtschaft eine Plattform zum Austausch bieten und freut sich auf und über engagierte Mitglieder.  weiterlesen

Pflichtfach Informatik in Niedersachen. Dass Kinder möglichst früh an die Informatik herangeführt werden sollen, ist mittlerweile Konsens. GI-Präsidiumsmitglied Ira Diethelm führt aus, warum sie ein Pflichtfach Informatik in Niedersachsen für notwendig hält.  weiterlesen

FUNDSTÜCK

Wie funktioniert eigentlich Sprachsynthese? Passend zum Thema im Fokus, in dem es in dieser Ausgabe darum ging, Sprache zu transkribieren (Speech-to-Text), zeigt unser Fundstück, wie ein Rechner Sprache künstlich erzeugen kann (Text-to-Speech). Auf der verlinkten Webseite können Sie im Browser mit einem Modell des menschlichen Sprachapparats interagieren. Daraus wird dann das passende Audiosignal erzeugt. Wenn Sie den Mitmenschen in Ihrer Umgebung einen Gefallen tun wollen, stecken Sie vorher Kopfhörer an.   Zur Webseite (dood.al, engl.)

Dieses Fundstück hat Martin Müller vorgeschlagen. Vielen Dank! Welches Fundstück hat Sie zuletzt inspiriert? Senden Sie uns Ihre Ideen!

 

Dies war Ausgabe 234 des GI-Radars. Zusammengestellt hat sie Dominik Herrmann, dessen Rechner bei der Erstellung dieses GI-Radars unfreiwillig einen ganzen Flur mit einem lauten „gaa–gaa“ beschallt hat. Die GI-Mitteilungen hat wie immer GI-Geschäftsführerin Cornelia Winter zusammengetragen. Das nächste GI-Radar erscheint am 22. März 2019.

Im GI-Radar berichten wir alle zwei Wochen über ausgewählte Informatik-Themen. Wir sind sehr an Ihrer Meinung interessiert. Für Anregungen und Kritik haben wir ein offenes Ohr, entweder per E-Mail (redaktion@gi-radar.de) oder über das Feedback-Formular bei SurveyMonkey. Links und Texte können Sie uns auch über Twitter (@informatikradar) oder Facebook zukommen lassen.