GI-Radar 285: KI und Publizieren

 

Sehr geehrte Leserinnen und Leser,

warum die Nachfrage nach leistungsfähigen Grafikkarten das Angebot bei weitem übersteigt, erfahren Sie in den Kurzmitteilungen dieser Ausgabe. Wie beeinflussen neue KI-Techniken das Publizieren und Produzieren von Texten? Das behandeln wir im Thema im Fokus. In den GI-Meldungen machen wir Sie auf ein neues Arbeitspapier zu Datenschutzerklärungen aufmerksam. Das Fundstück hat etwas mit moderner Kunst zu tun und erklärt, wieso dafür ein großer technischer Aufwand erforderlich ist. 

Wir wünschen Ihnen viel Spaß mit dieser Ausgabe!

auf gi-radar.de weiterlesen

Zukunftsministerium + Mangelware Grafikkarten + Luca-App + Bundes-IT + 50 Jahre FTP + KI und Publizieren + Datenschutzerklärungen erklärt + Informatik Spektrum + INFORMATIK 2021 + KI-Camp online + Moderne Kunst mit NFTs

KURZMITTEILUNGEN

Zukunftsministerium? Eine Polemik (Wirtschaftswoche). Vor jeder Bundestagswahl wird über den Zuschnitt und die Kompetenzen der zukünftigen Ministerien gerätselt und spekuliert. Zukunft und Digitalisierung stehen auf der Beliebtheitsskala der allgegenwärtigen Schlagworte dabei ganz oben. Warum der Staat eher nicht für beides steht, beschreibt Dennis Kenji-Kiper.  weiterlesen

Wie sich Computerspiele und virtuelles Geld gegenseitig das Wasser abgraben (SZ). Derzeit sind Grafikkarten Mangelware. Als erstes fallen einem bei den begehrten Karten wahrscheinlich anspruchsvolle Spiele ein. Doch das ist mittlerweile weit gefehlt: auch für das Schürfen von virtuellem Geld werden Grafikkarten benötigt. Über einen Markt, der nicht mehr hinterherkommt.  weiterlesen

Corona-Warnsysteme: Luca-App unter der Lupe (ZEIT). Die Corona-Warn-App des Bundes ist mit einigen Schwierigkeiten gestartet. Einige Bundesländer setzen nun zusätzlich die Luca-App ein, die die Kontaktnachverfolgung erleichtern soll. Gegen das zentralisierte Betriebsmodell der Luca-App gibt es jedoch erhebliche Bedenken, zumal die Qualität der Software zu wünschen übrig lässt.  weiterlesen

Bundes-IT kommt nicht voran (Spiegel). Allenthalben wird die altmodische Verwaltung beklagt. Deshalb hat das Bundeskabinett bereits vor einigen Jahren ein Programm aufgelegt, durch das die Bundes-IT modernisiert und den Bundesmitarbeiterinnen und -mitarbeitern ein einheitlicher und sicherer Arbeitsplatz angeboten werden sollte. Doch das Projekt stockt noch auf Jahre hinaus.  weiterlesen

FTP: was war das noch mal? (Golem). Für die Älteren unter uns ist FTP ein verständlicher Begriff: File Transfer Protocol. Früher war FTP das Maß der Dinge, wenn Dateien zu übertragen waren. Heute kommen meist andere Protokolle zum Einsatz. Ein Rückblick.  weiterlesen

THEMA IM FOKUS

KI-gestütztes Publizieren und Qualitätsmerkmale von Softwaresystemen - neue Welt trifft alte Welt.

KI-gestützte Textproduktion vom Co-Autorenteam Mensch und Maschine in der Wissenschaft. Das von der OpenAI im März 2020 veröffentlichte Sprachmodell GPT-3, das über eine Exklusivlizenz mit Zugang zum Quellcode in den Händen von Microsoft liegt, basiert auf einer Datengrundlage von 45 Terabyte. Es arbeitet mit 175 Milliarden Parametern, d.h. der zehnfachen Menge im Vergleich zu den bisherigen KI-Sprachmodellen (arxiv.org). Ein Anwendungsgebiet ist u.a. die automatische Generierung von Texten (sueddeutsche.de).

Für Wissenschaftlerinnen, Wissenschaftler und Forschende bieten diese KI-gestützten Werkzeuge aus dem „Natural Language Processing (NLP)“ neue Potenziale bei der Erstellung von Publikationen. Zusätzlich zu den Textgeneratoren aus dem „Natural Language Generation“ bieten bereits sehr niedrigschwellige Übersetzungslösungen wie z.B. „DeepL“ vom gleichnamigen Kölner StartUp vielfältige KI-Funktionalitäten für die Textmodifikation. Werden diese Übersetzungslösungen in Verbindung mit bereits vorhandenen, digital verfügbaren Dokumenten (eigenen oder auch fremden Publikationen) und Rewriting-Tools wie zum Beispiel „Quillbot“ in geschickter Weise kombiniert, entstehen quasi auf „Knopfdruck“ vermeintlich neue Texte (forschung-und-lehre.de).

Qualitäts- und Kontrollverlust in der Wissenschaft bei KI-generierten Texten. „Das wird keiner merken“, so die Medienethikerin Jessica Heesen von der Universität Tübingen, die eine Kennzeichnungspflicht für KI-generierte Texte fordert (riffreporter.de). Heesen weist auf die Gefahr des Kontrollverlustes für die Wissenschaft hin, wenn Sprachmodelle wie das aktuelle GPT-3 oder auch zukünftige Modelle mit Texten trainiert werden, die zuvor von anderen KI-Systemen generiert wurden (riffreporter.de). Dabei ist bekannt, dass die derzeitigen Plagiatserkennungs-Softwarelösungen bereits bei nicht durch KI-Tools generierte Texte unzureichende Textergebnisse aufweisen (arxiv.org) und bei KI-generierten Texten naturgemäß keine Lösung bieten können.

Auf der Suche nach guten Forschungspraktiken für Wissenschaft und Forschung. Wie können die Grundsätze guter Forschungspraktiken im Zeitalter der Künstlichen Intelligenz sichergestellt werden? Einen Orientierungsrahmen bietet der Europäische Verhaltenskodex für Integrität in der Forschung (allea.org). Er orientiert sich an diesen vier Grundwerten: Zuverlässigkeit, Ehrlichkeit, Respekt und Rechenschaftspflicht. Unter diesen vier Grundwerten steht die Zuverlässigkeit als Qualitätsbegriff für das Forschungsergebnis, das auf Basis der Konzeption, des Methodeneinsatzes, der Analyse und der Ressourcennutzung entsteht. Die zunehmende Digitalisierung in diesen Prozessabläufen führt zu einem Bedeutungszuwachs der dort eingesetzten Softwaresystemen. Sie stehen immer mehr im Fokus, wenn es um die Zuverlässigkeit der erzielten Forschungsergebnisse geht.

Der Grundwert der Zuverlässigkeit für Integrität in Wissenschaft und Forschung als Qualitätsmerkmal von Softwaresystemen im Zeitalter künstlicher Intelligenz?  Etymologisch wird Zuverlässigkeit mit den Begriffen Sicherheit und Verlässlichkeit assoziiert und positiv im Sinne der Vertrauensbildung konnotiert. Es geht um das Vertrauen in die neue Ära der KI-gestützten Textproduktion in der Form der Co-Autorenschaft von Mensch und Maschine. Mit Blick auf die Entwicklungen im Robo-Journalismus darf prognostiziert werden, dass der Einsatz von Schreibbots auch in Wissenschaft und Forschung kontinuierlich zunehmen wird. Betrachten wir die von menschlichen Autorinnen und Autoren gesteuerte KI-Textproduktion als ein soziotechnisches „Softwaresystem“, ist der Terminus Zuverlässigkeit über die Norm „System and software quality models“ präzise definiert. In dieser Norm wird die Zuverlässigkeit durch die vier Merkmale Reifegrad, Verfügbarkeit, Fehlertoleranz und Wiederherstellbarkeit charakterisiert. Die Gesamtanalyse dieser vier Merkmale führt zur Frage, ob bzw. wie die Zuverlässigkeit als Qualitätsmerkmal im Zeitalter künstlicher Intelligenzen „neu“ zu interpretieren ist. Nur das Merkmal der Verfügbarkeit erweist sich im digitalen Zeitalter als offensichtlich unkritisch. Die drei anderen Merkmale Fehlertoleranz, Wiederherstellbarkeit und Reifegrad sollen nachfolgend detaillierter untersucht werden.

Die Qualitätsmerkmale Fehlertoleranz und Wiederherstellbarkeit auf dem Prüfstand.  Die Bewertung der Fehlertoleranz setzt voraus, dass der zugrundeliegende Fehlerbegriff geklärt werden kann. Diese Überprüfbarkeit ist in der Regel nicht gegeben, da es sich bei den KI-gestützten Tools der Textgenerierung oder auch der Textmodifikation um „Black Box“-Algorithmen handelt, die zumindest den Endanwenderinnen und Anwendern keinen Einblick in den Prozessablauf gewähren (können). Das Merkmal der Wiederherstellbarkeit basiert auf der Annahme eines definierten Soll-Systemzustands, in den zurückgekehrt werden kann. Algorithmen im Bereich „Natural Language Processing“ produzieren aber Textsequenzen, die Unikate darstellen. Diese Prozesse lassen sich nicht wiederholen. Somit lassen sich auch die Ergebnisse im Sinne eines Prozess-Outputs nicht reproduzieren.

Der Reifegrad als Maßstab für die Leistungsstärke KI-basierter Textgeneratoren. Hierfür könnten neue Benchmarks in Anlehnung an den Turing-Test (mixed.de) entwickelt werden. Wäre diese Voraussetzung gegeben, könnte die Arbeitsumgebung im Sinne eines komplexen und individuell genutzten „Anwendungssystems“ gekennzeichnet und im Rahmen der Forschung und wissenschaftlicher Publikationen ausgewiesen werden. Setzt ein Wissenschaftler oder eine Forscherin im Rahmen der eigenen Tätigkeiten IT-/KI-basierte Werkzeuge ein, so sollte das Gesamtspektrum der genutzten Werkzeuge einsehbar sein, inklusive der Kennzeichnung der einzelnen Werkzeuge mit einem Index für den obigen „Reifegrad“.

Bewusstsein schaffen für den Bedarf neuer Qualitätsmaßstäbe im KI-Zeitalter. Die obigen Ausführungen belegen den strukturellen Misfit des Qualitätsmerkmals Zuverlässigkeit für die KI-gestützte Textproduktion nach den derzeitigen Maßstäben der ISO/IEC 25010. Die größte Herausforderung besteht aber darin, das Bewusstsein für die neuen Formen der Co-Autorenschaft von Mensch und Maschine und der daraus resultierenden disruptiven Veränderungen zu wecken. Selbst der im Jahr 2019 herausgegebene neue Kodex der Deutschen Forschungsgemeinschaft (zenodo.org) unterscheidet „nur“ eigene Beiträge versus Beiträge Dritter und berücksichtigt den Einflussfaktor der Künstlichen Intelligenz bei der Generierung von Texten (noch) nicht. Nicht unerwähnt bleiben sollen die Bemühungen der „High-Level Expert Group on AI“ der EU-Kommission, die sich explizit um allgemeine Merkmale und Kriterien einen vertrauenswürdigen KI bemühen (europa.eu). Aber die Zeit drängt. Ohne wachsendes Problembewusstsein und neue Qualitätsmaßstäbe für die Zuverlässigkeit soziotechnischer KI-Systeme droht die Vertrauensfrage zur gesellschaftlichen Schicksalsfrage zu werden.

Diesen Beitrag hat unsere Leserin Prof. Dr. Doris Weßels (Institut für Wirtschaftsinformatik an der FH Kiel) beigesteuert. Vielen Dank!

GI-MELDUNGEN

Arbeitspapier zu Datenschutzerklärungen. Datenschutzerklärungen sind vielen ein Buch mit sieben Siegeln oder sogar ein Graus. Das gemeinsame Projekt „Digital Autonomy Hub“ von GI und Algorithm Watch hat ein gemeinsames Arbeitspapier dazu veröffentlicht und erläutert Einwilligungserklärungen, Cookies und andere Begriffe rund um das Thema.  weiterlesen

Das neue Informatik Spektrum ist da. Dieses Mal geht es unter anderem um Software Engineering, das E-ID-Gesetz und Informatikunterricht in der Schule. Die Einzelartikel finden sich in der Digitalen Bibliothek, das komplette Heft gibt es zum Herunterladen über den Link.  weiterlesen

INFORMATIK 2021: Einreichungsfrist bis zum 17. Mai verlängert. Die Einreichungsfrist für die Workshops der INFORMATIK 2021 ist bis zum 17. Mai verlängert. Die Übersicht über die einzelnen Workshops mit weiteren Details haben wir verlinkt.  weiterlesen

Virtuelles KI-Camp steht in den Startlöchern. Am 27. April kommen junge KI-Talente mit internationalen Fachleuten auf dem digitalen KI-Camp zusammen. Ausgewählte Programmpunkte, darunter Diskussionsrunden zu transdisziplinären Perspektiven künftiger KI-Forschung, die Auszeichnung der „KI-Newcomerinnen und -Newcomer 2021“ und Keynotes finden ab 10:15 Uhr im Livestream statt.  weiterlesen

 

Kennen Sie eigentlich den GI-Pressespiegel? Dort sammeln wir die Berichterstattung über unsere Fachgesellschaft in Zeitungs-, Radio- und Fernsehbeiträgen. Letzte Woche fand die GI bei heise unter anderem mit dem erfreulichen Zwischenergebnis des Jugendwettbewerb Informatik Erwähnung. Schauen Sie rein, es gibt da immer wieder Neues.

FUNDSTÜCK

NFT, Kunst und Auktionen: der Kunstmarkt wird aufgemischt. Traditionelle Kunstwerke erzielen zunehmend sehr hohe Summen bei Auktionen. Bilder von Monet, van Gogh oder da Vinci bringen durchaus dreistellige Millionenerlöse. Aber digitale Kunst? Ist das Kunst, wenn digitale Bildschnipsel zusammengefügt werden? Kann man doch ganz einfach vervielfältigen – oder doch nicht? NFTs (non-fungible tokens: einzigartige, kryptographische Token) machen die Werke unverwechselbar und erfüllen damit einen der Ansprüche der Kunst: einzigartig zu sein. Wenn Sie also in der Corona-Zeit kreativ werden möchten: nur zu. Wir freuen uns auf Ihre Beispiele.  Zum Fundstück (theguardian.com, engl.)

Welches Fundstück hat Sie zuletzt inspiriert? Senden Sie uns Ihre Ideen!

 

Dies war Ausgabe 285 des GI-Radars. Zusammengestellt hat sie Dominik Herrmann, der darüber nachdenkt, ob das GI-Radar – bei dem schließlich ebenfalls jede Ausgabe einzigartig ist – auch als Kunstform aufgefasst werden könnte. Die Mitteilungen und Meldungen hat GI-Geschäftsführerin Cornelia Winter zusammengetragen. Das nächste GI-Radar erscheint am 7. Mai 2021.

Im GI-Radar berichten wir alle zwei Wochen über ausgewählte Informatik-Themen. Wir sind sehr an Ihrer Meinung interessiert. Für Anregungen und Kritik haben wir ein offenes Ohr, entweder per E-Mail (redaktion@gi-radar.de) oder über das Feedback-Formular bei SurveyMonkey. Links und Texte können Sie uns auch über Twitter (@informatikradar) zukommen lassen.