Künstliche Intelligenz in der Veranstaltungstechnik
KI im Einsatz: von Personentracking bis Content-Optimierung
von Martina Courth,
Künstliche Intelligenz nimmt schleichend Einzug in den Alltag der Veranstaltungswirtschaft. Ob generative KI für die Content-Optimierung oder Computer Vision AI für Personentracking ohne funkbasierte Tracker, Neumann & Müller Digital Media erklären, wie sie ihre Prozesse optimieren.
In einer neuen Reihe zeigen wir Beispiele, wo KI bereits aktiv im Einsatz ist. Den Start macht Steffen Fröhlich, Producer bei Neumann & Müller Digital Media.
Anzeige
Wie heißt das KI-Tool, das ihr nutzt, und zu welchem Zweck wird es eingesetzt?
Die von uns im Einsatz befindlichen KI-Tools lassen sich im Großen und Ganzen in zwei Kategorien einteilen:
Generative KI
Das, was in den letzten 12+ Monaten als KI durch die Medien gegangen ist, ist nicht komplett neu. Aber mit der Welle des Zugangs für eine breite Öffentlichkeit, gestartet durch OpenAI, sind die enormen Fortschritte sichtbar, und durch die gestiegenen Zugriffe auf die Modelle auch noch besser geworden. Bei Neumann & Müller Digital Media arbeiten wir mit den Large Language Modellen (LLM) von OpenAI, besonders im Bereich der Programmierung. LLMs glänzen in Sprachen, die klaren Regeln folgen. Auch wenn unsere Grammatik den Modellen ausreicht, sind die wesentlich regelgebundeneren Programmiersprachen (JavaScript, HTML, Python etc.) ebenfalls in den LLMs eingebunden und liefern erstaunliche Ergebnisse. Ähnlich wie bei Fließtext-Generierung ist dies noch ein iterativer Prozess, in dem die Prompts optimiert werden müssen. Aber auch die KI nimmt durch Fehlerspiegelung Anpassungen vor. Am Ende muss ein:e Programmierer:in natürlich noch mal Hand anlegen. Jedoch ist es nicht so, dass wir hier Programmierer:innen durch Prompter ersetzen können: Durch die individuellen Anforderungen der Kunden an die Exponate, Showelemente und Anwendungen können wir in der Programmierung nur für simplere Teilabschnitte des Codes auf LLMs zurückgreifen.
Neben LLMs arbeiten wir auch mit bildgebender KI (Midjourney, DALLE etc.). Anwendung finden die Modelle primär in Konzeptphasen, um für die Content-Erstellung Moodboards zu entwickeln, anstatt Google oder Stockfotos einzubinden. So können wir Kunden individuellere Eindrücke vom später entstehenden Motion-/Grafikdesign bieten.
Als letzte Säule im Bereich der generativen KI arbeiten wir mit „unterstützenden“ Modellen. Besonders im Bereich der Content-Optimierung sind die Tools hier zum alltäglichen Begleiter geworden. Neben den z.B. in der Adobe Creative Suite bereits integrierten Modellen arbeiten wir mit weiteren Drittanbieter-Tools zur Optimierung von bestehendem Content. So können wir beispielsweise bestehende Videoclips eines Kunden mit einer FullHD-Auflösung bei 30 Bildern pro Sekunde auf 4K mit 60 fps interpolieren und so in hochwertigere Produktionen einbinden – ohne auffallende Qualitätsunterschiede innerhalb des neuen Werks. Neben Videos sind aber auch Audiospuren, die z.B. durch Hall, Rauschen o.ä. nicht dem Qualitätsstandard entsprechen, sehr gut mit KI-Tools optimierbar. Ebenfalls täglicher Begleiter sind Speech-to-Text-Modelle, die wir im Alltag zur Erstellung von Untertiteln nutzen.
Computer Vision AI
Auch hier ist die Technologie nicht brandneu, sondern entspringt aus dem Unterbereich der Künstlichen Intelligenz, dem Machine-Learning. Selbstangelernte Modelle haben wir bereits 2015 innerhalb eines Projektes genutzt, um Objekte zu erkennen, aber auch hier ist durch die rapide Entwicklung innerhalb des letzten Jahres extrem viel passiert; besonders im Bereich des Personentrackings im dreidimensionalen Raum durch stereoskopische Kameras. Diese Technologie erlaubt es uns ohne funkbasierte Tracker an den Personen, diese im Raum zu tracken und die Positionsdaten durch verschiedene Systeme verwerten zu lassen; beispielsweise um klassische Followspots automatisiert zu steuern oder im Gewerk Ton direktionales Audio zu ermöglichen, um immersivere Erlebnisse zu erschaffen oder Lautsprecherwege automatisiert zu steuern.
Im Bereich Video können mithilfe der Positionsdaten, bspw. auf LED-Rücksetzern, Informationen oder auch Augmented-Reality-Elemente im Raum sich relativ zu Akteur:innen auf der Bühne verhalten. Hard-/Softwareseitig kooperieren wir hier mit dem französischen Hersteller Naostage, die hardwareseitig eine auf die Veranstaltungstechnik zugeschnittene Lösung anbieten. Daneben arbeiten wir aber auch mit stereoskopischen Kameras aus dem industriellen Sektor. In beiden Fällen werden die KI-Modelle hinter der Personenerkennung immer weiter optimiert und entwickeln sich merkbar stetig weiter.
Welche Arbeits-, Zeit- und/oder Kostenersparnis entsteht durch den Einsatz des KI-Tools?
Generell helfen uns die bildgebenden Modelle dabei, unsere Ideen und die unserer Kunden schneller in eine sehr individuelle, greifbare Form zu bringen. Das beschleunigt den kreativen Prozess besonders bei Projekten mit wenig Vorlaufzeit, ermöglicht aber auch durch den geringeren Aufwand kleiner budgetierten Projekten den Zugriff auf Vorvisualisierungen und andere Dienstleistungen. Das gleiche gilt für Untertitelungen.
Im Alltag kann man abschließend sagen, sind es eher helfende Hände als Personalersatz. Der Nutzen, der primär aus den von uns eingesetzten Tools gezogen wird, ist Zugänglichkeit und Effizienz.
Könnt ihr euch vorstellen, wie eine Weiterentwicklung der Tools oder anderer KI-Anwendungen für diesen Einsatzzweck in der Zukunft noch mehr Vorteile schaffen könnte?
Wir beobachten die Entwicklung im Sektor KI schon lange, und seit der Erstveröffentlichung von ChatGPT und dem resultierendem „Boom“ Ende 2022 sehr engmaschig. Die Entwicklungen nach dem hohen Einstiegslevel sind konstant, aber kleinschrittig, jedoch nicht marginal.
Es wird nicht die eine Lösung auf den Markt kommen, die alles verändern wird, besonders nicht in dem hochindividualisierten Veranstaltungsmarkt, in dem wir uns befinden. Jedoch werden die kleinen Iterationsschritte der verschiedenen Tools uns in allen Bereichen in die Zukunft begleiten.
KI als Kampfbegriff hat die Halbwertszeit von dem zuvor beherrschenden LinkedIn-Buzzword „Metaverse“ weit überschritten und sich weit tiefer integriert. Auch wenn die Uto- und Dystopien rund um das Thema Quatsch sind, wird sich mit der Weiterentwicklung der Modelle und Erschließung neuer Bereiche KI langsamer, aber auch unbemerkter als prophezeit in unseren Arbeitsalltag integrieren.
Steffen Fröhlich, Producer bei Neumann & Müller Digital Media