Zusammenarbeit in Unternehmen: Top-Trends 2018

Bobby Beckmann, CTO, Lifesize
Datum: 13. März 2018

Hallo zusammen und willkommen zurück bei einer neuen Folge von Lifesize Live!, der Live-Web-Show, die komplett über die Lifesize-Plattform produziert wird.

Ich bin Ihr Moderator, Julian Fields, und mein heutiger Gast ist unser CTO Bobby Beckmann. Er wird über zukünftige Trends für die Videokonferenztechnik sprechen. Haben Sie Ihre Seherkugel dabei?

Aber immer doch.

Da sind wir gespannt.

Hallo zusammen. Als erstes möchte ich über ein Thema sprechen, das uns hier eigentlich ständig beschäftigt: Welche Rolle wird Künstliche Intelligenz im Konferenzraum spielen? KI wird meistens mit Sci-fi oder Robotern oder irgendwelchen Horrorszenarien assoziiert – dabei ist die Sache in Wirklichkeit viel einfacher. In den meisten Fällen kommt es nicht zu einem Urknall, der dafür sorgt, dass plötzlich überall Künstliche Intelligenz eingesetzt wird. Sondern die Entwicklung verläuft eher stufenweise, wobei kleine Verbesserungen einen Riesenunterschied in unserer Konferenzkultur machen. Das Thema KI lässt sich in zwei Hauptbereiche unterteilen, die sich unterschiedlich in unseren Konferenzräumen auswirken werden. Und zwar zum einen das maschinelle Sehen. Maschinelles Sehen ist ein spannendes Thema, weil es eine Reihe verschiedener Anwendungsszenarien gibt. Ein maschinell sehendes System könnte beispielsweise in Echtzeit Statistiken und Analysen zu sämtlichen Konferenzteilnehmern bereitstellen. Stellen Sie sich etwa einen virtuellen Seminarraum vor, in dem ein Dozent fünfzig Studierende auf einmal unterrichtet. Er kann unmöglich beurteilen, wie engagiert jeder und jede einzelne Anwesende dabei ist. In einem physischen Seminarraum hat man ein Gefühl dafür, wer bei der Sache ist und wer gerade abgelenkt ist, aber virtuell lässt sich das nicht so einfach feststellen. Deswegen wäre es toll, ein System zu haben, das Bilder von allen Anwesenden macht und mir sofort mitteilt, in welcher Stimmung sie sich befinden – fühlen sie sich zufrieden, bedrückt, gelangweilt, verärgert oder etwa zunehmend erregt über irgendetwas, was Sie gerade gesagt haben?

Das ist wie Lächelerkennung.

Stimmt, wie Lächelerkennung. Okay, stellen Sie sich also vor, ich schaue auf meinen Bildschirm und sehe diese fünfzig Leute. Gleichzeitig kann ich hier am rechten Rand in Echtzeit die Stimmung bei dieser Telefon- bzw. Videokonferenz ablesen und ggf. den Tonfall oder die Inhalte meines Vortrags entsprechend anpassen. Alternativ kann ich daraus natürlich auch lernen, mein Verhalten im Umgang mit anderen für die Zukunft zu ändern. Wenn ich zum Beispiel im Vertrieb arbeite und ständig solche Gespräche führe, dann kann ich die Stimmung des Kunden beurteilen und auf der Basis dieser ersten emotionalen Interaktion ermitteln, wie schnell er wohl anbeißt oder wie viel er auszugeben bereit ist, statt ihm blindlings alle möglichen Funktionen verkaufen zu wollen.

Ja, das wäre in der Tat nützlich. Ich könnte zum Beispiel ein Meeting mit meinem Team leiten – na ja, da ist es schön und gut, wenn ich weiß, wie engagiert sie dabei sind. Wenn ich aber ein Gespräch mit einem potenziellen Neukunden führe und aus dieser Information einen klaren Nutzen ziehen könnte, ist das noch einmal etwas vollkommen anderes.

Genau, insofern ergibt sich hier ein knallharter Nutzen und Investitionswert. Dieses Thema wird noch spannend, und soviel ich weiß, gibt es bereits jetzt Funktionen, die solche Ansätze möglich machen. So können Sie Schnappschüsse machen und sie an die großen Cloud-Anbieter schicken und jede Menge Daten darüber erhalten, wer alles auf einem bestimmten Bild zu sehen ist und in welcher Stimmung oder Gefühlslage die einzelnen Personen sich befinden.

Okay.

Außerdem gibt maschinelles Sehen auch Auskunft darüber, was sich jeweils in dem Raum befindet. Die Einrichtung digitaler Whiteboard-Kameras mit separaten Datenaustauschverfahren ist mit ziemlichem Aufwand verbunden. Wenn man aber einfach ein paar Kameras hat, die mit maschinellen Sehfunktionen ausgestattet sind, hat man den ganzen Raum im Blick. Ich kann also ans Whiteboard gehen und weiß, dass es kein Problem ist, die Daten zu erfassen und zu bereinigen und daraus eine Präsentation zu machen. Dadurch wird es viel einfacher, Vorträge oder Konferenzen abzuhalten, als wenn man physisch einen Schalter bedienen und die Kameras entsprechend positionieren muss, sodass auf einmal alle, die auf der einen Seite des Raums sitzen, nicht mehr im Bild sind, weil jemand vergessen hat, die Kamera wieder umzustellen. Oder wenn immer dieser Spruch kommt von wegen: „Ich arbeite am Whiteboard, deswegen können Sie gerade nicht sehen, was ich mache.“

Und vermutlich werden die Daten dabei zugleich gespeichert, sodass man sich die Mühe sparen kann, sie abzufotografieren?

Genau, die Daten sind Teil des Meetings, und wenn es aufgezeichnet wird, sind die Daten Teil der Aufzeichnung. Ich finde das echt spannend. Wenn man sich einige der eher esoterischen Geschichten ansieht, die bisher noch nicht so im Mainstream angekommen sind, dann gehört dazu auf jeden Fall die Möglichkeit, die anwesenden Personen auf den ersten Blick identifizieren zu können: Man kommt also in einen Raum und weiß sofort, wer die anderen sind. Stellen Sie sich vor, Sie haben ein Meeting mit zehn anderen Personen, dann können sie alle Anwesenden identifizieren bzw. Sie wissen, wer das Meeting leitet. Ich komme in den Raum und brauche nichts zu tun: Ich werde sofort erkannt, die Kamera erscheint auf meinem Bildschirm und begrüßt mich, und ich kann direkt mit dem Meeting loslegen.

Wir haben viel über Audiokonferenzen gesprochen, wo es immer so läuft: „XY ist gerade dazugekommen“ oder andauernd diese Frage kommt: „Wer ist gerade dazugekommen?“ Das klingt, als ob damit dann Schluss ist und man einfach sofort sehen kann, wer alles bei dem Meeting anwesend ist.

Genau, wenn wir eine Lifesize-Konferenz mit einzelnen Teilnehmern machen, kann man sie auf den ersten Blick identifizieren. Wenn man aber in einen Konferenzraum mit zehn Leuten kommt und nur drei von ihnen kennt, wäre es doch super, wenn man einfach mit dem Mauszeiger über sie fahren könnte und ein paar Informationen zu jeder Person angezeigt bekäme. Dann kann ich sie namentlich identifizieren und sehe vielleicht auch ihr LinkedIn-Profil.

Noch ein neues Tool für den Vertrieb!

Genau – so von wegen: Mit wem habe ich es hier gerade zu tun? Ist das ein Neukunde oder jemand, der mir das Leben schwer macht?

Oder ist vielleicht der CTO unter den Anwesenden und möchte gerne mehr über die coolen Funktionen hören?

Ganz genau. Okay, soviel also zum maschinellen Sehen. Ich bin überzeugt, dass das noch ein wichtiges Thema wird, und einzelne Elemente sind jetzt schon sichtbar. Sie existieren bereits in Echtzeit und müssen nur noch integriert und für die entsprechenden Anwendungsszenarien auf den Markt gebracht werden. Der zweite Hauptbereich, in dem KI zunehmend wichtig wird, ist Spracherkennung und Transkription. Hier hat sich in letzter Zeit eine Menge getan, und die ersten virtuellen Systeme sind bereits im Handel. Alexa & Co. sind uns allen ein Begriff – man erteilt einen Befehl und das System reagiert entsprechend darauf. In der nächsten Welle wird es wahrscheinlich so sein, dass diese Maschinen bei dem gesamten Meeting zuhören. Man lädt sie in das Meeting ein, und sie kommen und hören zu, und zwar horchen sie vor allem auf Aktionen. Das heißt, sie kümmern sich um sämtliche Aktionspunkte. Wenn Sie sagen: „Schickt mir mal bitte diese Präsentation!“, dann versteht das Gerät Ihre Anweisung und leitet die Präsentation an alle Anwesenden weiter.

Ist ja genial.

Es horcht nach Befehlen – wenn wir also zum Beispiel einen kurzen Ausschnitt haben, der besonders interessant ist, kann ich dem Gerät sagen, es soll ihn aufzeichnen oder speichern. Dann wird dieser Teil des Meetings aufgezeichnet, sodass ich mir später nur meine Notizen als Gedächtnisstütze anzuschauen brauche. Es kann mein Meeting auch in Echtzeit transkribieren, sodass man es nach bestimmten Begriffen oder Stichwörtern durchsuchen kann.

Und bestimmt auch entsprechend weiterempfehlen, oder?

Genau.

„Dabei ging es um dieses Thema“ oder „Ihr hattet gerade ein Meeting zu diesem Thema. Hättet ihr Interesse an genaueren Informationen darüber?“

Verstehe. Und sobald man etwas durchsuchen und bestimmten Kategorien zuordnen kann, kann man es analysieren und gründlicher untersuchen, so wie wir es heute bereits mit schriftlichen Texten tun. Damit hat man eine weitere Datenquelle.

Dadurch wird die Produktivität garantiert gesteigert.

Das glaube ich auch. Ich glaube, es wird vieles schlicht vereinfachen und diese Meetings effizienter machen. Schließlich will man nicht an lauter Meetings teilnehmen, die letztlich reine Zeitverschwendung sind. Deswegen ist es super, wenn man in einem Meeting ist und Aktionspunkte erarbeiten kann, sodass man hinterher sagt: „Okay, dieses Meeting hat sich echt gelohnt.“

Es vergibt Bewertungen für einzelne Meetings, die man sich hinterher im Archiv anschauen kann. Mann, ist das cool. Das ist sowas von genial.

Stimmt, da gibt es allerhand coole Dinge, die gar nicht so weit von der Verwirklichung entfernt sind. Ich rede hier nicht von Dingen, die 2025 passieren werden. Das kommt noch in diesem Jahr – 2018.

Ja.

KI ist also eine echt coole Geschichte – aber dabei ist es wichtig, dass auch alles funktioniert. Daher arbeiten wir derzeit verstärkt auf Interoperabilität hin. Viele Nutzer haben brandneue Geräte oder alte Geräte, die supergut funktionieren, und sie wollen ihre Infrastruktur nicht außer Betrieb nehmen, aber sie wollen auch ihre Geräte benutzen können. Und wir haben uns für dieses Jahr vorgenommen, hier massive Fortschritte zu machen. Häufig ist es so, dass Geräte oder Systeme, die ursprünglich mal interoperabel sein sollten, kaum noch miteinander kompatibel sind. Wenn ich Glück habe, brauche ich zehn Minuten, bis alles ordnungsgemäß funktioniert und ich an der Konferenzschaltung teilnehmen kann.

Interoperabilität mit eingeschränktem Funktionsumfang.

Genau, und ich meine, wir wollen an den Punkt kommen, wo es uns zwar am liebsten ist, wenn die Leute Lifesize-Produkte benutzen – wir mögen Lifesize-Produkte nämlich –, aber schließlich gibt es auch andere Produkte, und wenn jemand lieber ein Produkt von einem anderen Anbieter anschließen möchte, dann soll das bitteschön genauso gut funktionieren. Wir wollen, dass Ihr Meeting gut läuft – unabhängig davon, welche Marke Sie benutzen. Und meiner Meinung nach wird das bei jeder Art von Zusammenarbeit wichtig, denn man weiß nie, was für Geräte und Systeme die Leute bei einem gemeinsamen Projekt benutzen wollen. Wenn ich einen zehn Jahre alten Codec habe, jemand anders ein Handy und eine weitere Person gerade im Urlaub ist und dort am Desktop-Computer oder Laptop arbeitet, dann darf das Meeting daran nicht scheitern. Da gibt es so einen coolen Videoausschnitt, wo jemand auf einer Skipiste ist und direkt dasitzt und sich bei dem Meeting dazuschaltet – und es läuft alles super. Deswegen hat die Interoperabilität zwischen sämtlichen Geräten – egal, ob neu oder alt, und egal, was für ein Gerät es ist – hier bei Lifesize einen hohen Stellenwert, und ich glaube, dass wir hier 2018 einiges erreichen werden. Was machen wir sonst so? Na ja, 4K natürlich.

4K ist echt eine einfache Kaufentscheidung – ich kann kaum glauben, dass ich tatsächlich einen 4K-Monitor auf meinem Schreibtisch stehen habe, der gerade mal 500 Dollar gekostet hat. Ich war jahrelang total scharf auf meinen Apple Cinema Display, weil das halt die Königsklasse war, aber jetzt schneidet er im Vergleich plötzlich nicht mehr so gut ab. Dieser Monitor ist sehr viel preisgünstiger, aber er sieht super aus und ich glaube, das Format wird sich überall durchsetzen. 4K ist unser großes Ziel. Wir wollen herausfinden, wie 4K-Präsentationen in 4K mit 4K-Kameras aussehen, denn wenn sich diese Monitoren flächendeckend durchsetzen, wollen die Leute sie auch nutzen. Das ist jedoch nur dann sinnvoll, wenn Quellinhalte in entsprechender Qualität vorhanden sind.

Das heißt, im nächsten Schritt wird dann nicht nur „Face to Face“ kommuniziert, sondern man sieht auch jede einzelne Pore im Gesicht des Gegenübers.

Ganz genau, und manchmal will man das vielleicht gar nicht alles so genau sehen – aber toll ist es trotzdem. Wir haben ein paar Beispiele von Meetings im 4K-Format gesehen, und die kleinen Details machen einen Riesenunterschied. Es werden immer diese Witze gemacht von wegen: „Willst du diese Person wirklich in 4K sehen?“ Aber es ist schon erstaunlich – wenn man den Raum detailgenau und in glasklarer Qualität sieht, dann wird der Kontext, in dem sich der Gesprächspartner befindet, tatsächlich realer. Und zwar sehr viel realer. Die meisten erinnern sich kaum noch daran, wie wir mit HD plötzlich auf einem ganz anderen Niveau waren, weil wir mittlerweile nichts anderes mehr gewöhnt sind – aber jedes Mal, wenn man sich zum Beispiel eine Sequenz aus einem alten Sportvideo anschaut, denkt man: „Huch, das war 2001?“

„Wie haben die seine Fußarbeit überhaupt gesehen?“

„Wie haben die es überhaupt ertragen, ein Spiel in dieser Qualität anzuschauen?“ Und ich glaube, wenn man die ersten Videos im 4K-Format anschaut, ist das halt eine Preisklasse höher und es sieht gut aus – aber 4K-Quellinhalte auf einem 4K-Monitor anzuschauen, das haut einen richtig um. Damit sind wir echt an dem Punkt angelangt, wo das Zuschauererlebnis unbeschreiblich gut wird.

Ich glaube, unsere Zeit ist fast abgelaufen. Vielleicht möchten Sie uns zum Abschied noch etwas mehr darüber verraten, was in diesem Jahr auf uns zukommt.

Ich glaube, viele Unternehmen entwickeln derzeit total coole Produkte, und Lifesize gehört auf jeden Fall dazu. Und ich finde, das Tolle daran ist, dass wir auf diese tollen Produkte gespannt sind und versuchen wollen, sie miteinander kompatibel zu machen. Deswegen glaube ich, dass wir alle zusammen ein gutes Stück vorankommen werden. Es macht Spaß, dabei mitzumachen und zu sehen, was wir 2018 entwickeln können.

Vielen Dank, dass Sie gekommen sind. Wie mir aufgefallen ist, haben Sie nichts davon gesagt, dass Teleportation noch in diesem Jahr möglich wird. So lange müssen wir uns wohl weiterhin mit Videokonferenzen behelfen. In diesem Sinne wünsche ich viel Spaß an den besten Neuheiten, die dieses Jahr auf den Markt kommen.

Daran arbeiten wir übrigens gerade.

Okay, klasse, damit sind wohl die Sondereinheiten beauftragt.

Aber Sie haben recht, das dauert noch.

Vielen Dank an alle. Bis zum nächsten Mal.

Brauchen Sie weitere Hilfe?
Kontaktieren Sie einen unserer Außendienstmitarbeiter.