Können veraltete Webview2-Versionen und instabile Treiber zu Microsoft Teams-Videoproblemen bei einem Benutzer führen? Eine Geschichte, wie wir einem Kunden geholfen haben, die Ursache für ein hartnäckiges Problem herauszufinden!

Ein hartnäckiges Problem – Wo soll ich anfangen?

Wir erhalten oft Fragen zu frustrierenden Problemen, die Benutzer während Teams-Anrufen haben und die Administratoren nicht lösen können. Selbst mit Admin-Tools und Microsoft Insights für Teams-Administratoren können Probleme schwer zu diagnostizieren sein. Denn sie können von jedem der vielen beweglichen Teile verursacht werden, die die Benutzererfahrung bei Teams-Anrufen ausmachen. Der folgende Fall ist ein Beispiel für ein interessantes und schwer zu diagnostizierendes Teams-Anrufproblem. Er umfasst mehrere Variablen und verdeutlicht die Komplexität der Fehlersuche bei mehreren Faktoren, die die Qualität von Teams-Anrufen beeinträchtigen können.

Entlarvung des Täters

Das Problem:

Ein Kunde wandte sich an uns und bat uns um Hilfe bei der Untersuchung eines sehr schwierigen Themas, das ihn beunruhigt hatte. Eine wachsende Zahl seiner Benutzer hatte regelmäßig Probleme mit eingehenden Videos oder Bildschirmfreigaben, die bei Anrufen nicht funktionierten. Anstatt den anderen Teilnehmer oder den Bildschirm zu sehen, war nur ein dunkler Bildschirm zu sehen. Das Problem löste sich oft nach einigen Minuten von selbst, war aber dennoch ärgerlich und störend. Da es viele Faktoren gibt, die das Problem verursachen können, erwies es sich als eine ziemliche Herausforderung, es zu analysieren. Da immer mehr Benutzer dieses Problem meldeten, wurde es auch schnell zu einem großen Problem.

Der Kunde fragte uns daher, ob wir ihm mit Hilfe von TrueDEM helfen könnten, die Ursache zu identifizieren und eine Lösung zu finden.

Fangen wir an: Finden Sie die Gemeinsamkeiten

Das gemeldete Problem trat nicht nur bei einem einzelnen Benutzer auf, sondern bei mehreren, was ein Hinweis darauf sein kann. Was haben diese Benutzer gemeinsam, was die Ursache sein könnte? Dies war leicht zu beantworten, da der Kunde erwähnte, dass er neue Hardware (Laptops) einführte. Die meisten der betroffenen Benutzer benutzten den neuen Gerätetyp. Daher war es ein logischer erster Schritt, zunächst zu untersuchen, was bei problematischen Anrufen auf einem solchen Gerät passierte.

Das Problem trat ausschließlich bei den eingehenden visuellen Streams auf (Video & Bildschirmfreigabe), daher wären GPU- und Rendering-Fähigkeiten wichtig. Etwas, das von der Grafikkarte gehandhabt wird und verschiedene webview2-Prozesse wie Renderer und GPU erfordert.

Wir haben einen zufälligen Anruf von einem der betroffenen Benutzer ausgewählt, und das Folgende hat sofort unsere Aufmerksamkeit erregt:

Erster Anhaltspunkt – Laufende Prozesse

Während des Anrufs liefen nicht ein, sondern zwei webview2 Prozesse mit zwei völlig unterschiedlichen Versionen. Version 135.0.3179 war zu diesem Zeitpunkt die Evergreen-Version und wurde vom Teams-Client verwendet. Das können Sie daran erkennen, dass es sich um den webview2-Prozess handelt, der während des gesamten Anrufs durchgehend verwendet wird. Aber offenbar lief auf dem Gerät des Benutzers eine andere Anwendung, die eine ältere Version verwendete, nämlich 122.0.2365. Die Anzeige einer veralteten Version deutet darauf hin, dass die aufrufende Anwendung nicht für die Verwendung der neuesten Webview2-Version programmiert war. Stattdessen verwendete sie eine statische Version von Webview2, die direkt in diese Anwendung integriert war.
Wie in der folgenden Abbildung zu sehen ist, verwendete diese andere Anwendung 7 Minuten lang (14:25 – 14:32 Uhr) Webview2-Ressourcen mit dem höchsten Speicherbedarf.

Könnte dies das Problem sein?

Wir wussten nicht genau, wann das Problem aufgetreten war, da der Benutzer dies nicht gemeldet hatte. Also überprüften wir, ob die Ausführung dieses veralteten Webview2-Prozesses mit etwas in dem Aufruf zusammenfiel, das auf die Probleme hinweisen könnte. Wir brauchten nicht lange zu suchen. Zur gleichen Zeit, als dieser Prozess lief, begannen die „Eingehenden Videoframes“ deutlich zu sinken. An einem Punkt gingen sie sogar fast auf Null zurück. Sowohl für Video als auch für videobasierte Bildschirmfreigaben (siehe die beiden Bilder unten). Ein sehr guter Indikator für ein ernsthaftes Problem!

Was ist mit der Darstellung des Benutzers los?

Aber ist das eine Erklärung für unser Problem? Nicht unbedingt… Wenn mehrere Anwendungen laufen, führt jede ihre eigene isolierte Webview2-Prozessgruppe aus, die unterschiedliche Versionen verwenden kann. Theoretisch sollte dies allein also nicht die Ursache für die Blackouts beim Aufruf von Teams sein. Wir mussten tiefer graben.

Der nächste Schritt war ein Blick auf die grafische Verarbeitungseinheit (GPU). Jede Anwendung verwendet ihre eigenen Webview2-Prozesse, aber sie verwenden dennoch dieselbe GPU und denselben GPU-Treiber, wenn sie Rendering-Aufgaben damit ausführen. Wenn mehrere Webview2-Anwendungen um die GPU- und Treiberressourcen konkurrieren, kann dies zu einer Überlastung führen, die als GPU-Contention bezeichnet wird. Bei einer umfangreichen Webview2-Anwendung wie Teams, die gleichzeitig mit einem anderen umfangreichen Webview2-Prozess läuft, kann GPU-Contention durchaus ein Faktor sein. Wenn die GPU-Konkurrenz so groß wird, dass der Treiber nicht mehr reagiert, könnte das Betriebssystem einen Neustart des GPU-Treibers erzwingen, so dass dieser vorübergehend nicht mehr verfügbar ist. Dies würde definitiv einen Blackout des Teams-Videostreams erklären.

Der nächste logische Schritt bestand also darin, zu überprüfen, ob der Grafikprozessor während der Probleme tatsächlich in dem Teams-Aufruf verwendet wurde und wenn ja, welche Treiberversion installiert war.

Das Gerät des Benutzers war ein NVIDIA RTX 1000 Ada Generation Laptop mit dem Treiber v32.0.15.7216 und alle Aufrufe, bei denen der Blackout auftrat, zeigten an, dass h264 Hardware-Decodierung verwendet wurde. Dies bestätigte, dass die physische GPU während des Aufrufs verwendet wurde und dass es interessant sein könnte, die GPU genauer zu untersuchen.

Die Insights in Echtzeit zeigten auch, dass die GPU den h264 hw Codec für die Dekodierung verwendete, anstatt des weitaus besseren AV1 Codecs, den dieses brandneue Gerät mit der NVIDIA-Karte unterstützen sollte.

Wir kommen der Sache näher… Der letzte Anhaltspunkt

Die Tatsache, dass der GPU-Treiber nicht den AV1-Codec verwendete, war ein guter Hinweis darauf, dass der Treiber des NVIDIA-Chipsatzes veraltet sein könnte. Bei der Überprüfung der anderen Anrufe, in denen Benutzer über Teams-Videoprobleme berichteten, konnten wir dieselben Ergebnisse feststellen, so dass sich ein klares Muster ergab.

Jetzt haben wir alle relevanten Informationen beisammen, lassen Sie uns schauen, was wir damit tun können.

Die Punkte zusammenfügen – Ergebnisse und Empfehlungen

Anhand der Ergebnisse konnten wir Folgendes feststellen: Während der Teams-Anrufe, in denen die Benutzer die Probleme mit dem plötzlichen Schwarzwerden der eingehenden Videos und der Bildschirmfreigabe meldeten, sehen wir eine andere App, die eine ältere Version des Webview2-Prozesses verwendet, etwa zu der Zeit, als die Benutzer von den Problemen berichteten. Wir sehen auch, dass die GPU den weniger optimalen h264 hw Codec anstelle des unterstützten und bevorzugten AV1 Codecs verwendet.

Untersuchungen in öffentlichen Foren haben ergeben, dass andere Personen ähnliche Fälle gemeldet haben, insbesondere bei Kombinationen von Webview2-Versionen unter Version 130.x und veralteten NVIDIA-Treibern.

Die nächsten Schritte:

Nach der Übergabe unserer Ergebnisse gab es nun zwei klare Verdächtige für das Problem und zwei mögliche Lösungen, die der Kunde erkunden konnte:

  1. Möglicherweise ein Problem mit einem veralteten Treiber: Prüfen Sie zunächst, ob der NVIDIA-Treiber auf dem neuesten Stand ist, und wenn nicht: Aktualisieren Sie ihn.
  2. Mögliches Problem mit GPU-Konkurrenz: Identifizieren Sie die andere Anwendung, die die statische Webview2-Version verwendet hat, und prüfen Sie, ob sie auf eine aktuellere Webview2-Version aktualisiert werden kann.

Der erste Punkt war ganz einfach und wurde vom Kundenteam fast sofort in Angriff genommen. Die NVIDIA-Treiber auf den Geräten waren in der Tat veraltet und wurden anschließend auf die richtige Version gebracht. Die Identifizierung der anderen App war ebenfalls kein Problem, aber wie bei jeder Software in einem Unternehmen wäre eine Aktualisierung möglicherweise eine komplexere Aktion, da sie eine angemessene Planung und Bereitstellung erfordert.

Glücklicherweise führte das NVIDIA-Treiber-Update bereits zu einem sofortigen Rückgang der von Teams gemeldeten Videoprobleme. Das beweist, dass das Problem tatsächlich ein Treiberproblem war.

Wie TrueDEM geholfen hat, die Lösung zu finden

Durch die Nutzung von retrospektiven Einblicken und Echtzeitdaten gab uns TrueDEM einen minutengenauen Einblick in die betroffenen Anrufe. So konnten wir entscheidende Faktoren ausfindig machen, die zuvor verborgen waren, z. B. die Verwendung eines veralteten Webview2-Prozesses in einer anderen Anwendung und die spezifischen Kodierungs-/Dekodierungscodecs, die bei den Aufrufen verwendet wurden. Diese kritischen Hinweise führten schließlich zu den eigentlichen Ursachen: ein veralteter Treiber und/oder GPU-Konkurrenz.

Mit dieser neu gewonnenen Klarheit war TrueDEM in der Lage, dem Kunden klare Insights und einen direkten Weg zur Lösung zu bieten. Ein Weg, der es ihnen ermöglichte, das Problem proaktiv für jeden Benutzer zu beheben, der das neue Gerät hatte oder bekommen sollte, und zukünftige Vorfälle zu reduzieren.