ビデオ会議アプリ、マイクをミュートしても音声キャプチャ可能な状態維持
2022年4月17日 17:47
米ウィスコンシン大学などのグループが行った研究によると、デスクトップ版のビデオ会議アプリケーション (VCA) ではマイクをミュートしても音声をキャプチャー可能な状態が維持されているそうだ(ウィスコンシン大学のニュース記事、The Next Web の記事、The Register の記事、論文: PDF)。
研究は被験者募集プラットフォーム Prolific で募集した 223 名を対象にした VCA のミュート機能に対する意識調査と、実際のアプリを用いたミュート時の動作の調査の 2 段階で行われた。対象アプリは Zoom / Slack / Teams / Skype / Google Meet / Cisco Webex / BlueJeans / WhereBy / GoToMeeting / Jitsi Meet / Discord の 11 本。Windows / Linux / macOS でデスクトップアプリ (ネイティブアプリ) が利用可能なものは各 OS 上で実行し、Web アプリは Chromium 上で実行したとのこと。
意識調査ではミュートボタンを押してもアプリがマイクにアクセスしているとの回答が 112 人と半数を超えたが、そうするべきとの回答は 37 人にとどまった。一方、ミュート時の動作では Web アプリがすべてマイクからのデータを完全に切断するようドライバーに指示する「ソフトウェアミュート」を適用したのに対し、デスクトップアプリでは標準の API を使用していないため動作が確認できなかった Windows 上の Teams / Skype を除き、すべてミュート時にもマイクからの音声にアクセス可能で、Webex は継続的に音声をキャプチャーし続けたという。
Webex はミュート状態でもマイクからの音声に関連するとみられる統計情報を含む JSON データをテレメトリーサーバーへ 1 分おきに送信する。データに音声そのものは含まれないものの、単純な音声 (クラシック音楽・調理/食事・会話・犬の鳴き声・キーボードでの入力・掃除) を入力した場合のテレメトリーパケットをニューラルネットワークに学習させた結果、平均 82 % の正確さで音声を特定可能になったそうだ。
マイク音声は OS の設定で無効化できるものの、設定画面にたどり着くまでに手間がかかるため、切り替えながら使用するのには不向きだ。マイクアクセスのパーミッションモデルを信頼できるものにするため、OS が Web アプリと同様の「ソフトウェアミュート」を可能にする API を実装し、VCA が API を使用してミュート・アンミュートを切り替えられるようにすることを研究者は推奨している。