音声・ビデオ通話のデータをクラウドサービスと簡単に連携できる「Media Pipeline Factory」を提供開始

プレスリリース発表元企業:NTTコミュニケーションズ株式会社

配信日時: 2019-01-23 11:00:00


NTTコミュニケーションズ(以下 NTT Com)は、「Enterprise Cloud WebRTC Platform SkyWay(以下 SkyWay)」の音声・映像データを音声認識AIや機械翻訳AI、ライブ配信などのさまざまなクラウドサービスとリアルタイムで連携できるSkyWay簡単機能拡張キット「Media Pipeline Factory(以下 本キット)」を開発しました。2019年1月23日より、無料トライアルの提供を開始します。

1.背景
近年、特に音声認識、機械翻訳、画像認識などの分野において、クラウド上でAI機能を提供するサービスが登場しています。しかし、WebRTC※1により音声・映像データを、それらのクラウドサービスに送信してAI機能と連携させるためには、個別のシステム開発が必要になるなど、多大なコストが生じる課題がありました。

2.概要
今回、NTT ComはSkyWay※2の音声・映像データを、対話型自然言語解析AIエンジン「"COTOHA Virtual Assistant"」(以下 COTOHA VA)※3をはじめとする、さまざまなAIやクラウドサービスと自由に組み合わせることが可能なキットの提供を開始します。WebRTCの機能拡張を容易にし、音声・映像データの活用領域を拡大させることで、お客さまのデジタルトランスフォーメーション(DX)を加速させます。

SkyWay簡単機能拡張キット「Media Pipeline Factory」のイメージ
画像1: https://www.atpress.ne.jp/releases/175585/img_175585_1.jpg

3.本キットの特徴
本キットは、以下の3つの特徴を備えます。

(1)多用途な活用が可能
本キットにより、SkyWayで送信した音声・映像データと多様なクラウドサービスを組み合わせ、さまざまな業界や利用シーンでDXを実現できる機能を提供します。
<代表的なユースケース>
・AIサービスとの組み合わせによる、音声認識、機械翻訳、画像認識機能の提供
・ストレージサービスとの組み合わせによる、録音録画機能の提供
・SIPサーバーとの組み合わせによる、VoIPとの相互通話機能の提供
・スタジアムWi-FiやCDNとの組み合わせによる、低遅延ライブ配信機能の提供

(2)素早い開発が可能
グラフィカルユーザーインターフェース(GUI)上でコンポーネントを並び替えることにより、シンプルな処理の開発であれば、プログラミングが不要となります。
また、コンポーネントに分割されたマイクロサービスアーキテクチャを採用しており、複雑な処理を伴う開発の際も、高いアジリティと柔軟性を実現します。
画像2: https://www.atpress.ne.jp/releases/175585/img_175585_6.jpg
さらに、各コンポーネントのオーケストレーション基盤も合わせて提供し、ログやサービスの状態を一元管理することが可能となります。これにより、デバッグが容易になり、開発効率の向上を実現します。

(3)スケーラブルな対応が可能
サーバレス・アーキテクチャを採用しており、一度に大量のアクセスが発生した場合や、アクセスの急増に対しても、安定した機能提供を実現します。

4.無料トライアルについて
2019年1月23日より、録音、音声認識、機械翻訳の各機能をプログラミングすることなく利用可能な6種類のビルトインコンポーネントを、無料トライアルとして提供します[別紙]。
申し込み方法などの詳細につきましては申込みWebサイト( https://webrtc.ecl.ntt.com/m-pipe/ )をご参照ください。

5.今後について
今後も継続してビルトインコンポーネントの開発を行い、録画、画像認識、低遅延ライブ配信などの機能を提供していく予定です。また、機能拡張とともに、さまざまなお客さまとの共同実験を順次開始し、ユースケースを拡大してまいります。

6.導入事例
株式会社レアジョブ(以下 レアジョブ)とNTT Comは本キットを活用して、オンライン英会話レッスンにおける英会話習熟度に関する実証実験(以下 本実験)を実施します。レアジョブでは、受講者の英会話習熟度の可視化に取り組んでいますが、自社システムで大量のオンライン英会話レッスンの音声データを保持し、分析を繰り返していくには限界があるなど、可視化を進めていくには課題がいくつかありました。
本実験では、オンライン英会話の音声データを、本キットによって連携されたストレージサービスに蓄積し、レアジョブの発話解析AIシステムによって分析することで、レッスン中に使用した語彙数の分析による受講者の習熟度の見える化などを実現します。
今後、受講者のフィードバックなどを得ながら、サービス品質を強化し、学習意欲向上をサポートすることを目指してさらなる検証を行います。

<発話解析AIシステムによる分析結果(開発中のイメージとなります)>
画像3: https://www.atpress.ne.jp/releases/175585/img_175585_3.jpg



※1:WebRTCはWeb Real-Time Communicationの略で、HTML5仕様の一部として、W3C、IETFによって標準化されたリアルタイムコミュニケーション機能を実現するための技術仕様です。パソコンやスマートフォンのブラウザやネイティブアプリで、サーバーを介さないP2Pのリアルタイム通信(音声・データ)を実現します。

※2: SkyWayは、パソコン、スマートフォン、タブレット、IoT機器などの端末間で、WebRTCを使った音声・ビデオ通話に必要なサーバー群をNTT Comが運用し、ソフトウェア開発環境をお客さまに提供するサービスです。現在、オンラインによる英会話、診療、通訳、遠隔作業支援や、コンタクトセンタ、低遅延ライブ配信などのサービス提供者に広く利用されています。

※3:NTT Comが提供する、日本語での対話が可能なAIエンジンです。NTTグループが40年以上にわたって蓄積・精錬した日本語辞書とAI関連技術「corevo(R) (コレボ)」とNTT Comが独自開発した自然言語解析技術により、的確な日本語の理解による自然な対話を実現しています。また、対話だけでなく、業務システムと連携して自動で処理を行うことも可能です。
画像4: https://www.atpress.ne.jp/releases/175585/img_175585_4.jpg

「corevo(R)」は、日本電信電話株式会社の登録商標です。 http://www.ntt.co.jp/corevo/
画像5: https://www.atpress.ne.jp/releases/175585/img_175585_5.jpg

* 記載されている会社名、製品名やサービス名は各社の登録商標または商標です。

■関連リンク
・Enterprise Cloud WebRTC Platform SkyWay ポータルサイト
https://webrtc.ecl.ntt.com/
・アプリやWebサイトにリアルタイムコミュニケーション機能を即日実装できる「Enterprise Cloud WebRTC Platform SkyWay」の提供を開始(2017年9月)
https://www.ntt.com/about-us/press-releases/news/article/2017/0907_2.html



詳細はこちら
プレスリリース提供元:@Press