パナソニックHD、拡散型視覚言語モデルによるマルチモーダルAI「LaViDa」を開発
配信日時: 2025-11-27 16:20:00
[画像: https://prcdn.freetls.fastly.net/release_image/3442/6511/3442-6511-5c8d6a4e984584ac439831f6367412d4-1600x800.jpg?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
パナソニックR&Dカンパニー オブ アメリカ(以下、PRDCA)およびパナソニック ホールディングス株式会社(以下、パナソニックHD)は、UCLAの研究者らと共同で、拡散モデルを用いたマルチモーダルAI(※)「LaViDa」を開発しました。
近年、マルチモーダルAIは大規模言語モデルの成功を取り入れたモデル大規模化により性能を高めてきましたが、従来の自己回帰型による文章生成では文章量が増えるにつれ、生成時間が増加することが課題でした。今回開発したLaViDaでは、文章の生成を拡散モデルで行うことで生成のスピードを可変にすることが可能になり、既存の自己回帰型手法と同等精度で約2倍の高速化を達成しました。
本技術は、先進性が国際的に認められ、AI・MLのトップカンファレンスであるNeurIPS 2025に採択されました。2025年12月3日から2025年12月5日までアメリカ、サンディエゴで開催される本会議で発表します。
■今後の展望
今回開発したLaViDaは拡散モデルを用いて文章生成を行うマルチモーダルAIです。現在、パナソニックグループでは全社的な業務効率化・自動化を目的としたAIエージェントの導入を進めていますが、各現場に存在する様々な形式のドキュメントや資料は必ずしもAIエージェントにとって理解しやすいものではありません。本手法を用いて統一されたフォーマットに整形することでAIエージェントの導入を加速したいと考えています。
今後もパナソニックHDは、AIの社会実装を加速し、お客様のくらしやしごとの現場へのお役立ちに貢献するAI技術の研究・開発を推進します。
※画像、テキストなど複数の種類の情報を同時に扱えるAIのことを指す
全文は以下プレスリリースをご覧ください。
▼[プレスリリース]パナソニックHD、拡散型視覚言語モデルによるマルチモーダルAI「LaViDa」を開発(2025年11月27日)
https://news.panasonic.com/jp/press/jn251127-2
<関連情報>
・arXiv
https://arxiv.org/abs/2505.16839
・Panasonic×AI ウェブサイト
https://tech-ai.panasonic.com/jp/
・Panasonic×AI X
https://x.com/panasonic_ai
PR TIMESプレスリリース詳細へ
スポンサードリンク
「パナソニックグループ」のプレスリリース
- ナノイーX発生装置が広汽トヨタ自動車の次世代EV「鉑智7」に採用04/28 13:00
- 電動アシスト自転車「ビビ・DX」限定カラー発売のお知らせ04/28 11:00
- 「音声プッシュ通知サービス」で日々のくらしにささやかな変化をもたらす体験をお届け04/27 14:20
- 「パナソニックグループ」のプレスリリースをもっと読む
スポンサードリンク
最新のプレスリリース
- OpenWorldとFigure Technology Solutions、FigureのOPENネットワーク上でOpenWorldの有価証券のトークン化を推進へ05/05 21:57
- 母の日のギフトはPREMIUM「白苺」ショートで決まり!母の日を過ぎたら終売です。京都【パティスリー洛甘舎】05/05 21:00
- オムディア(Omdia)、2035年までにセルラーIoTデータトラフィックが218.6エクサバイトに到達すると新調査で発表05/05 18:10
- コミュニティ発「信長デイトナ」ロゴTシャツ、Amazonで販売開始/多岐にわたる事業を展開する実業家、野村直生氏が装着体験を実施05/05 17:45
- オムディア(Omdia)、中国本土のクラウドインフラ支出が2025年Q4に26%増、AI需要とエージェント拡大が牽引と発表05/05 16:41
- 最新のプレスリリースをもっと見る
