パナソニックホールディングス株式会社パナソニックHDは、パナソニックR&Dカンパニー・オブ・アメリカおよび カリフォルニア大学ロサンゼルス校 researchers, has unveiled “OmniFlow.” This is a new multimodal generative AI. This new technology allows easy conversion between text, images, and sound. It’s often called “any-to-any” data transformation.
最近、マルチモーダルAIの研究が急速に発展しています。しかし、異なるデータタイプ間を変換するシステムを作るには、多くの場合、大規模で高価なデータセットが必要です。これらのデータセットには、可能なすべてのモダリティのペアが含まれていなければなりません。OmniFlowは、テキストから音声、テキストから画像といったデータ形式ごとに独自の生成モデルを使用することで、この問題を解決します。このアーキテクチャにより、テキスト、音声、画像の正確な変換が可能になります。トライモーダルペアの小さなデータセットを使用します。このアプローチにより、学習データ収集のコストと複雑さを削減します。
技術革新で知られるOmniFlow。AIとコンピュータ・ビジョンの世界的なトップ会議であるCVPR 2025で発表します。この技術は2025年6月11日から6月15日までテネシー州ナッシュビルで展示されます。
こちらもお読みください: Ice3 Design、AIベースのDev Modernizationサービスを開始
OmniFlowは、スマートで低予算のマルチモーダルAIを実現するための大きな飛躍です。この技術を工場や日常生活で使用することで、さまざまな形式で特定のデータが作成されます。これにより、マルチモーダルAIの活用方法が広がります。
パナソニックホールディングス株式会社 社会におけるAIの向上に尽力するHD。今後も研究開発を推進していきます。これにより、消費者のライフスタイルを向上させ、スマートテクノロジーで職場の生産性を高めます。
