2025.12.22

Qlean Dataset、「日本語・2話者・ファッション・美容テーマトーク音声コーパスデータセット」を提供開始

〜GENIAC採択企業のVisual Bank、ファッション・美容領域の対話音声データで音声認識・対話理解AIの高度化を支援〜

Visual Bank株式会社(東京都港区、代表取締役CEO 永井真之、以下「Visual Bank」)は、傘下の株式会社アマナイメージズを通じて展開するAI学習用データソリューション『Qlean Dataset(キュリンデータセット)』において、『日本語・2話者・ファッション・美容テーマトーク音声コーパスデータセット』の提供を開始しました。

本データセットは、20代〜50代の男女2名が、ファッションや美容をテーマに意見を交わす日本語の対話音声を収録したものです。Qlean Datasetが展開する機械学習用データセットラインナップ「AIデータレシピ」の一つとして提供され、音声認識(ASR)や対話理解など、音声対話AIの研究・開発に活用できます。
収録音声では、メイクやコーディネート、アイテム選び、流行といった具体的な話題を取り上げ、感想の共有やアドバイス、経験談を交えながら会話が進みます。台本に依存せず、実際の会話に近い自然なテンポで対話が行われている点が特徴です。
また、2話者による発話の切り替わりや相互応答、話題の移り変わりを含む構成となっており、日常会話に近い条件で収録されています。そのため、実利用環境を想定した音声認識精度や文脈理解性能の検証にも適しています。
本データセットは、ファッション・美容分野におけるユーザー対話を想定したAI開発に加え、研究用途を含む幅広い音声対話AIの開発環境で活用可能な音声コーパスです。

今回提供を開始する「日本語・2話者・ファッション・美容テーマトーク音声コーパスデータセット」の概要

概略

ファッションや美容をテーマに 2名が意見を語り合う日本語対話音声コーパス

データ種別

音声

被写体属性

20代〜50代の男女

データ形式

mp3 / wav

収録時間

計約50時間(1音声約5分〜60分)

音声レート

44.1kHz

対象のシーン

・2名がファッション・美容・スタイル・流行などの話題について語り合うシーン
・メイク・コーディネート・アイテム選びなど、具体的な内容を取り上げながら話す場面
・台本に依存せず、自然なテンポで進む対話
・感想共有、アドバイス、経験談の紹介が行われる会話
・ファッション・美容領域の幅広いテーマが展開される対話シーン

サンプル詳細

https://qleandataset.visual-bank.co.jp/lineup/pn-034

「日本語・2話者・ファッション・美容テーマトーク音声コーパスデータセット」のユースケースイメージ 

【研究用途】 

  • 対話音声における話者交代・応答構造の分析
    音声認識や対話理解の研究において、2話者間の発話交代や相互応答を対象としたモデル評価・検証に活用できます。

  • ドメイン特化対話コーパスを用いたNLP研究
    ファッション・美容分野に特化した語彙や表現を含む対話音声として、言語的特徴分析やドメイン適応研究に利用できます。

 【産業用途】 

  • 音声対話型AIの学習データ
    ファッション・美容関連サービスにおける音声対話AIやチャットボットの音声認識・対話理解モデルの学習データとして活用できます。

  • コールセンター・接客支援AIの対話理解検証
    商品提案やアドバイスを含む自然対話音声として、対話理解精度や応答設計の検証用途に利用できます。

『Qlean Dataset(キュリンデータセット)』について

『Qlean Dataset』は、Visual Bank傘下の株式会社アマナイメージズが提供する商用利用可能なAI学習用データソリューションです。
画像・動画・音声・3D・テキストなど、多様な形式のデータに対応し、研究・商用いずれの用途でも安全に利用できる環境を整備しています。
また、株式会社千葉ロッテマリーンズや株式会社東洋経済新報社をはじめとするデータパートナーとの協業を通じ、業界特化・最新トレンドに即したデータラインナップ『AIデータレシピ』を継続的に拡充しています。
Qlean Datasetは、AI開発現場におけるデータ収集・整備の負荷を軽減し、権利クリアで法的リスクのないAI開発環境の構築を支援します。

▶ Qlean Datasetサイト:https://qleandataset.visual-bank.co.jp/
▶ AIデータレシピ:https://qleandataset.visual-bank.co.jp/lineup

Qlean Datasetの特長

  • すべての被写体から同意取得

  • 既存データは最短1日で納品可能

  • カスタム撮影・収録・収集による独自データ構築にも対応

▶ お問い合わせ:https://qleandataset.visual-bank.co.jp/contact

Visual Bank株式会社

AI開発力を最大化する次世代型データインフラを構築・提供するスタートアップ企業として、「あらゆるデータの可能性を解き放つ」をミッションに掲げ事業活動を展開。漫画家の「もっと描きたい!」をサポートするAI補助ツールを提供する『THE PEN』の他、AI学習用データセット開発サービス『Qlean Dataset(キュリンデータセット)』を提供する株式会社アマナイメージズを100%子会社に持つ。
また、Visual Bankは国の研究開発プログラム「GENIAC」にも採択され、社会実装に向けた取り組みを加速させています。

代表取締役CEO:永井 真之
所在地:〒107-0062 東京都港区南青山7-1-7C-Cube南青山ビル6F
Visual Bank企業URL:https://visual-bank.co.jp/
アマナイメージズ企業URL: https://amanaimages.com/about/

  • 音声データセット

  • 日本語音声コーパス

株式会社アマナイメージズ

Visual Bank株式会社


© amanaimages inc.