2025.12.24

Qlean Dataset、「日本語・2話者・コメディテーマトーク音声コーパスデータセット」を提供開始

〜GENIAC採択企業のVisual Bank、2者のリアルな日常会話音声コーパスで音声対話AI・自然言語処理の高度化を支援〜

Visual Bank株式会社(東京都港区、代表取締役CEO 永井真之、以下「Visual Bank」)は、傘下の株式会社アマナイメージズを通じて展開するAI学習用データソリューション『Qlean Dataset(キュリンデータセット)』において、『日本語・2話者・コメディテーマトーク音声コーパスデータセット』の提供を開始しました。

本データセットは、Qlean Datasetが展開する機械学習用データセットラインナップ『AIデータレシピ』の1ラインナップとして提供されるもので、20代〜50代の男女2名による日本語の自然対話音声を収録しています。 
収録音声は、ユーモアや笑いを交えた軽快な掛け合いを中心とした雑談形式の対話で構成されています。台本を用いない自由な会話進行により、即興的な反応やテンポの変化、話題の脱線、ボケ・ツッコミといった自然な対話要素が含まれています。
こうした会話には、2話者構成による発話の交替や重なりも含まれており、ターンテイキング解析や話者識別、対話構造理解などのモデル学習および検証に利用できます。
また、本データセットは、リラックスしたコミュニケーション環境下での会話を想定して収録されています。そのため、実運用に近い条件で、音声認識(ASR)や自然言語処理(NLP)を基盤技術として用いる対話型AIや音声アシスタントなど、音声対話AIの研究・開発に活用できます。

今回提供を開始する「日本語・2話者・コメディテーマトーク音声コーパスデータセット」の概要

概略

ユーモアのある雑談などを中心に 2名が軽快に話し合う日本語対話音声データセットです。

データ種別

音声

被写体属性

20代〜50代の男女

データ形式

mp3 / wav

収録時間

計約330時間(1音声約5分〜60分)

音声レート

44.1kHz

対象のシーン

・2名が笑いやユーモアを交えながら軽い掛け合いを行うシーン
・即興的な反応やテンポの変化がそのまま反映される会話
・台本のない自由な雑談形式で進む対話
・ボケ・ツッコミ、話題の脱線などが自然に生じる場面
・リラックスしたコミュニケーションが中心となる対話シーン

サンプル詳細

https://qleandataset.visual-bank.co.jp/lineup/pn-020

「日本語・2話者・コメディテーマトーク音声コーパスデータセット」のユースケースイメージ

 【研究用途】 

  • 対話構造解析モデルの研究 

    2話者間での発話交替や話題遷移を対象に、ターンテイキングや対話単位の分割など、対話構造解析手法の検証に利用できます。

  • 雑談対話を対象とした自然言語処理研究

    台本に依存しない雑談対話を用い、非タスク指向対話における話題展開や応答生成の挙動を評価する研究に活用できます。

 【産業用途】 

  • 音声対話AIの応答生成・理解モデル開発 

    音声アシスタントや対話型サービスにおいて、自然な会話の流れを前提とした応答生成・理解モデルの学習や評価に利用できます。

  •  話者識別・ターンテイキング技術の検証 

    2話者による会話音声を用い、話者交替検出や発話区間推定など、対話制御に関わる技術の検証に活用できます。

 【その他実需要】 

  • 音声処理・対話AI教育用データ 

    大学や専門教育機関における音声認識や対話AIの演習用データとして、対話特有の処理課題を扱う教材に利用できます。

『Qlean Dataset(キュリンデータセット)』について

『Qlean Dataset』は、Visual Bank傘下の株式会社アマナイメージズが提供する商用利用可能なAI学習用データソリューションです。
画像・動画・音声・3D・テキストなど、多様な形式のデータに対応し、研究・商用いずれの用途でも安全に利用できる環境を整備しています。
また、株式会社千葉ロッテマリーンズや株式会社東洋経済新報社をはじめとするデータパートナーとの協業を通じ、業界特化・最新トレンドに即したデータラインナップ『AIデータレシピ』を継続的に拡充しています。
Qlean Datasetは、AI開発現場におけるデータ収集・整備の負荷を軽減し、権利クリアで法的リスクのないAI開発環境の構築を支援します。

▶ Qlean Datasetサイト:https://qleandataset.visual-bank.co.jp/
▶ AIデータレシピ:https://qleandataset.visual-bank.co.jp/lineup

Qlean Datasetの特長

  • すべての被写体から同意取得

  • 既存データは最短1日で納品可能

  • カスタム撮影・収録・収集による独自データ構築にも対応

▶ お問い合わせ:https://qleandataset.visual-bank.co.jp/contact

Visual Bank株式会社

AI開発力を最大化する次世代型データインフラを構築・提供するスタートアップ企業として、「あらゆるデータの可能性を解き放つ」をミッションに掲げ事業活動を展開。漫画家の「もっと描きたい!」をサポートするAI補助ツールを提供する『THE PEN』の他、AI学習用データセット開発サービス『Qlean Dataset(キュリンデータセット)』を提供する株式会社アマナイメージズを100%子会社に持つ。
また、Visual Bankは国の研究開発プログラム「GENIAC」にも採択され、社会実装に向けた取り組みを加速させています。

代表取締役CEO:永井 真之
所在地:〒107-0062 東京都港区南青山7-1-7C-Cube南青山ビル6F
Visual Bank企業URL:https://visual-bank.co.jp/
アマナイメージズ企業URL: https://amanaimages.com/about/

  • 日本語音声コーパス

  • 音声データセット

株式会社アマナイメージズ

Visual Bank株式会社


© amanaimages inc.