2026.01.20

Qlean Dataset、「日本語・2話者・社会文化テーマトーク音声コーパスとトランスクリプト」を提供開始

〜GENIAC採択企業のVisual Bank、生活・価値観を題材とした日本語対話音声でASR/NLP/LLM開発を支援〜

Visual Bank株式会社(東京都港区、代表取締役CEO 永井真之)は、傘下の株式会社アマナイメージズを通じて展開するAI学習用データソリューション「Qlean Dataset(キュリン データセット)」において、ASR(自動音声認識)、NLP(自然言語処理)、LLMなどの音声・言語系AI開発に向けた「日本語・2話者・社会文化テーマトーク音声コーパスとトランスクリプト」の提供を開始しました。

本データセットは、Qlean Datasetが展開する機械学習用データセットラインナップ『AIデータレシピ』に新たに加わるもので、生活や人間関係、価値観、働き方、住環境など、日常に根ざした社会文化的トピックを題材に、日本人の男女2名が対話形式で語り合う日本語音声と、その発話内容を忠実に書き起こしたトランスクリプトを収録しています。個人の体験や考え方を起点に意見を交わす会話が中心となっており、身近なテーマをめぐる自然な対話が展開されます。
収録は台本による制御を行わず、話者同士が自由なテンポで意見や感想を交わす形式を採用しています。価値観の違いに対する反応や共感、迷い、意見のすり合わせといったやり取りが含まれており、相づちや話者交替、話題転換を伴う実際の会話構造を反映した音声データとして構成されています。

今回提供を開始する「日本語・2話者・社会文化テーマトーク音声コーパスとトランスクリプト」の概要

データ種別

音声、テキスト

被写体属性

日本人、20代〜50代の男女

データ形式

音声データ:mp3 / wav
テキストデータ:txt / json /csv

収録時間

計約450時間(1音声約5分〜60分)

音声レート

44.1kHz / 48kHz

対象のシーン

・社会や文化をテーマに、2名の話者が意見を交わす日本語対話
・生活や価値観、社会的背景に関する話題を取り上げた会話
・台本に依存せず、相づちや反応を交えながら自然に進行する対話
・話題転換や具体例の共有を含む、流れのある会話構成

サンプル詳細

https://qleandataset.visual-bank.co.jp/lineup/pn-017

「日本語・2話者・社会文化テーマトーク音声コーパスとトランスクリプト」のユースケースイメージ

【研究用途】

  • 日本語対話における価値観表現・意見交換構造の分析
    生活や人間関係、仕事観などに関する対話音声とトランスクリプトを用いて、価値判断を含む発話や意見の対立・合意形成プロセスを対象とした言語学・情報学領域の研究に利用できます。対話文脈を踏まえた発話理解や意味解析の検証に適しています。

【産業用途】

  • 対話型AIにおける日常会話・価値観応答の検証
    生活や働き方、人間関係に関する自然な対話データを用いて、対話型AIやチャットボットにおける共感応答、意見への返答、会話継続性の検証に利用できます。一般的なFAQ応答とは異なる、意見交換を伴う対話シナリオの評価に適しています。

  • 日本語LLMの会話文脈理解・応答生成性能評価
    個人の体験や考え方が語られる対話テキストを用いて、日本語LLMにおける文脈保持、話題転換への追従、価値観を含む発話への応答生成などの性能検証やファインチューニング用途に利用できます。

【その他実需要】

  • コミュニケーション設計・対話分析の教材用途
    日常的な社会話題を扱う対話音声と書き起こしを用いて、対話構造や意見交換の進行を分析する教材として活用できます。音声と言語の対応関係を学ぶ教育用途に適しています。

『Qlean Dataset(キュリンデータセット)』について

『Qlean Dataset』は、Visual Bank傘下の株式会社アマナイメージズが提供する商用利用可能なAI学習用データソリューションです。
画像・動画・音声・3D・テキストなど、多様な形式のデータに対応し、研究・商用いずれの用途でも安全に利用できる環境を整備しています。
また、株式会社千葉ロッテマリーンズや株式会社東洋経済新報社をはじめとするデータパートナーとの協業を通じ、業界特化・最新トレンドに即したデータラインナップ『AIデータレシピ』を継続的に拡充しています。
Qlean Datasetは、AI開発現場におけるデータ収集・整備の負荷を軽減し、権利クリアで法的リスクのないAI開発環境の構築を支援します。

▶ Qlean Datasetサイト:https://qleandataset.visual-bank.co.jp/
▶ AIデータレシピ:https://qleandataset.visual-bank.co.jp/lineup

Qlean Datasetの特長

  • すべての被写体から同意取得

  • 既存データは最短1日で納品可能

  • カスタム撮影・収録・収集による独自データ構築にも対応

▶ お問い合わせ:https://qleandataset.visual-bank.co.jp/contact

Visual Bank株式会社

AI開発力を最大化する次世代型データインフラを構築・提供するスタートアップ企業として、「あらゆるデータの可能性を解き放つ」をミッションに掲げ事業活動を展開。漫画家の「もっと描きたい!」をサポートするAI補助ツールを提供する『THE PEN』の他、AI学習用データセット開発サービス『Qlean Dataset(キュリンデータセット)』を提供する株式会社アマナイメージズを100%子会社に持つ。
また、Visual Bankは国の研究開発プログラム「GENIAC」にも採択され、社会実装に向けた取り組みを加速させています。

代表取締役CEO:永井 真之
所在地:〒107-0062 東京都港区南青山7-1-7C-Cube南青山ビル6F
Visual Bank企業URL:https://visual-bank.co.jp/
アマナイメージズ企業URL: https://amanaimages.com/about/

  • トランスクリプト

  • テキストデータセット

  • 日本語音声コーパス

  • 音声データセット

株式会社アマナイメージズ

Visual Bank株式会社


© amanaimages inc.