Qlean Dataset、「日本語・2話者・ビジネス会話の音声コーパスと発話内容のテキストデータセット」を提供開始

2025.11.04

〜GENIAC採択企業のVisual Bankが提供、音声理解・CX解析・日本語LLM学習を支える実環境会話データを公開〜

Visual Bank株式会社（東京都港区、代表取締役CEO 永井真之、以下「Visual Bank」）は、傘下の株式会社アマナイメージズを通じて展開するAI学習用データソリューション『Qlean Dataset（キュリンデータセット）』において、『日本語・2話者・ビジネス会話の音声コーパスと発話内容のテキストデータセット』の提供を開始しました。
本データセットは、日本語の自然な2話者対話を数百時間規模で収録し、発話テキスト・話者区分・タイムスタンプを付与した音声認識（ASR）・会話理解・要約生成AI向け学習データです。
研究・商業利用を問わず、日本語音声コーパスの高精度化やCX解析AI、会話型LLMの学習データとして活用可能です。
*Qlean Dataset（キュリンデータセット）：https://qleandataset.visual-bank.co.jp/

『Qlean Dataset（キュリンデータセット）』の「AIデータレシピ」について

『AIデータレシピ』は、『Qlean Dataset』における商用利用可能なオリジナルデータラインナップです。
用途や精度・納期に応じて、すぐに使えるデータ素材を柔軟に組み合わせられる構成が特長で、一部アノテーション済み／未付与のデータや、個別要件に応じた構成変更・拡張にも対応可能です。
また、株式会社千葉ロッテマリーンズや株式会社東洋経済新報社とのパートナーシップ、国内外のネットワーク、新規収録などを通じて、ラインナップの拡充を進めています。
これにより、AI開発現場でのデータ収集・整備にかかる負荷を大幅に軽減し、開発の加速に貢献します。

今回提供を開始する「日本語・2話者・ビジネス会話の音声コーパスと発話内容のテキストデータセット」の概要

データ種別：音声、テキスト
被写体属性：日本人男女
データ形式：音声データ：wav、テキストデータ：txt
備考
[収録時間] 数百時間
[対象のシーン] 商談、SaaS問い合わせ対応、架電対応　など
[テキスト書き起こし構成] 行番号、開始時間、終了時間、話者区分、発話内容
サンプル詳細URL：https://qleandataset.visual-bank.co.jp/lineup/pn-013

「日本語・2話者・ビジネス会話の音声コーパスと発話内容のテキストデータセット」のユースケースイメージ

音声認識・話者分離AIの高精度化
オンライン会議や対面会話を多環境で収録。ノイズ耐性や被り発話にも対応しており、音声認識（ASR）や話者分離モデルの性能向上、リアルタイム議事録AIの開発にご利用いただけます。
会話理解・要約生成AIのトレーニング
開始・終了時刻や話者区分が付与された精密な書き起こし構造により、長時間会話の要点抽出・要約AI、次発話予測型の生成AIモデルの学習データとして最適です。
顧客体験（CX）・感情音声認識AIの開発
声のトーンや応答の間など感情的ニュアンスを含むため、顧客満足度・対応品質を解析するCX向けAIモデルやコールセンター自動評価AIの開発に活用できます。
商談解析・セールスインテリジェンスAIの研究
営業や職業面談などの実務対話を網羅しており、発話パターンや傾聴姿勢などを数値化する商談解析AI・セールスコーチングAIの基礎データとして利用できます。
コンタクトセンター自動応対AI・FAQ生成AIの構築
カスタマーサポートや問い合わせ対応の実音声が含まれており、FAQ自動生成AIや音声応答型チャットボットの会話チューニングデータとしてご活用いただけます。
音声UX・会話体験デザインの研究開発
自然な会話テンポや相槌表現を含むリアルな音声データは、AIアシスタント・スマートスピーカーなど音声UI/UX設計の自然対話学習に最適です。
感情変化検知AIによる“体験の質”評価
発話ピッチ・間合い・テンション変化を解析することで、会話中の心理状態変化や満足度推定AIの研究に利用できます。CX定量化・接客トレーニングAIにも応用可能です。
日本語LLM／マルチモーダル生成AIの会話学習
音声とテキストのペア構造により、マルチモーダルLLMの音声理解や日本語対話生成の強化に活用できます。自然な日本語会話を再現する生成AIやボイスチャットLLMの研究用途にも適しています。

『Qlean Dataset』の提供するデータセットの特徴

研究開発、商用利用に対応
Qlean Datasetの提供するデータセットは、データ取得およびAI開発への利用に関する同意書を「すべての被写体」から取得しており、各国のプライバシーポリシー等にも対応しているため安心して研究・商用利用いただくことが可能です。
「AIデータレシピ」からデータセットを提供するため、スピーディーかつROIを最大化
AIデータレシピというQlean Dataset独自の提供形態を取ることにより、初期投資を抑えたデータ調達を行っていただくことが可能です。
「AIデータレシピ」のラインナップにないデータセットは、個別要件に従った作成・構築も可能
独自性の高いデータについても『Qlean Dataset』のケイパビリティを活用し、個別最適化された要件のデータセットをご提供可能です。
Qlean Dataset お問い合わせフォーム：https://qleandataset.visual-bank.co.jp/contact
Qlean Dataset サービスサイトURL：https://qleandataset.visual-bank.co.jp/

ともに、AI開発を支えるデータパートナーを募集

Visual Bankでは、AI開発を支える多様なデータ提供体制を強化するため、音声・画像・動画・3Dなどの各領域でデータパートナーシップの拡大を進めています。
Qlean Datasetは、信頼できるパートナーとの連携を通じて、AI時代に対応した知的財産保護とデータの価値最大化の両立を目指しています。
研究機関・企業・クリエイターの皆様と共に、安心してデータを活用できる環境を築いてまいります。
Qlean Dataset パートナー詳細URL：https://qleandataset.visual-bank.co.jp/partner

Visual Bank株式会社

AI開発力を最大化する次世代型データインフラを構築・提供するスタートアップ企業として、「あらゆるデータの可能性を解き放つ」をミッションに掲げ事業活動を展開。漫画家の「もっと描きたい！」をサポートするAI補助ツールを提供する『THE PEN』の他、AI学習用データセット開発サービス『Qlean Dataset（キュリンデータセット）』を提供する株式会社アマナイメージズを100%子会社に持つ。
また、Visual Bankは国の研究開発プログラム「GENIAC」にも採択され、社会実装に向けた取り組みを加速させています。

代表取締役CEO：永井真之
所在地：〒107-0062 東京都港区南青山7-1-7C-Cube南青山ビル6F
Visual Bank企業URL：https://visual-bank.co.jp/
アマナイメージズ企業URL：　https://amanaimages.com/about/

音声データセット

お知らせ一覧に戻る

この記事のお問い合わせはこちら