2025.11.04

Qlean Dataset、「日本語・2話者・ビジネス会話の音声コーパスと発話内容のテキストデータセット」を提供開始

〜GENIAC採択企業のVisual Bankが提供、音声理解・CX解析・日本語LLM学習を支える実環境会話データを公開〜

Visual Bank株式会社(東京都港区、代表取締役CEO 永井真之、以下「Visual Bank」)は、傘下の株式会社アマナイメージズを通じて展開するAI学習用データソリューション『Qlean Dataset(キュリンデータセット)』において、『日本語・2話者・ビジネス会話の音声コーパスと発話内容のテキストデータセット』の提供を開始しました。
本データセットは、日本語の自然な2話者対話を数百時間規模で収録し、発話テキスト・話者区分・タイムスタンプを付与した音声認識(ASR)・会話理解・要約生成AI向け学習データです。
研究・商業利用を問わず、日本語音声コーパスの高精度化やCX解析AI、会話型LLMの学習データとして活用可能です。
*Qlean Dataset(キュリンデータセット):https://qleandataset.visual-bank.co.jp/

『Qlean Dataset(キュリンデータセット)』の「AIデータレシピ」について

『AIデータレシピ』は、『Qlean Dataset』における商用利用可能なオリジナルデータラインナップです。
用途や精度・納期に応じて、すぐに使えるデータ素材を柔軟に組み合わせられる構成が特長で、一部アノテーション済み/未付与のデータや、個別要件に応じた構成変更・拡張にも対応可能です。
また、株式会社千葉ロッテマリーンズや株式会社東洋経済新報社とのパートナーシップ、国内外のネットワーク、新規収録などを通じて、ラインナップの拡充を進めています。
これにより、AI開発現場でのデータ収集・整備にかかる負荷を大幅に軽減し、開発の加速に貢献します。

今回提供を開始する「日本語・2話者・ビジネス会話の音声コーパスと発話内容のテキストデータセット」の概要

  • データ種別: 音声、テキスト

  • 被写体属性:日本人男女

  • データ形式:音声データ:wav、テキストデータ:txt

  • 備考

    [収録時間] 数百時間

    [対象のシーン] 商談、SaaS問い合わせ対応、架電対応 など

    [テキスト書き起こし構成] 行番号、開始時間、終了時間、話者区分、発話内容

  • サンプル詳細URL:https://qleandataset.visual-bank.co.jp/lineup/pn-013

「日本語・2話者・ビジネス会話の音声コーパスと発話内容のテキストデータセット」のユースケースイメージ

  1. 音声認識・話者分離AIの高精度化

    オンライン会議や対面会話を多環境で収録。ノイズ耐性や被り発話にも対応しており、音声認識(ASR)や話者分離モデルの性能向上、リアルタイム議事録AIの開発にご利用いただけます。

  2. 会話理解・要約生成AIのトレーニング

    開始・終了時刻や話者区分が付与された精密な書き起こし構造により、長時間会話の要点抽出・要約AI、次発話予測型の生成AIモデルの学習データとして最適です。

  3. 顧客体験(CX)・感情音声認識AIの開発

    声のトーンや応答の間など感情的ニュアンスを含むため、顧客満足度・対応品質を解析するCX向けAIモデルやコールセンター自動評価AIの開発に活用できます。

  4. 商談解析・セールスインテリジェンスAIの研究

    営業や職業面談などの実務対話を網羅しており、発話パターンや傾聴姿勢などを数値化する商談解析AI・セールスコーチングAIの基礎データとして利用できます。

  5. コンタクトセンター自動応対AI・FAQ生成AIの構築

    カスタマーサポートや問い合わせ対応の実音声が含まれており、FAQ自動生成AIや音声応答型チャットボットの会話チューニングデータとしてご活用いただけます。

  6. 音声UX・会話体験デザインの研究開発

    自然な会話テンポや相槌表現を含むリアルな音声データは、AIアシスタント・スマートスピーカーなど音声UI/UX設計の自然対話学習に最適です。

  7. 感情変化検知AIによる“体験の質”評価

    発話ピッチ・間合い・テンション変化を解析することで、会話中の心理状態変化や満足度推定AIの研究に利用できます。CX定量化・接客トレーニングAIにも応用可能です。

  8. 日本語LLM/マルチモーダル生成AIの会話学習

    音声とテキストのペア構造により、マルチモーダルLLMの音声理解や日本語対話生成の強化に活用できます。自然な日本語会話を再現する生成AIやボイスチャットLLMの研究用途にも適しています。

『Qlean Dataset』の提供するデータセットの特徴

  • 研究開発、商用利用に対応

    Qlean Datasetの提供するデータセットは、データ取得およびAI開発への利用に関する同意書を「すべての被写体」から取得しており、各国のプライバシーポリシー等にも対応しているため安心して研究・商用利用いただくことが可能です。

  • 「AIデータレシピ」からデータセットを提供するため、スピーディーかつROIを最大化

    AIデータレシピというQlean Dataset独自の提供形態を取ることにより、初期投資を抑えたデータ調達を行っていただくことが可能です。

  • 「AIデータレシピ」のラインナップにないデータセットは、個別要件に従った作成・構築も可能

    独自性の高いデータについても『Qlean Dataset』のケイパビリティを活用し、個別最適化された要件のデータセットをご提供可能です。

    Qlean Dataset お問い合わせフォーム:https://qleandataset.visual-bank.co.jp/contact

    Qlean Dataset サービスサイトURL:https://qleandataset.visual-bank.co.jp/

ともに、AI開発を支えるデータパートナーを募集

Visual Bankでは、AI開発を支える多様なデータ提供体制を強化するため、音声・画像・動画・3Dなどの各領域でデータパートナーシップの拡大を進めています。
Qlean Datasetは、信頼できるパートナーとの連携を通じて、AI時代に対応した知的財産保護とデータの価値最大化の両立を目指しています。
研究機関・企業・クリエイターの皆様と共に、安心してデータを活用できる環境を築いてまいります。
Qlean Dataset パートナー詳細URL:https://qleandataset.visual-bank.co.jp/partner

Visual Bank株式会社

AI開発力を最大化する次世代型データインフラを構築・提供するスタートアップ企業として、「あらゆるデータの可能性を解き放つ」をミッションに掲げ事業活動を展開。漫画家の「もっと描きたい!」をサポートするAI補助ツールを提供する『THE PEN』の他、AI学習用データセット開発サービス『Qlean Dataset(キュリンデータセット)』を提供する株式会社アマナイメージズを100%子会社に持つ。
また、Visual Bankは国の研究開発プログラム「GENIAC」にも採択され、社会実装に向けた取り組みを加速させています。

代表取締役CEO:永井 真之
所在地:〒107-0062 東京都港区南青山7-1-7C-Cube南青山ビル6F
Visual Bank企業URL:https://visual-bank.co.jp/
アマナイメージズ企業URL: https://amanaimages.com/about/

  • 音声データセット

株式会社アマナイメージズ

Visual Bank株式会社


© amanaimages inc.