2026.02.18

Qlean Dataset、「日本語・1話者・怪談系テーマの朗読音声コーパスとトランスクリプト」を提供開始

〜GENIAC採択企業のVisual Bank、音声・言語系AI開発向けの日本語朗読データでASR・LLM研究を支援〜

Visual Bank株式会社(東京都港区、代表取締役CEO:永井真之)は、傘下の株式会社アマナイメージズを通じて展開するAI学習用データソリューション「Qlean Dataset(キュリンデータセット)」において、ASR(自動音声認識)、音声理解、LLM(大規模言語モデル)などの音声・言語系AI開発および研究用途に向けた「日本語・1話者・怪談系テーマの朗読音声コーパスとトランスクリプト」の提供を開始しました。

本データセットは、怪談や怖い話といった物語性のある日本語テキストを題材に、日本人話者が一人で朗読する音声と、その発話内容を忠実に書き起こしたトランスクリプトで構成されています。物語の進行に伴い、不安感や緊張感を含む語り口が自然に表出する朗読音声が収録されており、読み上げ調の音声に加えて、感情を伴う連続発話としての音声表現を含んでいます。

怪談というテーマ特性上、抑揚や間、声のトーン変化が文脈と密接に結びついており、単文単位の音声認識にとどまらず、長文コンテキストを前提とした音声理解や言語モデル学習に利用しやすい構成となっています。1話者による朗読形式であるため、話者分離を前提としないモデル検証や、話者条件を固定した音声・言語挙動の分析にも適しています。

Qlean Datasetでは、研究用途から商用展開を見据えたAI開発までを想定し、データの権利関係や利用条件を整理したうえで、実運用に耐える学習用データの提供を行っています。本データセットも、音声・言語系AI開発の現場における検証・評価・学習フェーズでの活用を想定し、データ設計されており、Qlean Datasetが提供するオリジナルデータラインナップ「AIデータレシピ」の一つとして提供されます。

今回提供を開始する「日本語・1話者・怪談系テーマの朗読音声コーパスとトランスクリプト」の概要

データ種別

音声、テキスト

被写体属性

日本人

データ形式

音声データ:mp3
テキストデータ:txt,json,csv

収録時間

1音声30秒〜90分

音声レート

44.1kHz / 48kHz

対象のシーン

・怪談やホラー作品の文章を、一人の話者が感情を込めて朗読するシーン

・不安感や緊張感を伴う語り口で物語が進行する朗読シーン

サンプル詳細

https://qleandataset.visual-bank.co.jp/lineup/pn-039

「日本語・1話者・怪談系テーマの朗読音声コーパスとトランスクリプト」のユースケースイメージ

【研究用途】

  • 長文音声入力に対する音声認識・音声理解モデルの評価
    怪談朗読に含まれる連続的な語りを用い、ASRモデルにおける長文発話の認識精度や、文脈継続時の誤認識傾向を検証する研究に利用できます。

  • 音声入力を起点とした言語モデルの文脈理解検証
    音声認識結果を入力とするLLMや音声理解モデルに対し、物語文脈の保持や内容理解の挙動を評価する用途に利用できます。

【産業用途】

  • 音声対話AI・ナレーション生成AIの検証用データ
    怪談朗読に含まれる抑揚や間を含んだ音声表現を用い、音声対話AIや音声生成AIにおける入力理解や出力品質の検証に利用できます。

  • コールセンター・音声UI向け音声処理モデルの事前検証
    感情を含む連続発話音声を用いて、音声UIや音声処理基盤における認識安定性や誤動作リスクの検証用途に利用できます。

『Qlean Dataset(キュリンデータセット)』について

『Qlean Dataset』は、Visual Bank傘下の株式会社アマナイメージズが提供する商用利用可能なAI学習用データソリューションです。
画像・動画・音声・3D・テキストなど、多様な形式のデータに対応し、研究・商用いずれの用途でも安全に利用できる環境を整備しています。
また、株式会社千葉ロッテマリーンズや株式会社東洋経済新報社をはじめとするデータパートナーとの協業を通じ、業界特化・最新トレンドに即したデータラインナップ『AIデータレシピ』を継続的に拡充しています。
Qlean Datasetは、AI開発現場におけるデータ収集・整備の負荷を軽減し、権利クリアで法的リスクのないAI開発環境の構築を支援します。

▶ Qlean Datasetサイト:https://qleandataset.visual-bank.co.jp/
▶ AIデータレシピ:https://qleandataset.visual-bank.co.jp/lineup

Qlean Datasetの特長

  • すべての被写体から同意取得

  • 既存データは最短1日で納品可能

  • カスタム撮影・収録・収集による独自データ構築にも対応

▶ お問い合わせ:https://qleandataset.visual-bank.co.jp/contact

Visual Bank株式会社

AI開発力を最大化する次世代型データインフラを構築・提供するスタートアップ企業として、「あらゆるデータの可能性を解き放つ」をミッションに掲げ事業活動を展開。漫画家の「もっと描きたい!」をサポートするAI補助ツールを提供する『THE PEN』の他、AI学習用データセット開発サービス『Qlean Dataset(キュリンデータセット)』を提供する株式会社アマナイメージズを100%子会社に持つ。
また、Visual Bankは国の研究開発プログラム「GENIAC」にも採択され、社会実装に向けた取り組みを加速させています。

代表取締役CEO:永井 真之
所在地:〒107-0062 東京都港区南青山7-1-7C-Cube南青山ビル6F
Visual Bank企業URL:https://visual-bank.co.jp/
アマナイメージズ企業URL: https://amanaimages.com/about/

  • 日本語音声コーパス

  • トランスクリプト

  • テキストデータセット

  • 音声データセット

株式会社アマナイメージズ

Visual Bank株式会社


© amanaimages inc.