2026.02.25
Qlean Dataset、「日本語・1話者・サブカル・スピリチュアル系テーマの朗読音声コーパスとトランスクリプト」を提供開始
〜GENIAC採択企業のVisual Bank、サブカルチャー/精神世界領域の音声・言語データで音声系AI・言語モデル開発を支援〜

Visual Bank株式会社(東京都港区、代表取締役CEO 永井真之)は、傘下の株式会社アマナイメージズを通じて展開するAI学習用データソリューション「Qlean Dataset(キュリンデータセット)」において、ASR(自動音声認識)、音声理解、音声×言語系の基盤モデル開発などに利用される「日本語・1話者・サブカル・スピリチュアル系テーマの朗読音声コーパスとトランスクリプト」の提供を開始しました。
本データセットは、サブカルチャーやスピリチュアル、ヒーリングといったテーマに関する日本語文章を、日本人話者一人が落ち着いた語り口で朗読した音声データと、その発話内容を忠実に記録したトランスクリプトで構成されています。思想や概念、内省的な内容を含む文章が連続的に読み上げられる構成となっており、自然な朗読音声とテキストの対応関係を学習・検証する用途を想定しています。
単一話者による一貫した音声で構成されているため、話者特性のばらつきによる影響を抑えたモデル評価や、音声と言語の対応関係に着目した学習データとして利用しやすい点が特長です。また、会話音声ではなく朗読形式を採用していることから、構文構造や語彙の流れを含めた音声・言語表現の検証にも適しています。
本データセットは、Qlean Datasetが展開するAI開発用オリジナルデータラインナップ「AIデータレシピ」の一つとして提供され、研究用途から商用利用を前提としたAI開発まで、幅広いフェーズでの活用を想定しています。Visual Bankおよびアマナイメージズは、今後も生成AIおよび音声・言語系AI開発の現場ニーズを踏まえたデータ提供を通じて、国内外のAI研究・開発を支援していきます。
今回提供を開始する「日本語・1話者・サブカル・スピリチュアル系テーマの朗読音声コーパスとトランスクリプト」の概要
データ種別 | 音声、テキスト |
|---|---|
被写体属性 | 日本人 |
データ形式 | 音声データ:mp3 |
収録時間 | 1音声30秒〜22分 |
音声レート | 44.1kHz / 48kHz |
対象のシーン | ・サブカルチャーや精神世界に関する文章を一人の話者が朗読するシーン |
サンプル詳細 |
「日本語・1話者・サブカル・スピリチュアル系テーマの朗読音声コーパスとトランスクリプト」のユースケースイメージ
【研究用途】
音声認識・音声理解モデルにおける朗読音声処理の検証
日本語朗読音声と対応するトランスクリプトを用い、ASRや音声理解モデルにおいて、文章構造を持つ連続発話に対する認識精度や誤り傾向の分析に利用できます。音声と言語表現の対応関係に関する基礎研究
思想的・概念的な文章を含む朗読音声を用い、音声信号と言語表現の関係性や、意味理解に関わるモデル挙動の検証に利用できます。
【産業用途】
音声入力型AIアシスタントの音声認識精度評価
ナレーションや読み上げを想定した音声入力を用い、音声認識や音声理解機能を持つAIプロダクトの精度評価や改善検証に利用できます。音声×言語系基盤モデルのファインチューニング
単一話者による朗読音声とテキストの対データを用い、音声と言語を統合的に扱う基盤モデルの学習や挙動確認に利用できます。
『Qlean Dataset(キュリンデータセット)』について
『Qlean Dataset』は、Visual Bank傘下の株式会社アマナイメージズが提供する商用利用可能なAI学習用データソリューションです。
画像・動画・音声・3D・テキストなど、多様な形式のデータに対応し、研究・商用いずれの用途でも安全に利用できる環境を整備しています。
また、株式会社千葉ロッテマリーンズや株式会社東洋経済新報社をはじめとするデータパートナーとの協業を通じ、業界特化・最新トレンドに即したデータラインナップ『AIデータレシピ』を継続的に拡充しています。
Qlean Datasetは、AI開発現場におけるデータ収集・整備の負荷を軽減し、権利クリアで法的リスクのないAI開発環境の構築を支援します。
▶ Qlean Datasetサイト:https://qleandataset.visual-bank.co.jp/
▶ AIデータレシピ:https://qleandataset.visual-bank.co.jp/lineup




Qlean Datasetの特長
すべての被写体から同意取得
既存データは最短1日で納品可能
カスタム撮影・収録・収集による独自データ構築にも対応
▶ お問い合わせ:https://qleandataset.visual-bank.co.jp/contact
Visual Bank株式会社
AI開発力を最大化する次世代型データインフラを構築・提供するスタートアップ企業として、「あらゆるデータの可能性を解き放つ」をミッションに掲げ事業活動を展開。漫画家の「もっと描きたい!」をサポートするAI補助ツールを提供する『THE PEN』の他、AI学習用データセット開発サービス『Qlean Dataset(キュリンデータセット)』を提供する株式会社アマナイメージズを100%子会社に持つ。
また、Visual Bankは国の研究開発プログラム「GENIAC」にも採択され、社会実装に向けた取り組みを加速させています。
代表取締役CEO:永井 真之
所在地:〒107-0062 東京都港区南青山7-1-7C-Cube南青山ビル6F
Visual Bank企業URL:https://visual-bank.co.jp/
アマナイメージズ企業URL: https://amanaimages.com/about/
トランスクリプト
テキストデータセット
日本語音声コーパス
音声データセット





