2026.03.10

Qlean Dataset、「日本語・1話者・文学朗読音声コーパスとトランスクリプト」を提供開始

〜GENIAC採択企業のVisual Bank、ナレーション領域の音声・テキストデータでTTSおよびASR開発を支援〜

Visual Bank株式会社は、高品質な音声合成(TTS)モデルの学習や自動音声認識(ASR)の精度向上、および自然言語処理(NLP)の研究に最適化された、「日本語・1話者の文学朗読音声データセット」の提供を開始します。

本データセットは、日本文学や小説作品を対象とし、同一の日本人話者が全編を朗読した音声と、その内容を正確に書き起こしたトランスクリプトで構成されています。収録されている音声は、作品の情景描写や地の文を一定のテンポで丁寧に読み上げる朗読特有のスタイルを維持しており、長時間の文脈に沿った一貫性のある発話特性を有しています。感情の起伏を抑えた安定した調子から、文学的表現に基づいた微細な抑揚までが含まれるため、文脈を考慮した高度な音声生成技術の検証に適しています。

本データは、Qlean Datasetが展開するAI開発用オリジナルデータラインナップ「AIデータレシピ」の一つとして提供され、研究用途から商用利用を前提としたAI開発まで、幅広いフェーズでの活用を想定しています。Visual Bankおよびアマナイメージズは、今後も生成AIおよび音声・言語系AI開発の現場ニーズを踏まえたデータ提供を通じて、国内外のAI研究・開発を支援していきます。

今回提供を開始する「日本語・1話者・文学朗読音声データセット」の概要

データ種別

音声、テキスト

被写体属性

日本人

データ形式

・音声データ:mp3

・テキストデータ:txt,json,csv

収録時間

1音声30秒〜160分

音声レート

44.1kHz / 48kHz

対象のシーン

・日本の小説や文学作品の文章を朗読するシーン
・地の文や情景描写を一定のテンポで読み上げる朗読シーン

サンプルページ

https://qleandataset.visual-bank.co.jp/lineup/pn-044

「日本語・1話者・文学朗読音声データセット」のユースケースイメージ

【研究用途】

  • 長尺文脈における音声合成(TTS)の韻律制御研究

    数十分から一時間を超える長尺のテキストに対し、一貫した話者性を保ちながら、文脈に応じた自然なポーズや抑揚を生成するモデルの精度検証に利用できます。

【産業用途】

  • オーディオブック・ナレーション生成AIの開発

    出版業界やエンターテインメント領域において、文学作品の複雑な構文を正確に読み上げるナレーションAIの学習データとして活用し、人間による朗読に近い自然なリスニング体験を実現する機能を開発できます。

  • 文学表現に特化した自動音声認識(ASR)の音響モデル最適化

    日常会話とは異なる文語体や特有の語彙が含まれる文学作品の音声を正しく認識・テキスト化するための、特定ドメイン向けASRモデルのファインチューニングに利用できます。

『Qlean Dataset(キュリンデータセット)』について

『Qlean Dataset』は、Visual Bank傘下の株式会社アマナイメージズが提供する商用利用可能なAI学習用データソリューションです。
画像・動画・音声・3D・テキストなど、多様な形式のデータに対応し、研究・商用いずれの用途でも安全に利用できる環境を整備しています。
また、国内・海外のデータホルダーやラジオ・新聞社・通信社等のメディアとの協業を通じ、業界特化・最新トレンドに即したデータラインナップ『AIデータレシピ』を継続的に拡充しています。
Qlean Datasetは、AI開発現場におけるデータ収集・整備の負荷を軽減し、権利クリアで法的リスクのないAI開発環境の構築を支援します。

▶ Qlean Datasetサイト:https://qleandataset.visual-bank.co.jp/
▶ AIデータレシピ:https://qleandataset.visual-bank.co.jp/lineup

Qlean Datasetの特長

  • すべての被写体から同意取得

  • 既存データは最短1日で納品可能

  • カスタム撮影・収録・収集による独自データ構築にも対応

▶ お問い合わせ:https://qleandataset.visual-bank.co.jp/contact

Visual Bank株式会社

AI開発力を最大化する次世代型データインフラを構築・提供するスタートアップ企業として、「あらゆるデータの可能性を解き放つ」をミッションに掲げ事業活動を展開。漫画家の「もっと描きたい!」をサポートするAI補助ツールを提供する『THE PEN』の他、AI学習用データセット開発サービス『Qlean Dataset(キュリンデータセット)』を提供する株式会社アマナイメージズを100%子会社に持つ。
また、Visual Bankは国の研究開発プログラム「GENIAC」にも採択され、社会実装に向けた取り組みを加速させています。

代表取締役CEO:永井 真之
所在地:〒107-0062 東京都港区南青山7-1-7C-Cube南青山ビル6F
Visual Bank企業URL:https://visual-bank.co.jp/
アマナイメージズ企業URL: https://amanaimages.com/about/

  • テキストデータセット

  • トランスクリプト

  • 日本語音声コーパス

  • 音声データセット

株式会社アマナイメージズ

Visual Bank株式会社


© amanaimages inc.