2026.03.17

Qlean Dataset、「海外文学の朗読音声とトランスクリプト」を提供開始

〜GENIAC採択企業のVisual Bank、ナレーション領域の音声・テキストデータで音声認識・合成技術の開発を支援〜

Visual Bank株式会社(東京都港区、代表取締役CEO 永井真之)は、傘下の株式会社アマナイメージズを通じて展開するAI学習用データソリューション「Qlean Dataset(キュリンデータセット)」において、音声認識(ASR)精度の向上や、自然な韻律を持つ音声合成(TTS)モデルの学習に最適化された、「海外文学の朗読音声とトランスクリプト」の提供を開始します。

本データセットは、海外文学作品の日本語訳文を対象とし、物語の情景描写や思想的な一節を落ち着いた語り口で読み上げた一人の日本人話者による音声と、それに対応する正確なトランスクリプトで構成されています。翻訳文学特有の格調高い文体や、日常会話とは異なる複雑な修飾関係を含む「書き言葉」に基づいた発話を網羅しており、文脈を保持した長尺の音声解析や、高度な語彙を伴う自然言語処理(NLP)の研究開発に適しています。一貫性のある発話品質により、物語性のある文章を聴き取りやすく再現する学習モデルの構築を可能にします。

本データは、Qlean Datasetが展開するAI開発用オリジナルデータラインナップ「AIデータレシピ」の一つとして提供され、オーディオブック等のナレーション生成から、文脈依存型の音声認識エンジンの検証まで、実用的なAI実装を目指す開発フェーズでの活用を想定しています。Visual Bankおよびアマナイメージズは、今後も良質な日本語資産を基軸としたデータ提供を通じて、国内外のAI研究・開発を支援していきます。

今回提供を開始する「海外文学の朗読音声とトランスクリプト」の概要

データ種別

音声、テキスト

被写体属性

日本人

データ形式

音声データ:mp3
テキストデータ:txt,json,csv

収録時間

1音声30秒〜90分

音声レート

44.1kHz / 48kHz

対象のシーン

・海外文学作品の文章を日本語訳文として朗読するシーン
・物語や思想を落ち着いた語り口で読み上げる朗読シーン

サンプル詳細

https://qleandataset.visual-bank.co.jp/lineup/pn-040

「海外文学の朗読音声とトランスクリプト」のユースケースイメージ

【研究用途】 

  • 長尺文脈における音声認識モデル(ASR)の精度検証

    一文が長く、倒置法や複雑な修飾関係が含まれる翻訳文学特有の日本語に対し、前後の文脈をどの程度保持してテキスト化できるかを測定する、ベンチマーク用データとして利用できます。

【産業用途】 

  • ナレーション特化型・音声合成(TTS)エンジンの開発

    エンターテインメント分野でのオーディオブック制作や、ニュース記事の自動読み上げサービスにおいて、感情を抑えつつも聞き手に情景を想起させる、高い表現力を持った合成音声の教師データとして活用できます。

【教育・社会実装用途】 

  • 日本語学習者向けの発音評価およびリスニング支援AI
    標準的かつ丁寧な日本語発音を正解データ(Ground Truth)とすることで、外国人学習者の朗読に対する発音矯正AIの構築や、視覚障害者向けの読書支援デバイスにおける、自然で疲れにくい読み上げ機能の実装に寄与します。

  • 文学的コンテクストを理解するLLMのファインチューニング
    論理的な構造を持つ文学作品の音声とテキストをペアで学習させることで、要約生成や文学的表現の翻訳精度を高めるための、小規模かつ高品質な特化型モデルの調整に利用できます。

『Qlean Dataset(キュリンデータセット)』について

『Qlean Dataset』は、Visual Bank傘下の株式会社アマナイメージズが提供する商用利用可能なAI学習用データソリューションです。
画像・動画・音声・3D・テキストなど、多様な形式のデータに対応し、研究・商用いずれの用途でも安全に利用できる環境を整備しています。
また、国内・海外のデータホルダーやラジオ・新聞社・通信社等のメディアとの協業を通じ、業界特化・最新トレンドに即したデータラインナップ『AIデータレシピ』を継続的に拡充しています。
Qlean Datasetは、AI開発現場におけるデータ収集・整備の負荷を軽減し、権利クリアで法的リスクのないAI開発環境の構築を支援します。

▶ Qlean Datasetサイト:https://qleandataset.visual-bank.co.jp/
▶ AIデータレシピ:https://qleandataset.visual-bank.co.jp/lineup

Qlean Datasetの特長

  • すべての被写体から同意取得

  • 既存データは最短1日で納品可能

  • カスタム撮影・収録・収集による独自データ構築にも対応

▶ お問い合わせ:https://qleandataset.visual-bank.co.jp/contact

Visual Bank株式会社

AI開発力を最大化する次世代型データインフラを構築・提供するスタートアップ企業として、「あらゆるデータの可能性を解き放つ」をミッションに掲げ事業活動を展開。漫画家の「もっと描きたい!」をサポートするAI補助ツールを提供する『THE PEN』の他、AI学習用データセット開発サービス『Qlean Dataset(キュリンデータセット)』を提供する株式会社アマナイメージズを100%子会社に持つ。
また、Visual Bankは国の研究開発プログラム「GENIAC」にも採択され、社会実装に向けた取り組みを加速させています。

代表取締役CEO:永井 真之
所在地:〒107-0062 東京都港区南青山7-1-7C-Cube南青山ビル6F
Visual Bank企業URL:https://visual-bank.co.jp/
アマナイメージズ企業URL: https://amanaimages.com/about/

  • トランスクリプト

  • 日本語音声コーパス

  • 音声データセット

株式会社アマナイメージズ

Visual Bank株式会社


© amanaimages inc.