2026.02.16
Qlean Dataset、「日本語・1話者・児童書の朗読音声データセット」を提供開始
〜GENIAC採択企業のVisual Bank、児童向け物語朗読音声データで音声・言語系AI開発を支援〜

Visual Bank株式会社(東京都港区、代表取締役CEO:永井真之)は、傘下の株式会社アマナイメージズを通じて展開するAI学習用データソリューション「Qlean Dataset(キュリンデータセット)」において、ASR(自動音声認識)やNLP、LLMなどの音声・言語系AI開発に利用される「日本語・1話者・児童書・童話・絵本・昔話テーマの朗読音声コーパスとトランスクリプト」の提供を開始しました。
本データセットは、児童書や童話、絵本、昔話といった子ども向け物語を、日本人話者一名が朗読する形式で収録した日本語音声と、その発話内容を忠実に反映したトランスクリプトで構成されています。登場人物の心情や物語の展開を伝えることを意識した自然な朗読発話が含まれており、読み上げ特有の抑揚や間の取り方、文脈に応じた発声が記録されています。
単一話者による長時間の朗読音声がまとまった形で収録されているため、発話者条件を固定した音声認識モデルの検証や、物語文脈を伴う長文テキストを扱う言語モデルの学習・評価に利用することが可能です。音声とテキストが対応付けられていることから、音声認識モデルの学習だけでなく、音声と言語を横断するマルチモーダルな検証用途にも適しています。
Qlean Datasetでは、研究開発段階から商用展開を見据えたAI開発において安心して利用できる学習データの提供を行っており、本データセットもその一環として、音声・言語系AIの基盤的な検証や精度評価を支援します。
今回提供を開始する「日本語・1話者・児童書朗読音声データセット」の概要
データ種別 | 音声、テキスト | |
|---|---|---|
被写体属性 | 日本人 | |
データ形式 | 音声データ:mp3 | |
収録時間 | 1音声30秒〜120分 | |
音声レート | 44.1kHz / 48kHz | |
対象のシーン | ・子ども向け物語を一人の話者が朗読するシーン | ・登場人物や物語展開をわかりやすく伝える読み上げシーン |
サンプル詳細 |
「日本語・1話者・児童書朗読音声データセット」のユースケースイメージ
【研究用途】
音声認識モデルにおける朗読音声の認識精度検証
児童書や童話の朗読音声を用いて、ASRモデルが物語文脈を伴う読み上げ発話をどの程度正確に文字起こしできるかを評価する研究に利用できます。単一話者条件のため、発話内容や文構造に起因する誤認識の分析が可能です。長文コンテキストを扱う言語モデルの理解検証
物語形式の連続したテキストを用い、LLMが物語の流れや登場人物の関係性をどの程度保持・理解できるかを検証する研究用途に利用できます。
【産業用途】
音声読み上げAI・ナレーション生成モデルの評価
児童向けコンテンツを想定した音声読み上げAIにおいて、物語調の自然な発話表現をどのように再現できているかを確認するための評価データとして利用できます。音声入力を伴う対話型AIの基礎検証
物語朗読音声と対応するテキストを用い、音声入力を起点とした対話・応答処理の検証や、音声と言語を統合した処理パイプラインの検証用途に利用できます。
『Qlean Dataset(キュリンデータセット)』について
『Qlean Dataset』は、Visual Bank傘下の株式会社アマナイメージズが提供する商用利用可能なAI学習用データソリューションです。
画像・動画・音声・3D・テキストなど、多様な形式のデータに対応し、研究・商用いずれの用途でも安全に利用できる環境を整備しています。
また、株式会社千葉ロッテマリーンズや株式会社東洋経済新報社をはじめとするデータパートナーとの協業を通じ、業界特化・最新トレンドに即したデータラインナップ『AIデータレシピ』を継続的に拡充しています。
Qlean Datasetは、AI開発現場におけるデータ収集・整備の負荷を軽減し、権利クリアで法的リスクのないAI開発環境の構築を支援します。
▶ Qlean Datasetサイト:https://qleandataset.visual-bank.co.jp/
▶ AIデータレシピ:https://qleandataset.visual-bank.co.jp/lineup




Qlean Datasetの特長
すべての被写体から同意取得
既存データは最短1日で納品可能
カスタム撮影・収録・収集による独自データ構築にも対応
▶ お問い合わせ:https://qleandataset.visual-bank.co.jp/contact
Visual Bank株式会社
AI開発力を最大化する次世代型データインフラを構築・提供するスタートアップ企業として、「あらゆるデータの可能性を解き放つ」をミッションに掲げ事業活動を展開。漫画家の「もっと描きたい!」をサポートするAI補助ツールを提供する『THE PEN』の他、AI学習用データセット開発サービス『Qlean Dataset(キュリンデータセット)』を提供する株式会社アマナイメージズを100%子会社に持つ。
また、Visual Bankは国の研究開発プログラム「GENIAC」にも採択され、社会実装に向けた取り組みを加速させています。
代表取締役CEO:永井 真之
所在地:〒107-0062 東京都港区南青山7-1-7C-Cube南青山ビル6F
Visual Bank企業URL:https://visual-bank.co.jp/
アマナイメージズ企業URL: https://amanaimages.com/about/
トランスクリプト
テキストデータセット
日本語音声コーパス





