絆データセットカタログ | エンタープライズ向けAI学習データセット

日本語感情発話データセット

同一テキストを200話者 × 10感情 × 3段階の強度で発話した、感情制御TTSの学習に最適化された合成音声データセット。話者属性（年代・性別）のバランスと感情統制を両立。スタジオ収録と同等の品質を、合成データ技術により1/5〜1/10のコストで実現。

KDC-2026-0418

バージョン

v1.0

サイズ

12 GB

件数

18,000

更新日

2026-04-18

フォーマット

WAV 48kHz/24bit + CSV

このデータセットについて

言語: 日本語 / 業界: 一般 / タグ: 商用利用可 · モデル学習可 · 合成データ · 200話者 · 10感情×3強度 · WAV 48kHz/24bit

内訳

ドメイン	件数	比率
普通	1,800	10.0%
落ち着き	1,800	10.0%
喜び	1,800	10.0%
悲しみ	1,800	10.0%
怒り	1,800	10.0%
恐れ	1,800	10.0%
嫌悪	1,800	10.0%
驚き	1,800	10.0%
焦り	1,800	10.0%
興奮	1,800	10.0%

サンプル

{
  "file": "HA-EMO-001/spk042/joy/lv2/042_joy_2_0013.wav",
  "speaker_id": "spk042",
  "speaker_gender": "female",
  "speaker_age_group": "30s",
  "text": "おはようございます。今日もよろしくお願いします。",
  "emotion": "joy",
  "intensity": 2,
  "sample_rate": 48000,
  "bit_depth": 24,
  "duration_sec": 2.87
}

データの出自と同意

商用利用可・モデル学習可・生成出力の商用利用可。生データ再配布・派生データ配布は不可。

日本語感情発話データセット

このデータセットについて

内訳

サンプル

データの出自と同意

関連データセット

日本語多話者音声データセット（感情なし）

日本語高品質インストラクションチューニング v3

上場企業有価証券報告書 2005–2025

日本語 感情発話データセット

このデータセットについて

内訳

サンプル

データの出自と同意

関連データセット

日本語 多話者音声データセット（感情なし）

日本語 高品質インストラクションチューニング v3

上場企業 有価証券報告書 2005–2025

日本語感情発話データセット

日本語多話者音声データセット（感情なし）

日本語高品質インストラクションチューニング v3

上場企業有価証券報告書 2005–2025