法人向けAI学習データセットマーケットプレイス
絆データセットカタログ
Kizuna Dataset Catalogue
SPEECH·ASR 認証済データセット

日本語音声認識 多話者 2,000時間

ASR 学習向けの高品質書き起こし付き音声。ノイズ環境、電話品質、会議など複数シーンを収録。

ID
KDC-2026-0402
バージョン
v2.2
サイズ
920 GB
件数
2,000
更新日
2026-04-02
フォーマット
WAV / JSON

このデータセットについて

ASR 学習向けの高品質書き起こし付き音声。ノイズ環境、電話品質、会議など複数シーンを収録。

言語: 日本語 / 業界: 一般 / タグ: 商用利用可 · モデル学習可 · 多話者 · 多シーン

データの出自と同意

商用学習・派生モデル配布可。生音声の再配布不可。

関連データセット