9–16 / 19 件
EMOTIONAL TTS·SPEECH 認証済
日本語 感情発話データセット
同一テキストを200話者 × 10感情 × 3段階の強度で発話した、感情制御TTSの学習に最適化された合成音声データセット。話者属性(年代・性別)のバランスと感情統制を両立。スタジオ収録と同等の品質を、合成データ技術により1/5〜1/10のコストで実現。
商用利用可モデル学習可合成データ200話者10感情×3強度
- サイズ
- 12 GB
- files
- 18,000
- 提供
- Hen&Ai 株式会社
- 更新
- 2026-04-18
法人ライセンス
¥ 198,000(税込)
JAPANESE·DIALOGUE 認証済
日本語 対話データセット v2
マルチターン対話 80 万ペア。人格一貫性・文脈保持の評価に対応。会話トピック多様性を重視。
商用利用可モデル学習可マルチターンJSONL
- サイズ
- 2.1 GB
- conversations
- 800,000
- 提供
- 絆リサーチ株式会社
- 更新
- 2026-02-20
法人ライセンス
¥ 1,400,000/年
JAPANESE·SAFETY 認証済
日本語 セーフティ評価セット
有害応答、バイアス、ハルシネーション検出のためのレッドチーム集。社内リリースゲートでの活用を想定。
商用利用可評価専用学習利用不可レッドチーム
- サイズ
- 340 MB
- prompts
- 42,000
- 提供
- 絆リサーチ株式会社
- 更新
- 2026-02-25
法人ライセンス
¥ 900,000/年
JAPANESE·REASONING 認証済
日本語 推論タスク 12万題
数理・論理・常識推論を幅広くカバー。思考過程(Chain-of-Thought)の注釈付き。難易度ラベル 5 段階。
商用利用可モデル学習可CoT付きJSONL
- サイズ
- 890 MB
- problems
- 120,000
- 提供
- 絆リサーチ株式会社
- 更新
- 2026-03-01
法人ライセンス
¥ 1,100,000/年
E-COMMERCE·REVIEW / TEXT 認証済
国内EC レビューテキスト 560万件
商品カテゴリ、評価点、購入者属性(匿名化)付き。感情分析、属性抽出、推薦モデル用途。
商用利用可モデル学習可匿名化済JSONL
- サイズ
- 12 GB
- reviews
- 5,600,000
- 提供
- コマースAI
- 更新
- 2026-03-15
法人ライセンス
¥ 740,000/年
MEDICAL·DIALOGUE 認証済
医療問診対話 8万件(医師監修)
一次診療想定の患者-医師問診対話。医師監修のもと匿名化・整形。症状・診断カテゴリラベル付き。
商用利用可モデル学習可医師監修倫理審査済
- サイズ
- 780 MB
- dialogues
- 80,000
- 提供
- メディカルAIジャパン
- 更新
- 2026-03-17
法人ライセンス
¥ 2,200,000/年
CUSTOMER SUPPORT·DIALOGUE 認証済
カスタマーサポート対話ログ 匿名化済 85万件
国内コールセンター由来の対話ログ。個人情報は 3 段階の匿名化処理を実施。業種タグ、解決状態タグ付き。
商用利用可モデル学習可匿名化済JSONL
- サイズ
- 4.6 GB
- dialogues
- 850,000
- 提供
- CSデータラボ
- 更新
- 2026-03-28
法人ライセンス
¥ 980,000/年
SPEECH·ASR 認証済
日本語音声認識 多話者 2,000時間
ASR 学習向けの高品質書き起こし付き音声。ノイズ環境、電話品質、会議など複数シーンを収録。
商用利用可モデル学習可多話者多シーン
- サイズ
- 920 GB
- hours
- 2,000
- 提供
- 音響研究所
- 更新
- 2026-04-02
法人ライセンス
¥ 2,800,000/年