法人向けAI学習データセットマーケットプレイス
絆データセットカタログ
Kizuna Dataset Catalogue

カタログ検索

19 件のデータセット
916 / 19
EMOTIONAL TTS·SPEECH 認証済

日本語 感情発話データセット

同一テキストを200話者 × 10感情 × 3段階の強度で発話した、感情制御TTSの学習に最適化された合成音声データセット。話者属性(年代・性別)のバランスと感情統制を両立。スタジオ収録と同等の品質を、合成データ技術により1/5〜1/10のコストで実現。

商用利用可モデル学習可合成データ200話者10感情×3強度
サイズ
12 GB
files
18,000
提供
Hen&Ai 株式会社
更新
2026-04-18
法人ライセンス
¥ 198,000(税込)
JAPANESE·DIALOGUE 認証済

日本語 対話データセット v2

マルチターン対話 80 万ペア。人格一貫性・文脈保持の評価に対応。会話トピック多様性を重視。

商用利用可モデル学習可マルチターンJSONL
サイズ
2.1 GB
conversations
800,000
提供
絆リサーチ株式会社
更新
2026-02-20
法人ライセンス
¥ 1,400,000/年
JAPANESE·SAFETY 認証済

日本語 セーフティ評価セット

有害応答、バイアス、ハルシネーション検出のためのレッドチーム集。社内リリースゲートでの活用を想定。

商用利用可評価専用学習利用不可レッドチーム
サイズ
340 MB
prompts
42,000
提供
絆リサーチ株式会社
更新
2026-02-25
法人ライセンス
¥ 900,000/年
JAPANESE·REASONING 認証済

日本語 推論タスク 12万題

数理・論理・常識推論を幅広くカバー。思考過程(Chain-of-Thought)の注釈付き。難易度ラベル 5 段階。

商用利用可モデル学習可CoT付きJSONL
サイズ
890 MB
problems
120,000
提供
絆リサーチ株式会社
更新
2026-03-01
法人ライセンス
¥ 1,100,000/年
E-COMMERCE·REVIEW / TEXT 認証済

国内EC レビューテキスト 560万件

商品カテゴリ、評価点、購入者属性(匿名化)付き。感情分析、属性抽出、推薦モデル用途。

商用利用可モデル学習可匿名化済JSONL
サイズ
12 GB
reviews
5,600,000
提供
コマースAI
更新
2026-03-15
法人ライセンス
¥ 740,000/年
MEDICAL·DIALOGUE 認証済

医療問診対話 8万件(医師監修)

一次診療想定の患者-医師問診対話。医師監修のもと匿名化・整形。症状・診断カテゴリラベル付き。

商用利用可モデル学習可医師監修倫理審査済
サイズ
780 MB
dialogues
80,000
提供
メディカルAIジャパン
更新
2026-03-17
法人ライセンス
¥ 2,200,000/年
CUSTOMER SUPPORT·DIALOGUE 認証済

カスタマーサポート対話ログ 匿名化済 85万件

国内コールセンター由来の対話ログ。個人情報は 3 段階の匿名化処理を実施。業種タグ、解決状態タグ付き。

商用利用可モデル学習可匿名化済JSONL
サイズ
4.6 GB
dialogues
850,000
提供
CSデータラボ
更新
2026-03-28
法人ライセンス
¥ 980,000/年
SPEECH·ASR 認証済

日本語音声認識 多話者 2,000時間

ASR 学習向けの高品質書き起こし付き音声。ノイズ環境、電話品質、会議など複数シーンを収録。

商用利用可モデル学習可多話者多シーン
サイズ
920 GB
hours
2,000
提供
音響研究所
更新
2026-04-02
法人ライセンス
¥ 2,800,000/年
916 / 19