法人向けAI学習データセットマーケットプレイス
絆データセットカタログ
Kizuna Dataset Catalogue

カタログ検索

10 件のデータセット
18 / 10
LEGAL·TEXT / RAG 認証済

日本法令・判例コーパス 2026Q1

e-Gov 由来の現行法令と最高裁判例を構造化。チャンク分割済みで RAG 用途に最適。条文リンク、施行日メタデータ完備。

商用利用可再配布可(条件付)ParquetRAG最適化
サイズ
8.1 GB
行数
2,800,000
提供
法文研究所
更新
2026-04-02
法人ライセンス
¥ 2,400,000/年
FINANCE·TEXT 認証済

上場企業 有価証券報告書 2005–2025

EDINET 由来の有報データ。セクション分割+XBRL タグ付与で、財務モデル学習や抽出タスクに最適。

商用利用可モデル学習可JSONLXBRL
サイズ
142 GB
reports
86,000
提供
ファイナンシャルAI
更新
2026-04-05
法人ライセンス
¥ 1,200,000/年
JAPANESE·INSTRUCTION TUNING 認証済

日本語 高品質インストラクションチューニング v3

120万件の高品質な指示-応答ペア。法務・医療・製造など専門領域を重点的に収録した、日本語特化のインストラクションチューニング用データセット。人手レビューと毒性フィルタを適用済みで、商用モデルの学習に即利用可能。

商用利用可モデル学習可再配布不可JSONL人手レビュー済
サイズ
3.2 GB
行数
1,214,892
提供
絆リサーチ株式会社
更新
2026-04-10
法人ライセンス
¥ 1,800,000/年〜
JAPANESE·DIALOGUE 認証済

日本語 対話データセット v2

マルチターン対話 80 万ペア。人格一貫性・文脈保持の評価に対応。会話トピック多様性を重視。

商用利用可モデル学習可マルチターンJSONL
サイズ
2.1 GB
conversations
800,000
提供
絆リサーチ株式会社
更新
2026-02-20
法人ライセンス
¥ 1,400,000/年
JAPANESE·SAFETY 認証済

日本語 セーフティ評価セット

有害応答、バイアス、ハルシネーション検出のためのレッドチーム集。社内リリースゲートでの活用を想定。

商用利用可評価専用学習利用不可レッドチーム
サイズ
340 MB
prompts
42,000
提供
絆リサーチ株式会社
更新
2026-02-25
法人ライセンス
¥ 900,000/年
JAPANESE·REASONING 認証済

日本語 推論タスク 12万題

数理・論理・常識推論を幅広くカバー。思考過程(Chain-of-Thought)の注釈付き。難易度ラベル 5 段階。

商用利用可モデル学習可CoT付きJSONL
サイズ
890 MB
problems
120,000
提供
絆リサーチ株式会社
更新
2026-03-01
法人ライセンス
¥ 1,100,000/年
E-COMMERCE·REVIEW / TEXT 認証済

国内EC レビューテキスト 560万件

商品カテゴリ、評価点、購入者属性(匿名化)付き。感情分析、属性抽出、推薦モデル用途。

商用利用可モデル学習可匿名化済JSONL
サイズ
12 GB
reviews
5,600,000
提供
コマースAI
更新
2026-03-15
法人ライセンス
¥ 740,000/年
MEDICAL·DIALOGUE 認証済

医療問診対話 8万件(医師監修)

一次診療想定の患者-医師問診対話。医師監修のもと匿名化・整形。症状・診断カテゴリラベル付き。

商用利用可モデル学習可医師監修倫理審査済
サイズ
780 MB
dialogues
80,000
提供
メディカルAIジャパン
更新
2026-03-17
法人ライセンス
¥ 2,200,000/年
18 / 10
12