1–8 / 10 件
LEGAL·TEXT / RAG 認証済
日本法令・判例コーパス 2026Q1
e-Gov 由来の現行法令と最高裁判例を構造化。チャンク分割済みで RAG 用途に最適。条文リンク、施行日メタデータ完備。
商用利用可再配布可(条件付)ParquetRAG最適化
- サイズ
- 8.1 GB
- 行数
- 2,800,000
- 提供
- 法文研究所
- 更新
- 2026-04-02
法人ライセンス
¥ 2,400,000/年
FINANCE·TEXT 認証済
上場企業 有価証券報告書 2005–2025
EDINET 由来の有報データ。セクション分割+XBRL タグ付与で、財務モデル学習や抽出タスクに最適。
商用利用可モデル学習可JSONLXBRL
- サイズ
- 142 GB
- reports
- 86,000
- 提供
- ファイナンシャルAI
- 更新
- 2026-04-05
法人ライセンス
¥ 1,200,000/年
JAPANESE·INSTRUCTION TUNING 認証済
日本語 高品質インストラクションチューニング v3
120万件の高品質な指示-応答ペア。法務・医療・製造など専門領域を重点的に収録した、日本語特化のインストラクションチューニング用データセット。人手レビューと毒性フィルタを適用済みで、商用モデルの学習に即利用可能。
商用利用可モデル学習可再配布不可JSONL人手レビュー済
- サイズ
- 3.2 GB
- 行数
- 1,214,892
- 提供
- 絆リサーチ株式会社
- 更新
- 2026-04-10
法人ライセンス
¥ 1,800,000/年〜
JAPANESE·DIALOGUE 認証済
日本語 対話データセット v2
マルチターン対話 80 万ペア。人格一貫性・文脈保持の評価に対応。会話トピック多様性を重視。
商用利用可モデル学習可マルチターンJSONL
- サイズ
- 2.1 GB
- conversations
- 800,000
- 提供
- 絆リサーチ株式会社
- 更新
- 2026-02-20
法人ライセンス
¥ 1,400,000/年
JAPANESE·SAFETY 認証済
日本語 セーフティ評価セット
有害応答、バイアス、ハルシネーション検出のためのレッドチーム集。社内リリースゲートでの活用を想定。
商用利用可評価専用学習利用不可レッドチーム
- サイズ
- 340 MB
- prompts
- 42,000
- 提供
- 絆リサーチ株式会社
- 更新
- 2026-02-25
法人ライセンス
¥ 900,000/年
JAPANESE·REASONING 認証済
日本語 推論タスク 12万題
数理・論理・常識推論を幅広くカバー。思考過程(Chain-of-Thought)の注釈付き。難易度ラベル 5 段階。
商用利用可モデル学習可CoT付きJSONL
- サイズ
- 890 MB
- problems
- 120,000
- 提供
- 絆リサーチ株式会社
- 更新
- 2026-03-01
法人ライセンス
¥ 1,100,000/年
E-COMMERCE·REVIEW / TEXT 認証済
国内EC レビューテキスト 560万件
商品カテゴリ、評価点、購入者属性(匿名化)付き。感情分析、属性抽出、推薦モデル用途。
商用利用可モデル学習可匿名化済JSONL
- サイズ
- 12 GB
- reviews
- 5,600,000
- 提供
- コマースAI
- 更新
- 2026-03-15
法人ライセンス
¥ 740,000/年
MEDICAL·DIALOGUE 認証済
医療問診対話 8万件(医師監修)
一次診療想定の患者-医師問診対話。医師監修のもと匿名化・整形。症状・診断カテゴリラベル付き。
商用利用可モデル学習可医師監修倫理審査済
- サイズ
- 780 MB
- dialogues
- 80,000
- 提供
- メディカルAIジャパン
- 更新
- 2026-03-17
法人ライセンス
¥ 2,200,000/年