法人向けAI学習データセットマーケットプレイス
絆データセットカタログ
Kizuna Dataset Catalogue

カタログ検索

19 件のデータセット
18 / 19
SPEECH·AUDIO 認証済

日本語 対話音声コーパス 3,200 時間

地域・年齢・性別バランスを考慮したマルチスピーカ会話音声。書き起こし、感情タグ、話者属性付き。

商用利用可モデル学習可話者同意済多話者
サイズ
1.8 TB
hours
3,200
提供
音響研究所
更新
2026-01-28
法人ライセンス
¥ 3,400,000/年
AUTOMOTIVE·MULTIMODAL 認証済

国内走行シーン LiDAR + カメラ 同期データ

首都圏・地方含む 1,200 時間分の同期済み走行データ。歩行者・二輪車の高精度ラベル付き。天候・時間帯・季節バランス考慮。

商用利用可NDA必須マルチモーダル高精度アノテーション
サイズ
24 TB
hours
1,200
提供
モビリティデータ株式会社
更新
2026-02-20
法人ライセンス
お問い合わせ
MANUFACTURING·VISION 認証済

工場外観検査 欠陥画像 120k

金属・樹脂部品の欠陥 12 カテゴリを画素単位でアノテーション。実稼働ラインから収集、産業用途即活用可能。

商用利用可モデル学習可画素単位アノテーションCOCO形式
サイズ
89 GB
images
120,000
提供
産業画像研究
更新
2026-03-08
法人ライセンス
¥ 4,100,000/年
MEDICAL·IMAGE 認証済

胸部X線 アノテーション済み 450k 枚

放射線科医によるバウンディングボックスと所見テキストを付与。倫理審査承認済。14 疾患カテゴリをカバー。

商用利用可モデル学習可倫理審査済DICOM
サイズ
612 GB
images
450,000
提供
メディカルAIジャパン
更新
2026-03-18
法人ライセンス
¥ 5,800,000/年
LEGAL·TEXT / RAG 認証済

日本法令・判例コーパス 2026Q1

e-Gov 由来の現行法令と最高裁判例を構造化。チャンク分割済みで RAG 用途に最適。条文リンク、施行日メタデータ完備。

商用利用可再配布可(条件付)ParquetRAG最適化
サイズ
8.1 GB
行数
2,800,000
提供
法文研究所
更新
2026-04-02
法人ライセンス
¥ 2,400,000/年
FINANCE·TEXT 認証済

上場企業 有価証券報告書 2005–2025

EDINET 由来の有報データ。セクション分割+XBRL タグ付与で、財務モデル学習や抽出タスクに最適。

商用利用可モデル学習可JSONLXBRL
サイズ
142 GB
reports
86,000
提供
ファイナンシャルAI
更新
2026-04-05
法人ライセンス
¥ 1,200,000/年
JAPANESE·INSTRUCTION TUNING 認証済

日本語 高品質インストラクションチューニング v3

120万件の高品質な指示-応答ペア。法務・医療・製造など専門領域を重点的に収録した、日本語特化のインストラクションチューニング用データセット。人手レビューと毒性フィルタを適用済みで、商用モデルの学習に即利用可能。

商用利用可モデル学習可再配布不可JSONL人手レビュー済
サイズ
3.2 GB
行数
1,214,892
提供
絆リサーチ株式会社
更新
2026-04-10
法人ライセンス
¥ 1,800,000/年〜
MULTI-SPEAKER·TTS / VC / ASR 認証済

日本語 多話者音声データセット(感情なし)

200話者がニュートラルな発話でテキストを読み上げた汎用音声データセット。年代・性別のバランスを考慮した話者構成で、多話者TTS・声質変換(VC)・ASR学習データ増強など幅広い用途に対応。合成データ技術で低コストを実現。

商用利用可モデル学習可合成データ200話者感情なし
サイズ
52 GB
hours
100
提供
Hen&Ai 株式会社
更新
2026-04-17
法人ライセンス
¥ 98,000〜148,000(話者数により変動)
18 / 19
123