1–8 / 19 件
SPEECH·AUDIO 認証済
日本語 対話音声コーパス 3,200 時間
地域・年齢・性別バランスを考慮したマルチスピーカ会話音声。書き起こし、感情タグ、話者属性付き。
商用利用可モデル学習可話者同意済多話者
- サイズ
- 1.8 TB
- hours
- 3,200
- 提供
- 音響研究所
- 更新
- 2026-01-28
法人ライセンス
¥ 3,400,000/年
AUTOMOTIVE·MULTIMODAL 認証済
国内走行シーン LiDAR + カメラ 同期データ
首都圏・地方含む 1,200 時間分の同期済み走行データ。歩行者・二輪車の高精度ラベル付き。天候・時間帯・季節バランス考慮。
商用利用可NDA必須マルチモーダル高精度アノテーション
- サイズ
- 24 TB
- hours
- 1,200
- 提供
- モビリティデータ株式会社
- 更新
- 2026-02-20
法人ライセンス
お問い合わせ
MANUFACTURING·VISION 認証済
工場外観検査 欠陥画像 120k
金属・樹脂部品の欠陥 12 カテゴリを画素単位でアノテーション。実稼働ラインから収集、産業用途即活用可能。
商用利用可モデル学習可画素単位アノテーションCOCO形式
- サイズ
- 89 GB
- images
- 120,000
- 提供
- 産業画像研究
- 更新
- 2026-03-08
法人ライセンス
¥ 4,100,000/年
MEDICAL·IMAGE 認証済
胸部X線 アノテーション済み 450k 枚
放射線科医によるバウンディングボックスと所見テキストを付与。倫理審査承認済。14 疾患カテゴリをカバー。
商用利用可モデル学習可倫理審査済DICOM
- サイズ
- 612 GB
- images
- 450,000
- 提供
- メディカルAIジャパン
- 更新
- 2026-03-18
法人ライセンス
¥ 5,800,000/年
LEGAL·TEXT / RAG 認証済
日本法令・判例コーパス 2026Q1
e-Gov 由来の現行法令と最高裁判例を構造化。チャンク分割済みで RAG 用途に最適。条文リンク、施行日メタデータ完備。
商用利用可再配布可(条件付)ParquetRAG最適化
- サイズ
- 8.1 GB
- 行数
- 2,800,000
- 提供
- 法文研究所
- 更新
- 2026-04-02
法人ライセンス
¥ 2,400,000/年
FINANCE·TEXT 認証済
上場企業 有価証券報告書 2005–2025
EDINET 由来の有報データ。セクション分割+XBRL タグ付与で、財務モデル学習や抽出タスクに最適。
商用利用可モデル学習可JSONLXBRL
- サイズ
- 142 GB
- reports
- 86,000
- 提供
- ファイナンシャルAI
- 更新
- 2026-04-05
法人ライセンス
¥ 1,200,000/年
JAPANESE·INSTRUCTION TUNING 認証済
日本語 高品質インストラクションチューニング v3
120万件の高品質な指示-応答ペア。法務・医療・製造など専門領域を重点的に収録した、日本語特化のインストラクションチューニング用データセット。人手レビューと毒性フィルタを適用済みで、商用モデルの学習に即利用可能。
商用利用可モデル学習可再配布不可JSONL人手レビュー済
- サイズ
- 3.2 GB
- 行数
- 1,214,892
- 提供
- 絆リサーチ株式会社
- 更新
- 2026-04-10
法人ライセンス
¥ 1,800,000/年〜
MULTI-SPEAKER·TTS / VC / ASR 認証済
日本語 多話者音声データセット(感情なし)
200話者がニュートラルな発話でテキストを読み上げた汎用音声データセット。年代・性別のバランスを考慮した話者構成で、多話者TTS・声質変換(VC)・ASR学習データ増強など幅広い用途に対応。合成データ技術で低コストを実現。
商用利用可モデル学習可合成データ200話者感情なし
- サイズ
- 52 GB
- hours
- 100
- 提供
- Hen&Ai 株式会社
- 更新
- 2026-04-17
法人ライセンス
¥ 98,000〜148,000(話者数により変動)