法人向けAI学習データセットマーケットプレイス

FINANCE·TEXT 認証済データセット

上場企業有価証券報告書 2005–2025

EDINET 由来の有報データ。セクション分割＋XBRL タグ付与で、財務モデル学習や抽出タスクに最適。

KDC-2026-0405

バージョン

v2026.1

サイズ

142 GB

件数

86,000

更新日

2026-04-05

フォーマット

JSONL / XBRL

このデータセットについて

EDINET 由来の有報データ。セクション分割＋XBRL タグ付与で、財務モデル学習や抽出タスクに最適。

言語: 日本語 / 業界: 金融 / タグ: 商用利用可 · モデル学習可 · JSONL · XBRL

データの出自と同意

公開情報の構造化。商用・学習・派生物配布可。生データ再配布不可。

関連データセット

EMOTIONAL TTS·SPEECH

日本語感情発話データセット

同一テキストを200話者 × 10感情 × 3段階の強度で発話した、感情制御TTSの学習に最適化された合成音声データセット。話者属性（年代・性別）のバランスと感情統制を両立。スタジオ収録と同等の品質を、合成データ技術により1/5〜1/10のコストで実現。

MULTI-SPEAKER·TTS / VC / ASR

日本語多話者音声データセット（感情なし）

200話者がニュートラルな発話でテキストを読み上げた汎用音声データセット。年代・性別のバランスを考慮した話者構成で、多話者TTS・声質変換（VC）・ASR学習データ増強など幅広い用途に対応。合成データ技術で低コストを実現。

¥ 98,000〜148,000（話者数により変動）

JAPANESE·INSTRUCTION TUNING

日本語高品質インストラクションチューニング v3

120万件の高品質な指示-応答ペア。法務・医療・製造など専門領域を重点的に収録した、日本語特化のインストラクションチューニング用データセット。人手レビューと毒性フィルタを適用済みで、商用モデルの学習に即利用可能。

上場企業 有価証券報告書 2005–2025

このデータセットについて

データの出自と同意

関連データセット

日本語 感情発話データセット

日本語 多話者音声データセット（感情なし）

日本語 高品質インストラクションチューニング v3

上場企業有価証券報告書 2005–2025

日本語感情発話データセット

日本語多話者音声データセット（感情なし）

日本語高品質インストラクションチューニング v3