このデータセットについて
首都圏・地方含む 1,200 時間分の同期済み走行データ。歩行者・二輪車の高精度ラベル付き。天候・時間帯・季節バランス考慮。
言語: 日本語 / 業界: 自動車 / タグ: 商用利用可 · NDA必須 · マルチモーダル · 高精度アノテーション
データの出自と同意
個別契約・NDA前提。商用モデル学習可。生データ再配布・派生物配布不可。
首都圏・地方含む 1,200 時間分の同期済み走行データ。歩行者・二輪車の高精度ラベル付き。天候・時間帯・季節バランス考慮。
首都圏・地方含む 1,200 時間分の同期済み走行データ。歩行者・二輪車の高精度ラベル付き。天候・時間帯・季節バランス考慮。
言語: 日本語 / 業界: 自動車 / タグ: 商用利用可 · NDA必須 · マルチモーダル · 高精度アノテーション
個別契約・NDA前提。商用モデル学習可。生データ再配布・派生物配布不可。
同一テキストを200話者 × 10感情 × 3段階の強度で発話した、感情制御TTSの学習に最適化された合成音声データセット。話者属性(年代・性別)のバランスと感情統制を両立。スタジオ収録と同等の品質を、合成データ技術により1/5〜1/10のコストで実現。
200話者がニュートラルな発話でテキストを読み上げた汎用音声データセット。年代・性別のバランスを考慮した話者構成で、多話者TTS・声質変換(VC)・ASR学習データ増強など幅広い用途に対応。合成データ技術で低コストを実現。
120万件の高品質な指示-応答ペア。法務・医療・製造など専門領域を重点的に収録した、日本語特化のインストラクションチューニング用データセット。人手レビューと毒性フィルタを適用済みで、商用モデルの学習に即利用可能。