法人向けAI学習データセットマーケットプレイス
絆データセットカタログ
Kizuna Dataset Catalogue
WEB / NEWS·TEXT 認証済データセット

日本語ニュース記事コーパス 2010–2025

提携メディア 23 社から正規ライセンス下で収集した記事全文。ジャンル・地域・日付のメタデータ付き。

ID
KDC-2026-0412
バージョン
v2026.4
サイズ
48 GB
件数
12,400,000
更新日
2026-04-12
フォーマット
Parquet

このデータセットについて

提携メディア 23 社から正規ライセンス下で収集した記事全文。ジャンル・地域・日付のメタデータ付き。

言語: 日本語 / 業界: メディア / タグ: 商用利用可 · モデル学習可 · 再配布不可 · Parquet

データの出自と同意

メディア23社との正規契約。商用学習可。生記事の再配布・派生配布は不可。

関連データセット