
書籍「DataRobotではじめるビジネスAI入門」では、基本的に二値分類問題のサンプルデータを使って解説しています。そのほかの機械学習問題を試してみたい場合は、下表のデータ列のリンクからサンプルデータをダウンロードしてください。
トライアル版をお使いの場合
トライアル版には、お試しユースケース(データセット)が内蔵されています。下表を参照して、お好きなユースケースをお試しください。
ユースケース |
問題の種類 |
業種 |
モデルの目的 |
予測ターゲット列 |
再入院 |
二値分類 |
ヘルスケア |
再入院のリスクが高い糖尿病患者を識別する |
再入院 |
夢の野球チームの予測 |
連続値 |
スポーツ分析 |
前年の成績に基づいて翌年の選手の価値の見積もる |
WOBA Weighted On-Base Average: 打者が1打席あたりにどれだけチームの得点増加に貢献したかを表す指標
|
Plant Disease Detection |
多値分類 |
農業 |
植物の葉の画像から、その植物が病気でないか、病気の場合は、病気の種類を推定する |
Class |
予防保全 |
二値分類 |
オイル・ガス |
油田掘削装置の故障を検知する |
故障 |
ローンの債務不履行リスクの理解 |
二値分類 |
銀行業 |
住宅ローンの債務不履行を予測する |
貸し倒れ |
ローンの繰上支払いを予測 |
二値分類 |
銀行業 |
住宅ローンの返済が早期に終了する可能性があるかを予測する |
解約 |
戦略的疑惑リスト |
連続値 |
セキュリティ |
要因分析:高いSSLスコアを算出する重要な要因を識別する |
SSLスコア SSL:Strategic Suspect List
|
鋼板の欠陥の予測 |
二値分類 |
製造 |
品質の低い鋼板を検知する |
欠陥 |
ローンの債務不履行を予測 |
二値分類 |
フィンテック |
融資希望者の債務不履行リスクを予測する |
貸し倒れ |
不正請求検知
|
二値分類
|
保険
|
自動車保険の保険金請求の不正を検知する
|
保険金詐欺 |
ターゲット化された顧客サービス
|
多値分類
|
テレコミュニケーション
|
各顧客に最適な製品を推定する
|
提案プラン
|
マネーロンダリング防止アクティビティスコアリング
|
二値分類
|
銀行業
|
疑わしい取引(マネーロンダリング)を検知する
|
疑わしい取引 |
保険の統計的推測
|
連続値
|
保険
|
事故により傷害を受けた従業員に支払う保険金を予測する
|
発生保険金
|