Open Dataset
Data Structure ?
59.81M
Data Structure ?
*The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.
README.md
ローンデフォルト予測
L&Tファイナンシャルサービスとアナリティクスヴィディヤが「データサイエンスフィンハック」を開催します。ここでは、機械学習のさまざまなアルゴリズムを使用して、顧客が最初の分割払い(EMI)でデフォルト(支払い滞納)するかどうかを予測しました。
問題の説明:車両ローンのデフォルト予測
金融機関は、車両ローンのデフォルトにより多大な損失を被っています。これにより、車両ローンの審査基準が厳格化され、車両ローンの拒否率が上昇しています。これらの機関からは、より良い信用リスクスコアリングモデルの必要性も提起されています。このため、車両ローンのデフォルトの決定要因を推定する研究が必要とされています。ある金融機関があなたを雇い、ローン借入者が車両ローンの最初の分割払い(EMI)の期日にデフォルトする確率を正確に予測するよう依頼しています。データセットには、ローンおよび借入者に関する以下の情報が提供されています。
借入者情報(年齢、収入、身分証明書などの人口統計データ)
ローン情報(支払い詳細、金額、EMI、ローン対資産価値比率など)
信用情報機関データと履歴(信用情報機関スコア、現有口座の数、他のローンの状況、信用履歴など)
これを行うことで、返済能力のあるクライアントが拒否されることがなく、デフォルト率を最小限に抑えるためにさらに利用できる重要な決定要因を特定することができます。
データの説明
train.csvが含まれており、train.csvには、データ辞書に記載されているようなローンの詳細を含む学習データが含まれています。データ辞書には、学習データとtest.csvに含まれる各変数の簡単な説明が記載されています。test.csvには、参加者がデフォルトの確率を提出する対象のすべての顧客とローンの詳細が含まれています。
submission.csvには、テストセットに対する予測の提出形式が含まれています。1つのcsvファイルを提出する必要があります。
評価指標
提出物は、予測確率と観測された目標値の間のROC曲線下の面積で評価されます。
データ辞書:
変数名 説明
UniqueID 顧客の識別子
loan_default 期日における最初の分割払い(EMI)の支払いデフォルト
disbursed_amount 支払われたローンの金額
asset_cost 資産のコスト
ltv 資産に対するローンの比率
branch_id ローンが支払われた支店
supplier_id ローンが支払われた車両販売店
manufacturer_id 車両メーカー(ヘロ、ホンダ、TVSなど)
Current_pincode 顧客の現在の郵便番号
Date.of.Birth 顧客の生年月日
Employment.Type 顧客の雇用形態(給与所得者/自営業者)
DisbursalDate 支払い日
State_ID 支払いが行われた州
Employee_code_ID 支払いを記録した組織の従業員
MobileNo_Avl_Flag 顧客が携帯電話番号を提供した場合は1とフラグ付け
Aadhar_flag 顧客がアダールカードを提供した場合は1とフラグ付け
PAN_flag 顧客がパンカードを提供した場合は1とフラグ付け
VoterID_flag 顧客が選挙人名簿カードを提供した場合は1とフラグ付け
Driving_flag 顧客が運転免許証を提供した場合は1とフラグ付け
Passport_flag 顧客がパスポートを提供した場合は1とフラグ付け
PERFORM_CNS.SCORE 信用情報機関スコア
PERFORM_CNS.SCORE.DESCRIPTION 信用情報機関スコアの説明
PRI.NO.OF.ACCTS 支払い時点で顧客が取得した総ローンの数 プライマリ口座は、顧客が個人使用のために取得した口座です
PRI.ACTIVE.ACCTS 支払い時点で顧客が取得した現有ローンの数
PRI.OVERDUE.ACCTS 支払い時点でのデフォルト口座の数
PRI.CURRENT.BALANCE 支払い時点での現有ローンの未返済元本総額
PRI.SANCTIONED.AMOUNT 支払い時点ですべてのローンに対して承認された総額
PRI.DISBURSED.AMOUNT 支払い時点ですべてのローンに対して支払われた総額
SEC.NO.OF.ACCTS 支払い時点で顧客が取得した総ローンの数 セカンダリ口座は、顧客が共同申請者または保証人として関与している口座です
SEC.ACTIVE.ACCTS 支払い時点で顧客が取得した現有ローンの数
SEC.OVERDUE.ACCTS 支払い時点でのデフォルト口座の数
SEC.CURRENT.BALANCE 支払い時点での現有ローンの未返済元本総額
SEC.SANCTIONED.AMOUNT 支払い時点ですべてのローンに対して承認された総額
SEC.DISBURSED.AMOUNT 支払い時点ですべてのローンに対して支払われた総額
PRIMARY.INSTAL.AMT プライマリローンの分割払い(EMI)金額
SEC.INSTAL.AMT セカンダリローンの分割払い(EMI)金額
NEW.ACCTS.IN.LAST.SIX.MONTHS 支払い前の過去6ヶ月間に顧客が取得した新しいローン
DELINQUENT.ACCTS.IN.LAST.SIX.MONTHS 過去6ヶ月間にデフォルトしたローン
AVERAGE.ACCT.AGE 平均ローン期間
CREDIT.HISTORY.LENGTH 最初のローン以来の期間
NO.OF_INQUIRIES 顧客がローンに関して行った照会の数
×
The dataset is currently being organized and other channels have been prepared for you. Please use them
The dataset is currently being organized and other channels have been prepared for you. Please use them
Note: Some data is currently being processed and cannot be directly downloaded. We kindly ask for your understanding and support.
No content available at the moment
No content available at the moment
- Share your thoughts
Go share your ideas~~
ALL
Welcome to exchange and share
Your sharing can help others better utilize data.
Data usage instructions: h1>
I. Data Source and Display Explanation:
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
II. Ownership Explanation:
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
III. Data Reposting Explanation:
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
IV. Infringement and Handling Explanation:
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.