Open Dataset
Data Structure ?
470.7M
Data Structure ?
*The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.
README.md
詐欺検出に使用する総合的な金融データセットPaySimモバイル通貨シミュレーターによって生成された総合的なデータセットです。金融データセットは、多くの研究者、特に詐欺検出分野で研究を行っている私たちにとって非常に重要です。問題の一つは、金融取引の本質的なプライベートな性質により、公開されている利用可能なデータセットが存在しないことです。
我々は、PaySimと呼ばれるシミュレーターによって生成された総合的なデータセットを使用することを提案し、このような問題を解決します。PaySimは、プライベートなデータセットからの集約データを使用して、通常の取引操作に似た合成データセットを生成し、悪意のある行動を注入して、後で詐欺検出方法の性能を評価します。
内容
PaySimは、アフリカのある国で実施されたモバイル通貨サービスの1か月間の財務ログから抽出された実際の取引サンプルに基づいて、モバイル通貨取引をシミュレートします。元のログは、現在世界中の14か国以上で運営されているモバイル金融サービスのプロバイダーである多国籍企業によって提供されました。この総合的なデータセットは、元のデータセットの1/4に縮小されています。
表頭
これは、見出しの説明付きの1行のサンプルです:
1,支払い,1060.31,C429214117,1089.0,28.69,M1591654462,0.0,0.0,0,0
ステップ - 現実世界の時間単位を表します。この場合、最初のステップには1時間かかります。総ステップ数は744(30日間のシミュレーション)です。
タイプ - 現金入金、現金出金、借方、支払い、および振り込みです。
金額 -
現地通貨で表された取引金額です。
nameOrig - 取引を開始した顧客
oldbalanceOrg - 取引前の初期残高
newbalanceOrig - 取引後の新しい残高
nameDest - 取引の受取人である顧客
oldbalanceDest - 取引前の受取人の初期残高です。注意:M(店舗)で始まる顧客に関する情報はありません。
newbalanceDest - 取引後の受取人の新しい残高です。注意:M(店舗)で始まる顧客に関する情報はありません。
isFraud - これは、シミュレーションにおいて詐欺的なエージェントによって行われた取引です。この特定のデータセットでは、エージェントの詐欺行為は、顧客の口座を管理または取得することで利益を得ることを目的とし、別の口座に振り込んでからシステムから現金を引き出すことで資金を空にしようとします。
isFlaggedFraud - このビジネスモデルは、ある口座から別の口座への大規模な振り込みを管理し、不正な試みを旗印付けすることを目的としています。このデータセットにおける不正な試みとは、1回の取引で200,000を超える振り込みを試みることを指します。
The dataset is currently being organized and other channels have been prepared for you. Please use them
The dataset is currently being organized and other channels have been prepared for you. Please use them
- Share your thoughts
ALL
Data usage instructions: h1>
I. Data Source and Display Explanation:
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
II. Ownership Explanation:
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
III. Data Reposting Explanation:
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
IV. Infringement and Handling Explanation:
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.