Open Dataset
Data Structure ?
169.94M
Data Structure ?
*The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.
README.md
私は日常的に英国の企業情報を扱っており、機械学習に利用できる形で、すべての活動中の企業のリストを公開すると便利だと思いました。
データセットには3,838,469行あり、各行が活動中の企業1社に対応しています。各行には、企業名、設立日、標準産業分類コードが含まれています。
この企業リストは、2017年11月1日に公開されたCompanies Houseのスナップショットに基づいています。
標準産業分類コードの説明は、gov.ukウェブサイトから取得しています。
AllCompanies.csvファイルの各行は以下のようにフォーマットされています。
- 企業名 - 英数字で表される企業名
- 設立日 - 英国式の日付フォーマット(dd/mm/yyyy)
- 標準産業分類コード - 5桁の数字、不明の場合はNone - 各コードの説明については別ファイルを参照してください。
**着想**
このデータの考えられる用途としては、機械学習を使って、同じ標準産業分類コードの他の企業の名称を参考にして、新しい、独特で適切な企業名を提案することが挙げられます。
また、企業名が時代とともにどのように進化してきたかを分析することもできます。
機械学習を使って、典型的な企業名の特徴を特定したり、企業名が長くなったり複雑になったりしているかどうかを分析することもできます。
このデータには、私には想像もつかないような数多くの利用可能性があると思います。
これは私がいずれかの媒体でデータセットを公開するということを2回目(初回は数時間前に公開しました)試みるものですので、有用なアドバイスやヒントは大歓迎です。
生データのソースへのリンクは以下の通りです。
- Companies House http://download.companieshouse.gov.uk/en_output.html
- 標準産業分類コード https://www.gov.uk/government/publications/standard-industrial-classification-of-economic-activities-sic
×
The dataset is currently being organized and other channels have been prepared for you. Please use them
The dataset is currently being organized and other channels have been prepared for you. Please use them
Note: Some data is currently being processed and cannot be directly downloaded. We kindly ask for your understanding and support.
No content available at the moment
No content available at the moment
- Share your thoughts
Go share your ideas~~
ALL
Welcome to exchange and share
Your sharing can help others better utilize data.
Data usage instructions: h1>
I. Data Source and Display Explanation:
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
II. Ownership Explanation:
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
III. Data Reposting Explanation:
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
IV. Infringement and Handling Explanation:
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.