Open Dataset
Data Structure ?
231.72M
Data Structure ?
*The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.
README.md
私は日常的に英国の企業情報を扱っており、機械学習に利用できる形で、すべての現存企業のリストを公開すると便利だと思いました。
データセットには3,801,733行あり、各行は現存する各企業に対応しています。データセットに含まれる郵便番号は地理的位置が特定されており、その結果として得られた緯度と経度が、標準産業分類コード(SICコード)および設立日とともに含まれています。
この企業リストは、2017年11月1日に公開されたCompanies Houseのスナップショットに基づいています。
郵便番号の地理的位置情報とSICコードは、gov.ukウェブサイトから取得したものです。
ファイルAllCompanies.csvの各行は以下のようにフォーマットされています。
- 会社番号 - イングランド/ウェールズの場合は99999999、スコットランドの場合はSC999999、北アイルランドの場合はNI999999の形式。
- 設立日 - 英国式の日付形式、dd/mm/yyyy
- 登記住所郵便番号 - 標準的な英国式の郵便番号形式
- 緯度 - 小数点以下6桁
- 経度 - 小数点以下6桁
- SIC - 5桁の数字、または不明の場合はNone - 各コードの説明については別ファイルを参照。
**着想**
このデータの可能な用途としては、英国で特定のタイプの企業がどこに位置しているか、そして時間の経過とともにどのように増殖し、英国全体に広がっているかを調べることが挙げられます。
機械学習アルゴリズムを訓練して、特定のタイプの企業の密度が高い(または低い)地域を予測したり、企業が最小限の競争を望む場合に最適な立地場所や、逆に企業密度が高いクラスターがあり、専門スタッフの採用が容易な地域を予測することができます。
有益な追加情報として、人口密度を重ね合わせることが考えられます。私は現在、このデータセットにそのオプションを追加する作業を行っています。
このデータには、私には想像もできないほど多くの可能性があると確信しています。
これは私が初めてどのような媒体でもデータセットを公開する試みですので、有用なアドバイスやヒントは大歓迎です。
生データのソースへのリンクは以下の通りです。
- Companies House
http://download.companieshouse.gov.uk/en_output.html
- 郵便番号から地理的位置情報へ
https://data.gov.uk/dataset/national-statistics-postcode-lookup-uk
- SICコード
https://www.gov.uk/government/publications/standard-industrial-classification-of-economic-activities-sic
×
The dataset is currently being organized and other channels have been prepared for you. Please use them
The dataset is currently being organized and other channels have been prepared for you. Please use them
Note: Some data is currently being processed and cannot be directly downloaded. We kindly ask for your understanding and support.
No content available at the moment
No content available at the moment
- Share your thoughts
Go share your ideas~~
ALL
Welcome to exchange and share
Your sharing can help others better utilize data.
Data usage instructions: h1>
I. Data Source and Display Explanation:
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
II. Ownership Explanation:
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
III. Data Reposting Explanation:
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
IV. Infringement and Handling Explanation:
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.