Open Dataset
Data Structure ?
220.02M
Data Structure ?
*The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.
README.md
ダウンロード元: http://quantum-machine.org/datasets/
概要
新しい医薬品や材料のコンピュータによるデノボ設計には、化学化合物空間の厳密かつ偏りのない探索が必要です。しかし、その規模が分子サイズと組み合わせ的に拡大するため、未踏の広大な領域が残っています。我々は、CHONFから構成される134,000個の安定した小さな有機分子について、計算された幾何学的、エネルギー的、電子的、および熱力学的特性を報告します。これらの分子は、1660億個の有機分子からなるGDB - 17化学宇宙のうち、重原子(CONF)が最大9個の全133,885種のサブセットに相当します。我々は、エネルギーが最小の幾何学構造、対応する調和振動数、双極子モーメント、分極率、並びに原子化エネルギー、エンタルピー、および自由エネルギーを報告します。すべての特性は、量子化学のB3LYP/6 - 31G(2df,p)レベルで計算されました。さらに、最も多い化学量論式C7H10O2については、134,000個の分子の中に6,095個の構造異性体が存在します。我々は、すべての構造異性体について、より正確なG4MP2理論レベルで原子化エネルギー、エンタルピー、および自由エネルギーを報告します。このように、このデータセットは、小さな有機分子の関連性のある、一貫性のある、包括的な化学空間に関する量子化学的特性を提供します。このデータベースは、既存の方法のベンチマーク評価、ハイブリッド量子力学/機械学習などの新しい方法の開発、および構造 - 特性関係の系統的な特定に役立つ可能性があります。
figshareを通じてダウンロード可能です。
引用方法 このデータセットを使用する際には、以下の2つの論文を引用するようにしてください。
L. Ruddigkeit, R. van Deursen, L. C. Blum, J.-L. Reymond, 化学宇宙データベースGDB - 17における1660億個の有機小分子の列挙, J. Chem. Inf. Model. 52, 2864–2875, 2012.
R. Ramakrishnan, P. O. Dral, M. Rupp, O. A. von Lilienfeld, 134,000個の分子の量子化学構造と特性, Scientific Data 1, 140022, 2014. [bibtex]
×
The dataset is currently being organized and other channels have been prepared for you. Please use them
The dataset is currently being organized and other channels have been prepared for you. Please use them
Note: Some data is currently being processed and cannot be directly downloaded. We kindly ask for your understanding and support.
No content available at the moment
No content available at the moment
- Share your thoughts
Go share your ideas~~
ALL
Welcome to exchange and share
Your sharing can help others better utilize data.
Data usage instructions: h1>
I. Data Source and Display Explanation:
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
II. Ownership Explanation:
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
III. Data Reposting Explanation:
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
IV. Infringement and Handling Explanation:
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.