Open Dataset
Data Structure ?
5.75M
Data Structure ?
*The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.
README.md
文脈
アブニーとバード(2010年)によって構想された[人間言語プロジェクト](http://www.anthology.aclweb.org/P/P10/P10-1010.pdf)のような広範なカバレッジを持つコーパスは、危機に瀕している言語の研究にとって強力な資源となるでしょう。
シードリングは、人間言語プロジェクトの種コーパスとして、幅広い言語をカバーするために作成されました(ガイら、2014年)。
TAUS(翻訳自動化ユーザー協会)もまた、[翻訳の能力と速度の需要に追いつくという文脈における人間言語プロジェクトの重要性](https://www.taus.net/think-tank/articles/translate-articles/the-call-for-the-human-language-project)を認識しています。TAUSによる人間言語プロジェクトの定義は、https://www.taus.net/knowledgebase/index.php/Human_Language_Project で見ることができます。
コーパスの使い方の詳細な説明は、https://github.com/alvations/SeedLing で見ることができます。
内容
このリポジトリのシードリングコーパスには、以下のデータが含まれています。
- **ODIN**:インターリニアテキストのオンラインデータベース
- **オムニグロット**:www.omniglot.com からの有用な外国語フレーズ
- **世界人権宣言**
謝辞
**引用**:
ガイ・エマーソン、タン・リリン、スーザンヌ・フェルトマン、アレクシス・パーマー、ミヒャエラ・レグネリ。2014年。シードリング:人間言語プロジェクトの種コーパスの構築と利用。危機に瀕している言語の研究における計算手法の利用(ComputEL)ワークショップの議事録。アメリカ合衆国ボルチモア。
@InProceedings{seedling2014,
author = {ガイ・エマーソン、タン・リリン、スーザンヌ・フェルトマン、アレクシス・パーマー、ミヒャエラ・レグネリ},
title = {シードリング:人間言語プロジェクトの種コーパスの構築と利用},
booktitle = {危機に瀕している言語の研究における計算手法の利用(ComputEL)ワークショップの議事録},
month = {6月},
year = {2014},
address = {アメリカ合衆国ボルチモア},
publisher = {計算言語学会},
pages = {},
url = {}
}
**参考文献**:
スティーブン・アブニーとスティーブン・バード。2010年。人間言語プロジェクト:世界の言語の普遍的なコーパスの構築。
計算言語学会第48回年次総会の議事録、88 - 97頁。
シメ・エイジャー。オムニグロット - 世界の表記体系と言語。
www.omniglot.com から取得。
ウィリアム・D・ルイスとフェイ・シャー。2010年。ODINの開発:世界の何百もの言語の注釈付き言語データの多言語リポジトリ。
文学と言語コンピューティング、25(3):303 - 319。
国連総会、世界人権宣言、
1948年12月10日、217 A (III)、入手先:
http://www.refworld.org/docid/3ae6b3712c.html
[2014年4月26日アクセス]
インスピレーション
このコーパスは、ザールラント大学で、言語学者、数学者、データギーク、そして[COLI部門](http://www.coli.uni-saarland.de/)の2人の素晴らしいメンターによって、1学期の間に作成されました。これは、異分野間の相乗効果と共通の目標がなければ不可能でした。
- 人間言語プロジェクトを拡張/探求する。
- 現地に行き、彼らの言語を記録/文書化する。それを計算機で読み取り可能にする。
- シードリングを育てる!
×
The dataset is currently being organized and other channels have been prepared for you. Please use them
The dataset is currently being organized and other channels have been prepared for you. Please use them
Note: Some data is currently being processed and cannot be directly downloaded. We kindly ask for your understanding and support.
No content available at the moment
No content available at the moment
- Share your thoughts
Go share your ideas~~
ALL
Welcome to exchange and share
Your sharing can help others better utilize data.
Data usage instructions: h1>
I. Data Source and Display Explanation:
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
II. Ownership Explanation:
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
III. Data Reposting Explanation:
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
IV. Infringement and Handling Explanation:
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.