Open Dataset
Data Structure ?
0.91M
Data Structure ?
*The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.
README.md
プロジェクトの説明
パラディスコーパスは、英語を第二言語として学んでいる25人の子供たち(英語学習者または追加言語として英語を学ぶ学習者)の自然主義的な言語サンプルで構成されています。転記は英語の正書法のみで行われており、この研究には音声転記は含まれていません。転記内容に含まれる人物や場所の実名はすべて化名に置き換えられています。参加者は4文字のコードで識別されます。
内容
このコーパスのデータは2002年にカナダのエドモントンで収集されました。子供たちは自宅で学生研究助手との会話を約45分間ビデオ撮影されました。この間、研究助手は「面接」質問のリストを持っていました。もし子供が独自の話題を持ち出して会話が進んだ場合、質問は行われませんでした。このデータセットには、2002年のデータ収集の第一段階のデータのみが含まれています。完全な縦断的コーパスは、こちらのCHILDESウェブサイトで見ることができます:http://childes.talkbank.org/access/Biling/Paradis.html
これらのデータは.chaファイル形式で、CLANプログラム(http://alpha.talkbank.org/clan/)で使用することを想定しています。ただし、これらのファイルを生テキストファイルとして扱い、1行に1つの発話断片を入れることもできます。@で始まる行はメタデータです。
ファイル形式の情報:
* *EXP: 実験者の発話
* *CHI: 子供の発話
* %[一部のテキスト]: これらの行には言語以外の情報が含まれています
人物情報
この研究の参加者は、カナダに新しく移住した(移民や難民)家族の子供たちです。子供たちは、平均4歳11ヶ月で母語(L1)が確立された後、英語を第二言語(L2)として学習を始めました。以下の表で、「AOA」は家族が移住したときの子供の「到着時の年齢」を指します。数字「1」はカナダで生まれた子供を示しています。「AOE」の列は英語習得の開始年齢を指します。すべての年齢は月単位です。以下の表には、各子供の母語(L1)と性別も記載されています。
この研究の参加者や手順に関する詳細情報については、以下を参照してください。
Paradis, J. (2005). Grammatical morphology in children learning English as a second language: Implications of similarities with Specific Language Impairment. Language, Speech and Hearing Services in the Schools, 36, 172 - 187.
Golberg, H., Paradis, J. & Crago, M. (2008). Lexical acquisition over time in minority L1 children learning English as a L2. Applied Psycholinguistics, 29, 1 - 25.
着想:
* 子供たちの母語は、彼らが使用する英語の単語に影響を与えますか?何語の単語に影響を与えますか?
* 一部の子供は他の子供よりも頻繁に一時停止((.)または(..)とマークされている)することがありますか?
* 異なる年齢の子供たちは、より頻繁に話を中断/重複することがありますか?(テキストの周りに<>でマークされています。)
* 子供たちが最初に英語に触れた年齢は、彼らが「えーと」と言う頻度に影響を与えますか?(「& - um」と転記されています。)
関連データセット:
* [子供たちはいつ単語を学ぶのか?](https://www.kaggle.com/rtatman/when - do - children - learn - words)
* [子供の特定言語障害の診断](https://www.kaggle.com/dgokeeffe/specific - language - impairment)
×
The dataset is currently being organized and other channels have been prepared for you. Please use them
The dataset is currently being organized and other channels have been prepared for you. Please use them
Note: Some data is currently being processed and cannot be directly downloaded. We kindly ask for your understanding and support.
No content available at the moment
No content available at the moment
- Share your thoughts
Go share your ideas~~
ALL
Welcome to exchange and share
Your sharing can help others better utilize data.
Data usage instructions: h1>
I. Data Source and Display Explanation:
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
II. Ownership Explanation:
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
III. Data Reposting Explanation:
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
IV. Infringement and Handling Explanation:
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.