Open Dataset
Data Structure ?
2.31M
Data Structure ?
*The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.
README.md
まず、不器用なニューヨークのストック写真についてお詫び申し上げます。これは、カグルの厳格な1900×600の解像度要件を満たし、なんとなく関連性があると感じられる唯一の高解像度のオプションでした。
### 背景
数ヶ月前、ジェニファー・アームストロングの『セックス アンド ザ シティと私たち』というショーに関する本が出版された機会に、私は『セックス アンド ザ シティ』の全エピソードのデータ分析を[公開しました][1]。このプロセスでは、通常の音声テキスト変換のデータスクレイピング手法では信頼性がある結果を得ることができず、唯一有効な方法は古き良きスプレッドシートへのデータ入力です。私たちの何人かが全エピソードを見て、セリフを一行ずつ書き起こしました。それは苦痛でしたが、今やこれがカグル上にあるので、これから誰もこの作業を再度行う必要はありません。
### 内容
キャラクター別にセリフを分類すると、以下のようになります。
![ここに画像の説明を入力][2]
つまり、キャリーのセリフが多く、3人のメインキャラクターのセリフも多く、他のキャラクターのセリフは少ないです。ただし、キャラクター間に区切りがない場合でも、一部のキャラクターは別々のセリフを持っています(例えば、1行目はキャリーのセリフ、2行目はキャリーのセリフ、3行目はミランダのセリフなど)。私はこの問題を修正する予定ですが、現時点では、同じキャラクターの続く行を結合する必要があります。
合計で796人の一意の登場人物がいて、彼ら全員が話すセリフは約4万行あります。
さらに、私たちは、『セックス アンド ザ シティ』のキャラクターがデートした相手の職業を明示しています。たとえば、「一方、シャーロットはダウンタウンで、[弁護士/投資銀行家など]のジャックと一緒だった」といった内容です。女性たちが誰とデートするかを見ることで、このショーの社会経済学について多くのことが明らかになり、これを分析することは、このショーから掘り出せる最も興味深い情報の1つでした。これも手作業で行わなければならず、職業のカテゴリを正規化する試みも行われました(例えば、「神経外科医」と「家庭医」はどちらも「医師」として扱われます)。
### 謝辞
このショーを見て、このデータをまとめるのを手伝ってくれた皆さんに心から感謝します。また、本を書いて、洞察を共有してくれたジェニファー・アームストロングにも感謝します。
[1]: https://www.ceros.com/originals/sex-and-the-city/
[2]: https://i.imgur.com/hPJDnhR.png
×
The dataset is currently being organized and other channels have been prepared for you. Please use them
The dataset is currently being organized and other channels have been prepared for you. Please use them
Note: Some data is currently being processed and cannot be directly downloaded. We kindly ask for your understanding and support.
No content available at the moment
No content available at the moment
- Share your thoughts
Go share your ideas~~
ALL
Welcome to exchange and share
Your sharing can help others better utilize data.
Data usage instructions: h1>
I. Data Source and Display Explanation:
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
II. Ownership Explanation:
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
III. Data Reposting Explanation:
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
IV. Infringement and Handling Explanation:
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.