Open Dataset
Data Structure ?
57.78M
Data Structure ?
*The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.
README.md
顧客サービスにおける関係戦略(RSiCS)データセット
旅行と通信の分野における3つの実稼働顧客サービス用インテリジェントバーチャルエージェント(IVA)のヒューマンコンピュータデータを収集し、アノテーターはユーザーの意図を判断する上で不要とみなされるすべてのテキストをマークしました。複数のアノテーターの選択を統合して強調表示されたテキストを作成した後、強調表示されたセクションに存在する言語のクラス、例えば挨拶、背景説明、正当化、感謝、怒りの発散、または感情の存在などを判断するために、2回目のアノテーションを行いました。この結果得られたコーパスは、IVAの品質と関係能力を向上させるための貴重なリソースです。
データ
データは4つのソースから収集されました。3つの商用顧客サービスIVAの会話ログと、2016年8月のTripAdvisor.comの航空会社フォーラムです。
ファイルで使用されるデータセット番号:
TripAdvisor.com航空会社フォーラム
鉄道旅行IVA
航空旅行IVA
通信サポートIVA
ファイル内容とフォーマット
x_y_align.csv アノテーターxと、データセットyにおける彼らのグループ内の他のすべてのアノテーターとのアライメント。 列: アノテーターA ID:x アノテーターB ID:アライメントスコアがxと比較して計算されるアノテーター。 グループID:比較されるユーザーが所属する4人のアノテーターのグループ。 データセットID:リクエストが発生したデータセットy。 リクエストID:異なるファイル間で結合できるようにするためのリクエストの一意のID。 テキスト:元のリクエストテキスト。 アノテーターAテキスト:アノテーターAによる選択が[ ]内に含まれるリクエストテキスト。 アノテーターBテキスト:アノテーターBによる選択が[ ]内に含まれるリクエストテキスト。 長さ:列6の元のリクエストテキストの文字数(n)。 エラー:AとBの二値判断が一致しない文字位置の数(e)。 アライメントスコア:align = (n - e) / nによって計算されるアライメント。 合意:AとBが選択が必要であるかどうかについて合意するかどうか。 all_data_by_threshold.csv 選択が閾値によって統合されたすべてのリクエスト。各リクエストは、各統合閾値について1回ずつ、合計4回繰り返されます。 列: データセットID:リクエストが発生したデータセット。 グループID:選択が発生した4人のアノテーターのグループ。 リクエストID:異なるファイル間で結合できるようにするためのリクエストの一意のID。 MultiIntent:少なくとも1人のアノテーターがテキストに複数のユーザー意図が含まれているとフラグを立てた場合は1、そうでない場合は0。 閾値:選択を統合するための閾値(i)。 MergedSelections:少なくともi人のアノテーターが文字を不要とマークした場合、それは[ ]で示される選択された部分に含まれます。 Unselected:MergedSelectionsの[ ]に含まれないすべてのテキスト。 Selected:MergedSelectionsの[ ]に含まれるすべてのテキスト。 Removed:統合された選択によって元のリクエストから削除されたテキストの量:length(Selected) / n tagged_selections_by_sentence.csv 1回目のアノテーションで行われた選択に存在する関係言語をタグ付けする2回目のアノテーション。all_data_by_threshold.csvにあるMultiIntentとしてマークされていないリクエストのみを含みます。 列: データセットID:リクエストが発生したデータセット。 グループID:選択が発生した4人のアノテーターのグループ。 リクエストID:異なるファイル間で結合できるようにするためのリクエストの一意のID。 閾値:選択を統合するための閾値(i)。 MergedSelections:少なくともi人のアノテーターが文字を不要とマークした場合、それは[ ]で示される選択された部分に含まれます。 Unselected:MergedSelectionsの[ ]に含まれないすべてのテキスト。 Selected:MergedSelectionsの[ ]に含まれるすべてのテキスト。 Greeting:Selectedに何らかの挨拶(こんにちは、お元気ですか)が存在する場合。 Backstory:Selectedに自己開示言語が存在する場合。ユーザーが聴衆に自分自身、自分の状況、エージェントに連絡するきっかけや質問する理由を話しています。 Justification:Selectedに正当化言語が存在する場合。ユーザーが自分のリクエストや声明が真実であることを信頼性を高めるために事実を提示しています。また、解決が必要な理由や、何かが解決されない場合の結果も含まれます。 Rant:Selectedに怒りの発散が存在する場合。過度の不平や不満の表明、または否定的な叙述。 Gratitude:Selectedに過去または将来の助けに対する何らかの感謝の表現が存在する場合。 Other:Selectedの強調表示されたセクションの一部またはすべてに関係言語が含まれない場合。ユーザーが提供した追加の事実であるが、アノテーターがユーザーの意図を判断する上で不要と判断したもの、または「手伝ってくれますか」などの一般的な質問である可能性があります。 Express Emotion:SelectedにRantに含まれない感情言語が存在する場合 all_multi_intent.csv 少なくとも1人のアノテーターによって複数の意図が含まれているとフラグが立てられたすべてのリクエスト。複数の意図検出戦略を開発するのに役立ちます。 列: データセットID:リクエストが発生したデータセット。 グループID:選択が発生した4人のアノテーターのグループ。 リクエストID:異なるファイル間で結合できるようにするためのリクエストの一意のID。 テキスト:元のリクエストテキスト。 Annotator x:アノテーターxがテキストに複数の意図が存在すると信じた場合は1、そうでない場合は0。
×
The dataset is currently being organized and other channels have been prepared for you. Please use them
The dataset is currently being organized and other channels have been prepared for you. Please use them
Note: Some data is currently being processed and cannot be directly downloaded. We kindly ask for your understanding and support.
No content available at the moment
No content available at the moment
- Share your thoughts
Go share your ideas~~
ALL
Welcome to exchange and share
Your sharing can help others better utilize data.
Data usage instructions: h1>
I. Data Source and Display Explanation:
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
II. Ownership Explanation:
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
III. Data Reposting Explanation:
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
IV. Infringement and Handling Explanation:
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.