Skip to content

Commit

Permalink
publish for yans2023 (classification task)
Browse files Browse the repository at this point in the history
  • Loading branch information
alquist4121 committed Aug 30, 2023
1 parent 02249ef commit a7e75f2
Show file tree
Hide file tree
Showing 15 changed files with 4,869 additions and 1 deletion.
39 changes: 38 additions & 1 deletion README.md
Original file line number Diff line number Diff line change
@@ -1,5 +1,42 @@
# KeiCOT
- KeiCOコーパス[[Liu+ 22]](https://github.com/Liumx2020/KeiCO-corpus)を元に構築された敬語理解タスク評価データセット
- Chain-of-Thoughtプロンプティング[[Wei+ 22]](https://arxiv.org/abs/2201.11903)の有用性を検証するために、CoTあり/なしのテストセットをそれぞれ含む

## Problems
- KeiCOから[explore_keico.ipynb](./explore_keico.ipynb)と、手動でのフィルタリングおよびアノテーションでデータセット[keicot_base.tsv](./data/keicot_base.tsv)を作成
- データセット70件から、5種類の各設定で問題を生成し、350件のテストセットを作成

```txt
1. 背景情報:常体文が正 発言文:常体文 ラベル:正解
2. 背景情報:常体文が正 発言文:敬体文 ラベル:不正解
3. 背景情報:敬体文が正 発言文:常体文 ラベル:不正解
4. 背景情報:敬体文が正 発言文:敬体文 ラベル:正解
5. 背景情報:敬体文が正 発言文:誤った敬体文 ラベル:不正解
```

### Prompt settings
- zero-shot w/o CoT
- zero-shot w/ CoT
- few-shot w/o CoT
- few-shot w/ CoT
(few-shot example num = 4)

## Predictions
### Models
- gpt-3.5-turbo
- gpt-4
### Hyperparameters
temperature = 0.0
```python
if do_cot:
max_tokens = 512
else:
max_tokens = 16
```

## Update
- 2023/08/31 正誤判定タスクでのテストセットと結果をアップ

## LICENSE
The KeiCOT dataset is under [CC-BY-4.0](
https://creativecommons.org/licenses/by/4.0/deed.ja).
https://creativecommons.org/licenses/by/4.0/deed.ja).
71 changes: 71 additions & 0 deletions data/keicot_base.tsv

Large diffs are not rendered by default.

350 changes: 350 additions & 0 deletions data/predictions/predictions_gpt-3.5-turbo_fewshot_cot.txt

Large diffs are not rendered by default.

350 changes: 350 additions & 0 deletions data/predictions/predictions_gpt-3.5-turbo_fewshot_noncot.txt
Original file line number Diff line number Diff line change
@@ -0,0 +1,350 @@
はい
はい
いいえ
いいえ
いいえ
いいえ
いいえ
いいえ
いいえ
いいえ
はい
いいえ
いいえ
いいえ
いいえ
はい
いいえ
いいえ
いいえ
いいえ
はい
はい
いいえ
はい
はい
いいえ
いいえ
いいえ
いいえ
いいえ
はい
いいえ
いいえ
いいえ
いいえ
はい
いいえ
いいえ
はい
はい
はい
はい
いいえ
はい
はい
はい
はい
いいえ
はい
はい
はい
いいえ
いいえ
いいえ
いいえ
はい
いいえ
いいえ
いいえ
いいえ
はい
いいえ
いいえ
いいえ
いいえ
はい
いいえ
はい
はい
はい
はい
いいえ
いいえ
いいえ
いいえ
はい
いいえ
いいえ
はい
はい
はい
いいえ
いいえ
いいえ
いいえ
はい
はい
いいえ
いいえ
いいえ
はい
いいえ
いいえ
いいえ
はい
いいえ
はい
いいえ
いいえ
いいえ
はい
いいえ
いいえ
はい
はい
はい
はい
いいえ
いいえ
いいえ
はい
はい
いいえ
いいえ
いいえ
いいえ
いいえ
いいえ
いいえ
いいえ
はい
いいえ
いいえ
いいえ
いいえ
はい
はい
いいえ
いいえ
いいえ
はい
いいえ
いいえ
いいえ
いいえ
はい
はい
いいえ
いいえ
いいえ
いいえ
いいえ
いいえ
はい
はい
はい
いいえ
いいえ
いいえ
いいえ
いいえ
はい
いいえ
いいえ
いいえ
はい
はい
はい
はい
はい
はい
いいえ
はい
はい
はい
いいえ
いいえ
いいえ
いいえ
いいえ
いいえ
いいえ
いいえ
いいえ
いいえ
はい
はい
いいえ
はい
いいえ
はい
いいえ
はい
はい
はい
はい
いいえ
いいえ
いいえ
いいえ
いいえ
いいえ
いいえ
いいえ
いいえ
はい
はい
はい
はい
はい
はい
いいえ
いいえ
いいえ
いいえ
はい
いいえ
いいえ
いいえ
いいえ
はい
はい
いいえ
いいえ
いいえ
いいえ
いいえ
いいえ
はい
はい
はい
いいえ
いいえ
いいえ
いいえ
いいえ
いいえ
いいえ
いいえ
いいえ
いいえ
いいえ
いいえ
いいえ
いいえ
いいえ
いいえ
いいえ
いいえ
いいえ
はい
はい
いいえ
はい
はい
はい
はい
はい
はい
はい
はい
いいえ
いいえ
いいえ
いいえ
はい
いいえ
いいえ
はい
いいえ
はい
いいえ
いいえ
はい
いいえ
はい
はい
いいえ
いいえ
はい
はい
はい
いいえ
いいえ
はい
はい
いいえ
いいえ
はい
はい
いいえ
はい
いいえ
はい
いいえ
はい
いいえ
いいえ
いいえ
いいえ
いいえ
はい
いいえ
いいえ
いいえ
いいえ
いいえ
いいえ
いいえ
いいえ
いいえ
はい
いいえ
はい
はい
いいえ
いいえ
いいえ
はい
はい
はい
はい
いいえ
はい
はい
はい
はい
いいえ
いいえ
いいえ
いいえ
はい
いいえ
はい
いいえ
はい
いいえ
いいえ
いいえ
いいえ
はい
はい
はい
はい
はい
はい
いいえ
いいえ
はい
はい
いいえ
いいえ
いいえ
はい
はい
はい
はい
いいえ
はい
はい
Loading

0 comments on commit a7e75f2

Please sign in to comment.