- Sarcasm Corpus V2
使用该数据集进行训练 得到模型,并对其进行检测。 - 若想查看讽刺语句 可运行view_data
依次运行每一块即可
链接: https://pan.baidu.com/s/1Btkmx-3orPr5zLrbz-k9qA 提取码: xnyq
原模型的名字为 my_model_old.h5
用train_v3.py训练的模型为 my_model.h5
train_v5.py第一次训练 即 my_model_v5_v1.h5
python版本 3.10
numpy 1.24.4
keras 2.10.0
tensorflow-gpu 2.10.0
pip install -r requirements.txt
code1是原始版本,在使用已经训练好的模型和tokenizer时出现问题。
code1_v2已经修改了这个问题。
在predicate_v2.py中 更新 可输入 自定义语句 来判断是否讽刺。
- train_v2.py 与 train.py 的数据集的标签都存在问题
- train_v3.py修改了这个问题
可直接使用命令
python train_v3.py
需下载数据集,将data与train.py放在同一文件夹下。
或直接使用
python train_v4.py
可在config中修改数据集位置
- 1.predicate.py 版本需修改代码中的 new_texts
- 2.predicate_v2.py 版本 在运行后 通过输入自定义语句来判断是否讽刺
如想结束输入 使用exit结束输入,并对已输入的数据进行预测。