中文采用自主的一些数据集, 英文采用 SemEval2010_task8 数据 采用keras TensorFlow Backend 关系类型如下:
部分-整体(e1,e2)
部分-整体(e2,e1)
内容-容器(e1,e2)
内容-容器(e2,e1)
产品-生产者(e1,e2)
产品-生产者(e2,e1)
成员-组织(e1,e2)
1. 关系中文
中文识别直接采用tw_word2vec/output_zh.py脚本执行 采用BiLSTM,LSTM模型和CNN模型两个版本 代码中直接修改
中文启动见 trainer.py:
cd tw_word2veclocalhost:tw_word2vec tw$ python trainer.py
config = Configuration( position_matrix_file_path="../data/posi_matrix.npy", word2vec_file_path="../data/needed_zh_word2vec.pkl"