【文本标注】文本标注工具brat的使用
2019常用NLP标注工具简单介绍
NLP标注工具:
YEDDA:(2016)(python)(可以在windows上装)
优点是安装方便,程序很小,标注方便,如果要实现给同一个实体加多个标签,也可以实现。最大标签数8,界面也还过的去。
https://github.com/jiesutd/YEDDA
Doccano:(2019)(可以在windows上装)
支持命名实体识别,情感分类,机器翻译任务,界面比较友好。
https://github.com/doccano/doccano
Prodigy(2017):
实体标注、分类标注,情感标注,都是英文的,功能最全的。
https://prodi.gy/docs/
Chinese-Annotator:(2017)
基于prodigy的中文标注工具
https://github.com/deepwel/Chinese-Annotator
Brat:(2010)
支持实体、关系、事件抽取的标注。可以标注情感。
优点在标注实体的同时可以进行关系标注,还可以实现二级标注。
在线试用:http://weaver.nlplab.org/~brat/demo/latest/#/
IEPY:
主要用来信息抽取和关系抽取任务
https://github.com/machinalis/iepy
DeepDive:
主要用来关系抽取任务,17就停止更新了
http://deepdive.stanford.edu/#documentation
小结:
选用Brat是因为有现成的中文情感标注,还有Brat有关系标注
选用Doccano是它的页面很友好,而且可添加的标签数也比较多
选用YEDDA是它完全用Python桌面开发且支持中文
选用Prodigy是因为支持标注的功能最全
打标工具brat的安装与使用