安装教程
(✅这里是第一次安装时,整体的安装以及进入doccano界面的教程)
- 下载Anaconda,点击Next至安装完成(最好不要安装到C盘)
- 打开Anaconda Prompt,如果前面有base字样就是安装成功了
- 在命令行中创建一个新的环境,输入: conda create -n XXX python=XX (注意这里XXX表示环境名称,XX表示python的版本号,比如我要创建一个环境名为doccano且python版本为3.8的新环境: conda create -n doccano python=3.8 )
- 创建好以后激活新环境: conda activate XXX (这里XXX仍然是你的环境名,要和创建时一致)
- 进入新的环境后,输入pip install doccano 安装Doccano标注工具,安装后可以通过 pip list 查看安装列表中是否有Doccano确定是否安装成功
- 安装好后可以通过以下命令在命令行中初始化数据库,并创建用户:
|
|
- 创建用户后就可以开启服务,我们先在一个命令行中运行如下命令:
|
|
- 然后打开另一个终端或命令行,输入以下命令启动任务队列:
|
|
- 最后在浏览器中访问地址 http://127.0.0.1:8000 就可以打开Doccano工具进行标注了。Doccano初始界面:
使用教程
(✅这里是在安装好之后,后续再打开doccano继续使用的教程)
- 激活环境:conda activate XXX (这里XXX仍然是你的环境名,要和创建时一致)
|
|
- 进入相应的doccano环境之后,就可以开启服务,我们先在一个命令行中运行如下命令:
|
|
- 然后打开另一个终端或命令行,先输入:
|
|
进入doccano环境后,再输入以下命令启动任务队列:
|
|
- 最后在浏览器中访问地址 http://127.0.0.1:8000 就可以打开Doccano工具进行标注了。
doccano标注操作
- 输入创建用户时的用户名和密码后进入界面:
- 创建一个标注任务。点击Create,进入到如下界面:
- 选择序列标注(Sequence Labeling)任务进行实体标注,并填好项目名称等:
然后进入项目主界面: - 导入数据,点击Dataset选择导入数据,填好要导入的数据的格式,然后将数据拖到Drop files here处导入:
导入成功的界面如下: - 设置标签,在Labels一栏点击Actions,Create Label手动设置或者Import Labels从文件导入(这里选手动创建标签):
设置完成: - 点左侧Start Annotation开始标注,直接用鼠标选取文本即可标注实体:
- 标注好后导出数据,在Datasets一栏点击Actions → Export Dataset导出已标注的数据:
填好导出的格式,点Export: