Featured image of post Doccano工具安装 + 使用

Doccano工具安装 + 使用

安装教程

(✅这里是第一次安装时,整体的安装以及进入doccano界面的教程)

  1. 下载Anaconda,点击Next至安装完成(最好不要安装到C盘)
  2. 打开Anaconda Prompt,如果前面有base字样就是安装成功了 25
  3. 在命令行中创建一个新的环境,输入: conda create -n XXX python=XX (注意这里XXX表示环境名称,XX表示python的版本号,比如我要创建一个环境名为doccano且python版本为3.8的新环境: conda create -n doccano python=3.8 )
  4. 创建好以后激活新环境: conda activate XXX (这里XXX仍然是你的环境名,要和创建时一致) 26
  5. 进入新的环境后,输入pip install doccano 安装Doccano标注工具,安装后可以通过 pip list 查看安装列表中是否有Doccano确定是否安装成功
  6. 安装好后可以通过以下命令在命令行中初始化数据库,并创建用户:
1
2
3
4
# 初始化数据库
doccano init
# 创建一个用户:admin和pass改成你特定的账号和密码
doccano createuser --username admin --password pass
  1. 创建用户后就可以开启服务,我们先在一个命令行中运行如下命令:
1
2
# 启动webserver,port后是端口号
doccano webserver --port 8000
  1. 然后打开另一个终端或命令行,输入以下命令启动任务队列:
1
2
# 启动任务队列
doccano task
  1. 最后在浏览器中访问地址 http://127.0.0.1:8000 就可以打开Doccano工具进行标注了。Doccano初始界面: 27

使用教程

(✅这里是在安装好之后,后续再打开doccano继续使用的教程)

  1. 激活环境:conda activate XXX (这里XXX仍然是你的环境名,要和创建时一致)
1
conda activate doccano
  1. 进入相应的doccano环境之后,就可以开启服务,我们先在一个命令行中运行如下命令:
1
doccano webserver --port 8000
  1. 然后打开另一个终端或命令行,先输入:
1
conda activate doccano

进入doccano环境后,再输入以下命令启动任务队列:

1
doccano task
  1. 最后在浏览器中访问地址 http://127.0.0.1:8000 就可以打开Doccano工具进行标注了。

doccano标注操作

  1. 输入创建用户时的用户名和密码后进入界面: 28
  2. 创建一个标注任务。点击Create,进入到如下界面: 29
  3. 选择序列标注(Sequence Labeling)任务进行实体标注,并填好项目名称等: 30
    然后进入项目主界面: 31
  4. 导入数据,点击Dataset选择导入数据,填好要导入的数据的格式,然后将数据拖到Drop files here处导入: 32
    导入成功的界面如下: 33
  5. 设置标签,在Labels一栏点击Actions,Create Label手动设置或者Import Labels从文件导入(这里选手动创建标签): 34
    设置完成: 35
  6. 点左侧Start Annotation开始标注,直接用鼠标选取文本即可标注实体: 36
  7. 标注好后导出数据,在Datasets一栏点击Actions → Export Dataset导出已标注的数据: 37
    填好导出的格式,点Export: 38
页面浏览量Loading
明天一定会有好事发生哦⭐
😎总访客数:Loading🥰总访问量:Loading 👻数据统计

使用 Hugo 构建
主题 StackJimmy 设计