FiftyOne与CVAT基础使用

一、FiftyOne概述

FiftyOne是用于构建高质量数据集和计算机视觉模型的开源工具,由Python语言实现,支持Windows、Linux、macOS平台。FiftyOne 的设计目的是提供对数据集和标签的用户友好的视图 (包括注释和模型预测),可以使我们更快、更有效地可视化数据集和解释模型,从而增强机器学习工作流程。

1.FiftyOne核心能力

  • 导入数据集进行操作,轻松管理数据。

    • 支持通用格式与自定义格式
  • 评估模型。

  • 使嵌入数据和模型可视化。

  • 查找标注错误。

  • 管理数据集去除冗余图像。

2.FiftyOne核心概念:

  • Python库:提供的Python接口可轻松以多种常见格式加载数据集,并提供以自定义格式加载数据集。
  • App:一个图形用户界面,可快速直观了解数据集。
  • Brain:强大的机器学习驱动功能库,可提供对数据集的洞察并推荐修改数据集的方法,从而提高模型的性能。

3.应用范围

  • Evaluating object detections
  • Evaluating a classifier
  • Using image embeddings
  • Annotating with CVAT
  • Working with Open Images
  • Exploring image uniqueness
  • Finding class mistakes
  • Finding detection mistakes

4.FiftyOne加载各种环境的数据

1)加载本地数据

# On local machine
import fiftyone as fo

dataset = fo.Dataset("my-dataset")

session = fo.launch_app(dataset)  # (optional) port=XXXX

2)远程数据

  • 通过ssh访问

    • 在远程机器上使用 Python加载数据集并启动远程会话

      # On remote machine
      import fiftyone as fo
      
      dataset = fo.load_dataset(...)
      
      session = fo.launch_app(dataset, remote=True)  # optional: port=XXXX
      
    • 在本地计算机上打开一个新的终端窗口并执行以下命令来设置端口转发以连接到远程会话

      # On local machine
      ssh -N -L 5151:127.0.0.1:5151 [<username>@]<hostname>
      
    • 如果在本地计算机上安装了 FiftyOne,您可以 使用 CLI自动配置端口转发并在浏览器中打开应用程序

      # On local machine
      fiftyone app connect --destination [<username>@]<hostname>
      

3)云储存

You can work with data in cloud storage buckets in FiftyOne by mounting the buckets as local drives on a cloud compute instance. Such as AWS, Google Cloud, and Miscrosoft Azure.

二、CVAT概述

CVAT(Computer Vision Annotation Tool) 是由intel开源的,用于计算机视觉的免费、在线、交互式视频和图像注释工具。它支持监督与对象检测、图像分类和图像分割有关的机器学习任务。它使用户能够用四种类型的形状注释图像:框、多边形、折线和点 。

1.内部结构图

image
  • CVAT 容器运行supervisord进程,该进程在 Django* 环境中生成一些 Python* 进程。

  • Django 环境与两个数据库服务器一起工作。Redis* 服务器存储有关任务队列状态的信息,CVAT 数据库包含有关任务、用户、注释等的所有信息。PostgreSQL(以及开发期间的 SQLite3)用作 CVAT 的数据库管理系统. 所有数据都存储在cvat db volume中。以下卷被挂载到 CVAT 容器中:

    • cvat data volume
    • cvat keys volume
    • cvat logs volume
    • cvat shared volume
  • 分析系统包含包装在 Docker 容器中的 Elasticsearch、Logstash 和 Kibana。保存工作后,包括日志在内的所有数据都将传输到服务器。服务器将其传输到 Logstash 中进行过滤,然后日志被传输到 Elasticsearch,并存储在 cvat 事件卷中。之后,用户可以在 Kibana 中查看统计信息和日志。

三、FiftyOne与CVAT安装方法

1.FiftyOne安装

FiftyOne 目前需要 Python 3.6 - 3.9

sudo pip3 install fiftyone
# 如果要使用视频数据集,还要安装ffmpeg
sudo apt install -y ffmpeg

# 卸载FiftyOne
sudo pip3 uninstall fiftyone fiftyone-brain fiftyone-db

测试FiftyOne

import fiftyone as fo
import fiftyone.zoo as foz

dataset = foz.load_zoo_dataset("quickstart")
session = fo.launch_app(dataset)

创建 Python 虚拟环境

2.CVAT安装

1)通过docker安装

git clone https://github.com/opencv/cvat
cd cvat

export CVAT_HOST=your-ip-address
docker-compose up -d

# 为cvat创建superuser
docker exec -it cvat bash -ic 'python3 ~/manage.py createsuperuser'

2)添加共享目录

在cvat目录下添加 docker-compose.override.yml

version: '3.3'

services:
  cvat:
    environment:
      CVAT_SHARE_URL: 'Mounted from {/home/xbkj/nfs} host directory'
    volumes:
      - cvat_share:/home/django/share:ro

volumes:
  cvat_share:
    driver_opts:
      type: none
      device: /home/xbkj/nfs
      o: bind

  • 注意:CVAT new task时候,即使从share files加载图片,也会保存副本到openvino/cvat_server容器的/home/django/data/data。

    django@ef49752df789:~/data$ tree data
    data/
    ├── 2
    │   ├── compressed
    │   │   └── 0.zip
    │   ├── original
    │   │   └── 0.zip
    │   ├── preview.jpeg
    │   └── raw
    └── 3
        ├── compressed
        │   └── 0.zip
        ├── original
        │   └── 0.zip
        ├── preview.jpeg
        └── raw
    

同时运行多个yml

docker-compose -f docker-compose.yml -f docker-compose.override.yml up -d

四、CVAT使用说明

1.数据标注步骤

  • New annotation task

    • Name a task

    • Specify labels and their attributes

    • Choose files to download

      • Datasets are loaded from the local file system or a mounted file system inside a container.
      • A task can include one image archive, one video, a set or catalogue of images from shared storage.
    • additional options

    image
    • To specify the URL of a Git-repository for data storage (Dataset Repository)
    • To rotate all images 180 degrees (Flip Images)
    • To support the layers for a segmentation task (Z-Order)
    • To divide a huge dataset into a few smaller segments (Segment Size)
    • To specify the quality of uploaded images (Image Quality)
  • Users can follow any link to start the annotation process.

    • Each link inside the Jobs section corresponds to one segment.
    image
  • Users can use four shapes to annotate images: boxes, polygons (generally, for segmentation tasks), polylines (which can be useful for annotating roadmarks), and points (e.g., for annotating face landmarks or pose estimation).

    image
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 199,902评论 5 468
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 84,037评论 2 377
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 146,978评论 0 332
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 53,867评论 1 272
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 62,763评论 5 360
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,104评论 1 277
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,565评论 3 390
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,236评论 0 254
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,379评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,313评论 2 317
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,363评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,034评论 3 315
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,637评论 3 303
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,719评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,952评论 1 255
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,371评论 2 346
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 41,948评论 2 341

推荐阅读更多精彩内容

  • DTD 介绍 DTD(Document Type Definition 文档类型定义)是一组机器可读的规则,它们定...
    lio_zero阅读 2,572评论 0 9
  • 在忙碌完毕业设计的事情之后打算把《TensorFlow-实战Google深度学习框架》中六到十二章节的内容在这篇博...
    fatesnight阅读 462评论 0 0
  • 1. 账户 账户类型 Ethereum has two account types: Externally-own...
    龙小治阅读 1,771评论 0 2
  • 一、简介 DeepStream 是一个流式分析工具包,旨在构建 AI 支持的应用程序。它将流媒体数据作为输入(来自...
    Mr_Michael阅读 7,494评论 0 1
  • 16宿命:用概率思维提高你的胜算 以前的我是风险厌恶者,不喜欢去冒险,但是人生放弃了冒险,也就放弃了无数的可能。 ...
    yichen大刀阅读 6,026评论 0 4