type
status
date
slug
summary
tags
category
icon
password
📢
新增支持数据集可视化,使用方法见Ghlerrix/DataAnalyze: Object-detection dataset analyze (github.com)
平时我们经常需要对我们的数据集进行各种分析,以便我们找到更好的提高方式。所以我将我平时分析数据集的一些方法打包发布在了Github上,分享给大家,有什么错误和意见,请多多指教!
 

图片数量、标注框数量、类别信息

这些信息会在终端打印出来,格式如下:

所有图片宽度和高度的散点图

这里只有一个点,是因为所有的图片尺寸相同
notion image

所有标注框宽度和高度的散点图

notion image
## 标注框宽度和高度之比 横坐标为比率,纵坐标为数量
notion image

每一类的标注框数量

notion image
notion image

每一类图片数量

notion image
notion image

每一张图片上的标注框数量

横坐标为一张图片上的标注框数量,纵坐标为图片数量
notion image

不同尺寸的图片数量

根据coco的划分规则计算
notion image
notion image

使用方法

Install

Usage

  • type The format of the dataset, optional ‘coco’ or ‘voc’.
  • path The path of dataset. If type is ‘coco’, the path is the json file path. If type is ‘voc’, the path is the path of the xml file directory.
  • -out is the output directory, default is ‘./out’

Example

 
 
利用Github Action定时推送sitemap至搜索引擎Severstal 数据集转成coco格式
Ghlerrix
Ghlerrix
山高水长,怕什么来不及,慌什么到不了。
公告
type
status
date
slug
summary
tags
category
icon
password
这是新版的博客,想要访问旧版页面请使用以下链接。