加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

labelImg图片标签工具处理中文类别标签

(2017-07-09 10:02:58)
分类: 程序语言
1)使用说明
pyrcc4 -o resources.py resources.qrc

python labelImg

# cd到labelImg目录
# 第一条指令只在第一次使用时需要执行
# 此后使用只需要执行第二个指令

2)预定义类名为中文时保存xml出现乱码问题
预定义类名存在data\predefined_classes.txt中,逐行存放
labelImg在生成xml时,使用python的xml.etree.ElementTree进行添加xml子项。但是其生产的xml字符串是一行排放,而不是一个标签一行有格式的排放,所以作者使用lxml对生成的xml字符串进行格式化。
1.原始代码
rough_string = ElementTree.tostring(elem, 'utf8')
root = etree.fromstring(rough_string)
return etree.tostring(root, pretty_print=True)
# 由上可以看出rough_string是utf-8编码,而由lmxl得到格式化后的xml字符串并没指定utf-8编码。而再保存字
# 符串却以utf-8保存就出现了中午乱码。
2.修改
# 因此只需指定lxml的编码为utf-8就行了
return etree.tostring(root, encoding="utf8", pretty_print=True)

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有