讯飞2025-LED灯的色彩和均匀性检测挑战赛得分0.905


本文介绍讯飞2025年LED灯色彩和均匀性检测挑战赛的解决方案。使用PaddleClas套件的HRNet_W18_C模型,通过解压含中文路径的数据集,对负样本进行翻转等增强,调整正负样本比例至1:1,按8:1分训练集和测试集,训练后得0.90574分暂列第四。还提及可尝试更多模型和数据增强方法提分。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

讯飞-2025:LED灯的色彩和均匀性检测挑战赛

赛题描述: 工业自动化质检成为了当下主流与趋势,在整个质检中视觉质检又是重中之重。使用AI的先进视觉技术应用在工业质检领域。

比赛任务: 根据提供的数据集,来预测测试集的数据是否为良品(颜色,缺损和是否成像均匀)。

本项目特点: 无需修改代码,及其容易上手,且能够一举获得高分

数据集示例:

正样本:

       

负样本:

       

分析

由上图可以看出,LED的质检,主要是判断LED光环的完整性和光滑性,并不存在特别复杂的特征,对于大型分类模型,在这样的数据集上表现可能并不佳,因此,我们选择 HRNet_W18_C 模型进行训练。

PaddleClas介绍

飞桨图像识别套件 PaddleClas 是飞桨为工业界和学术界所准备的一个图像识别和图像分类任务的工具集,助力使用者训练出更好的视觉模型和应用落地。

PaddleClas为使用者提供了大量的优质模型,详细模型信息可参考: 链接

       

本Baseline采用PaddleClas套件进行训练,在讯飞提交界面获得了0.90574的分数,暂列 4/17 .

       

与第一名差距极小,文末将会介绍提分方法

解压数据集

由于数据集取材于原始比赛界面,故含有中文路径,在解压后会显示乱码,但不影响程序的读取。

In [ ]
!unzip -oq data/data153476/LED灯的色彩和均匀性检测挑战赛公开数据.zip -d data/
   

数据集增强(初步)

通过观察数据集,正样本数量达到了451张,负样本数据只有41张,两种数据相差十倍,故首先使用翻转等简单操作增强负样本数据。

增强后的数据集存储在intensify文件夹下

In [ ]
import osimport cv2

bad_path = 'data/LED╡╞╡─╔л▓╩║═╛∙╘╚╨╘╝ь▓т╠Ї╒╜╚№╣л┐к╩¤╛▌/╤╡┴╖╝п/┤╬╞╖'a = os.listdir(bad_path)for i in a:    if i[-4:] != '.jpg':        continue
    print(bad_path+'/'+i)
    img = cv2.imread(bad_path+'/'+i)
    cv2.imwrite( './intensify/'+i, img)
    img_flip = cv2.flip(img, 1)
    cv2.imwrite( './intensify/'+i[:-4]+'1.jpg', img_flip)
    img_transpose = cv2.transpose(img)
    cv2.imwrite('./intensify/'+i[:-4]+'2.jpg', img_transpose)
    img_flip = cv2.flip(img_transpose, 1)
    cv2.imwrite('./intensify/'+i[:-4]+'3.jpg', img_flip)
    img_flip = cv2.flip(img_transpose, -1)
    cv2.imwrite('./intensify/'+i[:-4]+'4.jpg', img_flip)
   

创建数据集列表

读取原始正样本数据和增强后的负样本数据,由于正样本数据相互之间差异不大,故我们进读取其中一半图像,使得正负样本之间比例近似为1: 1

再通过随机分配的方式按1: 8的比例裁减为测试集和训练集

In [32]
import osimport random

bad_path = 'intensify'good_path = 'data/LED╡╞╡─╔л▓╩║═╛∙╘╚╨╘╝ь▓т╠Ї╒╜╚№╣л┐к╩¤╛▌/╤╡┴╖╝п/┴╝╞╖'bad_imgs = os.listdir(bad_path)
good_imgs = os.listdir(good_path)with open('datasets.txt', 'w') as f:    for i in bad_imgs:        if i[-4:] != '.jpg':            continue
        s = bad_path+'/'+i+' '+'1\n'
        f.writelines(s)
    tot = 0
    for i in good_imgs:
        tot += 1
        if tot >= 200:            break
        if i[-4:] != '.jpg':            continue
        s = good_path+'/'+i+' '+'0\n'
        f.writelines(s)with open('datasets.txt','r') as f:
    a = f.readlines()    with open('train.list','w') as ff:        with open('valid.list','w') as fff:            for i in a:
                n = random.randint(0, 9)                if n >= 8:
                    fff.write(i)                else:
                    ff.write(i)
   

克隆PaddleClas

最新版本为2.4版本,但本人习惯了2.3版本,新版本中包含了一些新加入的模型,可以进一步尝试

In [ ]
!git clone https://github.com/PaddlePaddle/PaddleClas.git --branch release/2.3
   

安装依赖

将修改后的配置文件放入PaddleClas

将修改后的预测文件放入engine,此文件可以直接生成submit所需的csv文件

In [ ]
!pip install -r PaddleClas/requirements.txt
!cp HRNet_W18_C.yaml PaddleClas/ppcls/configs/ImageNet/HRNet/
!cp engine.py PaddleClas/ppcls/engine/
   

训练

由于数据集少且模型较小,训练可以在几十分钟内完成

In [ ]
!python PaddleClas/tools/train.py \
    -c PaddleClas/ppcls/configs/ImageNet/HRNet/HRNet_W18_C.yaml \    # -o Arch.pretrained=output/EfficientNetB4/best_model \
    -o Global.device=gpu
   

预测

预测完成后会在主目录下生成test.csv文件,下载后前往讯飞赛题界面上传即可

In [ ]
!python PaddleClas/tools/infer.py \
    -c PaddleClas/ppcls/configs/ImageNet/HRNet/HRNet_W18_C.yaml \
    -o Global.pretrained_model=output/HRNet_W18_C/best_model
   

改进方法:

  • PaddleClas套件提供了大量的模型,可以尝试更多相似大小的模型或者更好的方法,HRNet_W18_C是本人以直觉选取的方案,并不是最优
  • 数据增强方面仅使用了图像翻转,且翻转的方向不全,可以进一步增强数据后重复训练


# 又是  # 重中之重  # 相互之间  # 可以直接  # 达到了  # 所需  # 会在  # 两种  # 将会  # python  # 套件  # 自动化  # igs  # csv文件  # ai  # 工具  # git 


相关栏目: 【 Google疑问12 】 【 Facebook疑问10 】 【 网络优化91478 】 【 技术知识72672 】 【 云计算0 】 【 GEO优化84317 】 【 优选文章0 】 【 营销推广36048 】 【 网络运营41350 】 【 案例网站102563 】 【 AI智能45237


相关推荐: Lovart AI设计助手:AI驱动设计,零成本开启创意新纪元  使用Agent AI Book Cover Creator轻松设计吸睛图书封面  数据集中化:提升AI效率,节省企业时间与成本的终极指南  利用 DeepSeek 进行大规模 C++ 代码库审计  如何用AI帮你把小说改编成电影剧本?3步掌握核心技巧  热门科技新闻:BetterHelp、Photoshop AI、AMD CPU及NVIDIA显卡  斑马AI能否关联学校教材_斑马AI教材同步与版本匹配【技巧】  宝可梦化石精灵大揭秘:晶灿钻石视角下的精灵演化  AI赋能播客:十大AI播客工具助力内容创作  AI赋能音频转录:SovereignAudio自托管解决方案  Google AI Studio Build模式更新:免费AI应用开发新纪元  百度ai助手通知栏怎么关 百度ai助手通知消息屏蔽  Google AI Studio文本转语音教程:零成本创作高质量音频  Midjourney怎样做PPT模板_MidjourneyPPT模板生成【方法】  小米汽车OTA冬季大版本升级:新增和优化共计9项功能  定价3499炒到1.2万,豆包AI手机遭“封杀”,变革之路何去何从?  即梦ai能否生成节日主题插画_即梦ai节日主题关键词与元素库使用【攻略】  探索Roblox:虚拟角色定制与互动乐园  Google NotebookLM:AI赋能的智能笔记与思维导图工具  AI海报设计终极指南:用ChatGPT和ImageFX轻松创建专业级海报  钉钉ai划词工具怎么使用划词查词_钉钉ai划词工具查词入口与释义查看【指南】  AI赋能保险销售:提升邮件营销效果的终极指南  N8N工作流:自动化知识管理与智能问答解决方案  ChatGPT如何进行数据可视化构思 ChatGPT图表设计指南  豆包AI能否生成领导汇报版总结_豆包AI汇报版精简与结构调整【教程】  Ifor Williams拖车终极指南:农场主的选择和省税秘诀  探索占星术:揭秘 कुंडली 中的 शुक्र,财富与运势的钥匙  AI项目管理软件如何利用自然语言处理?全面解析  AGI未来展望:DeepMind CEO的深度解读与行业洞察  Character AI终极指南:构建你的人工智能伴侣,探索无限可能  AI网站构建指南:Duda平台免费创建教程  韵律分析:为什么理解音乐歌词的韵式至关重要?  New You KIN Skin Analyzer:焕发肌肤新生的终极指南  百度AI搜索能否查实时新闻_百度AI搜索新闻频道与更新频率【方法】  美食ASMR:感官盛宴与解压体验  ChatGPT 提示词工程:结构化指令编写指南  Gamma做年终总结PPT怎么用_Gamma做年终总结PPT使用方法详细指南【教程】  DeepSeek编程怎么用_DeepSeek编程使用方法详细指南【教程】  lovemo手机网页版入口 lovemo官网登录网址  AI赋能项目管理:5个实用技巧提升效率  挖掘用户数据:洞察与策略,提升播客全球影响力  kimi如何导出对话_导出对话内容方法【攻略】  2025年AI图像生成指南:Google Gemini Nano Banana教程  怎么用ai生成配色方案 AI设计色彩搭配与灵感获取【技巧】  FundView贷款管理:贷款汇总生成器提升效率  Google Gemini 对复杂物理解题过程的逐步解析  千问怎么用提示词生成演讲稿_千问演讲稿提示词框架与开场【教程】  ChatGPT打造AI助手:10倍提升效率,掌控你的生活  微信AI数字人怎样创建_微信AI数字人创建流程与形象定制【教程】  百度输入法全感官ai怎么关 百度输入法全感官皮肤关闭 

 2025-07-25

了解您产品搜索量及市场趋势,制定营销计划

同行竞争及网站分析保障您的广告效果

点击免费数据支持

提交您的需求,1小时内享受我们的专业解答。

南京市珐之弘网络技术有限公司


南京市珐之弘网络技术有限公司

南京市珐之弘网络技术有限公司专注海外推广十年,是谷歌推广.Facebook广告全球合作伙伴,我们精英化的技术团队为企业提供谷歌海外推广+外贸网站建设+网站维护运营+Google SEO优化+社交营销为您提供一站式海外营销服务。

 87067657

 13565296790

 87067657@qq.com

Notice

We and selected third parties use cookies or similar technologies for technical purposes and, with your consent, for other purposes as specified in the cookie policy.
You can consent to the use of such technologies by closing this notice, by interacting with any link or button outside of this notice or by continuing to browse otherwise.