如何提高存储、传输效率?参数集约型掩码网络效果显著


为了处理更复杂的任务,近年来神经网络的规模也在不断变大,如何高效的储存和传输神经网络变得十分重要。另一方面,随着*假说(Lottery Ticket Hypothesis (LTH))的提出,随机稀疏神经网络最近展现出很强的潜力,如何利用这种潜力来提高网络的存储和传输效率也很值得探索。

来自美国东北大学和罗切斯特理工的研究者提出参数集约型掩码网络(Parameter-Efficient Masking Networks (PEMN))。作者首先探索了有限数量随机数生成的随机网络的表征能力。实验表明,即使网络由有限数量的随机数生成,通过选择不同的子网络结构,其依然具有很好的表征能力。

通过这种探索性实验,作者自然地提出使用一组有限数量随机数作为 prototype,结合一组 mask 来表达一个神经网络。因为有限数量的随机数和二值的 mask 占用很少的储存空间,作者以此来提出一种新的思路来进行网络压缩。文章已被 NeurIPS 2025 接受。代码已开源。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

  • 论文地址: https://arxiv.org/abs/2210.06699
  • 论文代码:  https://github.com/yueb17/PEMN

1. 相关研究

MIT 研究人员提出*假说 Lottery Ticket Hypothesis (ICLR’19):在一个随机初始化网络中,存在一个*子网络(winning ticket)在被单独训练的情况下达到很好的效果。*假说探索了随机稀疏网络的可训练性。Uber 研究人员提出 Supermask (NeurIPS’19):在一个随机初始化网络中,存在一个子网络,可以直接用来做推断而不需要训练。Supermask 探索了随机稀疏网络的可用性。华盛顿大学研究人员提出 Edge-Popup (CVPR’20):通过反向传播学习子网络的 mask,大幅提升了随机稀疏网络的可用性。

2. 研究动机 / 流程

以上相关研究从不同角度探索了随机稀疏网络的潜力,如可训练性和可用性,其中可用性也可以理解为表征能力。在此工作中,作者感兴趣的是由随机数生成的神经网络在不训练权重的情况下有多强的表征能力。随着对该问题的探索,作者提出了 Parameter-Efficient Masking Networks (PEMN)。自然地,作者运用 PEMN 为网络压缩提供了一种新的思路,并作为一个例子对 PEMN 的潜在应用场景进行探索。

3. 探索随机数构成的神经网络的表征能力

给定一个随机网络,作者选择 Edge-Popup 算法在其中选择子网络来探索其表征能力。不同的是,相对于对整个网络进行随机初始化,作者提出了三种参数集约型的网络生成策略来使用一个 prototype 构建随机网络。

  • One-layer: 选择网络中重复结构的权重作为 prototype 来填充其他的与之结构相同的网络层。
  • Max-layer padding (MP): 选择参数量最多的网络层作为 prototype 并且截断相应的参数量来填充其他网络层。
  • Random vector padding (RP): 选择一定长度的随机向量作为 prototype 并对其进行复制来填充整个网络。

三种不同的随机网络生成策略把网络中不重复参数值(unique values)的数量逐步变小,我们基于不同策略得到的随机网络来选择子网络,从而探索了有限数量随机数生成的随机网络的表征潜力。

上图展示了使用 ConvMixer 和 ViT 网络 CIFAR10 图像分类的实验结果。Y 轴为准确率,X 轴为使用不同策略得到的随机网络。随之 X 轴的变大,随机网络中不重复随机数数量逐渐变小 (RP 后的数字表示相比较于 MP,RP 中不重复随机数数量的比例)。

根据实验结果,我们观察到即使随机网络只有非常有限的不重复随机数(比如 PR_1e-3),依然可以很好的维持选择出来的子网络的表征能力。至此,作者通过不同的随机网络生成策略,探索了有限数量随机数构成的神经网络的表征能力并观察到即使不重复随机数非常有限,其对应的随机网络依然可以很好地对数据进行表征。

同时作者基于这些随机网络生成策略,结合所得到的子网络掩码,提出了 Parameter-Efficient Masking Networks(PEMN)这种新的神经网络类型。

4. 一种新的网络压缩思路

本文选择了神经网路压缩为例来拓展 PEMN 的潜在应用。具体来说,文中所提出的不同随机网络生成策略可以高效的使用 prototype 来代表完整的随机网络,尤其是最细粒度的 random vector padding (RP)策略。

作者使用 RP 策略中的随机向量 prototype 和与之对应的一组子网络掩码来表示一个随机网络。在其中 prototype 需要保存浮点数格式,而掩码只需要保存成二值格式。因为 RP 中的 prototype 长度可以很短(因为有限数量的不重复随机数仍有很强的表征能力),所以表示一个神经网络的开销会变得很小,即储存一个长度有限的浮点数格式的随机向量和一组二值格式的掩码。相比较于传统的稀疏网络储存子网络的浮点值,本文提出了一种新的网络压缩思路用来高效的储存和传输神经网络。

在上图中,作者使用 PEMN 对网络进行压缩并与传统的网络剪枝方法进行对比。实验使用 ResNet 网络在 CIFAR 数据集做图像分类任务。我们观察到,新的压缩方案表现普遍优于传统的网络剪枝,尤其是在很高的压缩率下,PEMN 仍然可以维持较好的准确率。

5. 结论

本文受近来随机网络展现出来的潜力所启发,提出不同种参数集约策略来构建随机神经网络,进而探索了在只有有限的不重复随机数的情况下所生成的随机神经网络的表征潜力,并提出参数集约型掩码网络 Parameter-Efficient Masking Networks (PEMN)。作者将 PEMN 应用到网络压缩的场景中探索了其在实际应用方面的潜力并且为网络压缩提供了一种新的思路。作者提供了广泛的实验,表明即使随机网络中只有非常有限的不重复随机数,通过子网络的选择,其依然有较好的表征能力。此外,相比较于传统剪枝算法,实验表明新提出的方法可以取得更好的网络压缩效果,验证了 PEMN 在该场景下的应用潜力。


# edge  # prototype  # padding  # github  # 算法  # https  # 随机数  # 很好  # 掩码  # 提出了  # 可用性  # 中不  # 相比较  # 较好  # 情况下  # 很强 


相关栏目: 【 Google疑问12 】 【 Facebook疑问10 】 【 网络优化91478 】 【 技术知识72672 】 【 云计算0 】 【 GEO优化84317 】 【 优选文章0 】 【 营销推广36048 】 【 网络运营41350 】 【 案例网站102563 】 【 AI智能45237


相关推荐: 雷小兔ai智能写作如何生成文案_雷小兔ai智能写作文案生成场景选择【攻略】  轻松生成二维码:免费AI工具终极指南  AI聊天机器人引发伦理思考:泰国老人在Facebook上遭遇情感欺骗悲剧  ROBLOX Brookhaven:惊悚友谊与校园秘密(2025版)  AI助手高效获取谷歌评论:提升本地商家曝光率的终极指南  Universe:用 iPhone 在 5 分钟内打造网站的终极指南  如何用AI帮你快速理解API文档?开发者必备高效技巧  雷小兔ai智能写作如何生成日记_雷小兔ai智能写作日记模板调用【步骤】  利用MECLABS AI解决业务难题:实用指南  如何用AI设计一个Logo?5个步骤教你打造专属品牌标志  Google AI Studio文本转语音教程:零成本创作高质量音频  ChatGPT 4.0赋能室内设计:20+实用技巧提升工作效率  Recall:打造你的AI知识库,提升记忆力与效率  宠物翻译App评测:与猫狗交流的未来科技?  怎么用AI学习新知识?3步教你构建个人知识库  百度APP搜索框ai怎么关 百度APP搜索框ai图标去除  正确安装梁托:终极指南与常见错误规避  Saregama Carvaan: 5000首经典歌曲唤醒你的回忆  MetaGPT:AI驱动的软件开发团队,颠覆传统编码模式  AI绘图软件怎么用_AI绘图软件使用方法详细指南【教程】  掌握写作技巧:小说情节设计的核心要素解析  Beats to Rap On AI Stem Splitter:终极音乐创作工具  2025 YouTube自动化终极指南:利用AI实现高效内容创作和多平台发布  CareerCraft AI:提升大学生实习就业的智能平台  AI简历优化指南:如何让你的简历轻松通过ATS筛选系统  豆包AI怎么生成员工成长总结_豆包AI成长指标提取与案例编写【方法】  EdrawMax AI:项目管理和创意专业人士的终极图表工具  Tamilnad Mercantile Bank TMB:如何在线下载账户报表  Straico团队案例研究:AI赋能,效率提升的秘诀  GitHub Copilot CLI:终端中的 AI 编码助手  豆包AI怎么关闭消息推送_通知与提醒管理设置教程  稿定设计AI抠图怎样调整透明度_稿定设计AI透明度滑块与渐变设置【攻略】  教你用AI一键为代码添加注释,小白也能读懂复杂程序  ChatGPT一键生成PPT怎么加动画_ChatGPTPPT动画添加【指南】  SmartEbook AI:下一代电子书创作工具,轻松实现被动收入  腾讯混元图像3.0上线LiblibAI,80B参数助力创作者高效出图  千问怎样生成年度业绩分析_千问业绩分析模型与数据解读【攻略】  AI在建筑行业的革命:提升效率与优化流程  Agentic Testing入门:使用Playwright和Claude Code构建自动化框架  手相解析:生命线的形状与意义详解,预示健康、财富和命运  教你用AI一键生成Excel VBA脚本,彻底告别重复操作  AI驱动法律文件分类:效率提升与战略决策的新纪元  Voice AI:下一代AI语音助手,重塑人机交互  JSON Prompting: 创造爆款AI广告的秘诀和方法  Feelin网页版在线使用 Feelin官网登录入口  微信AI数字人怎样切换形象风格_微信AI数字人形象更换与风格选择【技巧】  通义万相做小红书配图怎么用_通义万相做小红书配图使用方法详细指南【教程】  免费高效获客!ChatGPT助你快速生成潜在客户名单  Midjourney怎么用一键生成logo_Midjourneylogo生成步骤【教程】  轻松制作圣经视频:无需露脸也能赚钱的教程 

 2023-04-12

了解您产品搜索量及市场趋势,制定营销计划

同行竞争及网站分析保障您的广告效果

点击免费数据支持

提交您的需求,1小时内享受我们的专业解答。

南京市珐之弘网络技术有限公司


南京市珐之弘网络技术有限公司

南京市珐之弘网络技术有限公司专注海外推广十年,是谷歌推广.Facebook广告全球合作伙伴,我们精英化的技术团队为企业提供谷歌海外推广+外贸网站建设+网站维护运营+Google SEO优化+社交营销为您提供一站式海外营销服务。

 87067657

 13565296790

 87067657@qq.com

Notice

We and selected third parties use cookies or similar technologies for technical purposes and, with your consent, for other purposes as specified in the cookie policy.
You can consent to the use of such technologies by closing this notice, by interacting with any link or button outside of this notice or by continuing to browse otherwise.