null - 程序员宅基地

过分！虾皮被曝大范围毁约；深度学习技巧全辑；MongoDB开源替代 4.7K★；剑指Offer解题代码；大数据算法笔记汇总；前沿论文 | ShowMeAI资讯日报-程序员宅基地

技术标签： ShowMeAI资讯日报首席AI资讯收纳官计算机视觉人工智能 pytorch transformer mongodb

ShowMeAI日报系列全新升级！覆盖AI人工智能工具&框架 | 项目&代码 | 博文&分享 | 数据&资源 | 研究&论文等方向。点击查看 历史文章列表，在公众号内订阅话题 #ShowMeAI资讯日报，可接收每日最新推送。点击 专题合辑&电子月刊 快速浏览各专题全集。点击这里回复关键字日报免费获取AI电子月刊与资料包。

太过分！虾皮Shopee新加坡被曝大范围毁约，马上入职被收回offer，猝不及防

Shopee 是新加坡互联网集团SEA旗下的明星公司，在东南亚的电商业务领域大杀四方，能在多个市场压制阿里旗下的 Lazada，承担着『东南亚最像中国互联网大厂的超级公司』期待，也成为中国互联网人才涌入新加坡最热门的目的地。

然而，不少求职者在脉脉爆出，自己临近入职却被 Shopee 通知收回 Offer。签了合同，拿了签证，租了房子，买了机票，甚至已经落地新加披，工作却没了。签证、工作、回国成本等问题都很棘手，完全措手不及。

工具&框架

『lm-debugger』用于检查和调整基于transformer语言模型的交互式工具

https://github.com/mega002/lm-debugger

LM-Debugger 是一个开源的交互式工具，用于检查和调整基于 transformer 的语言模型。GitHub 上的资源库包括在 GPT2 Large 和 GPT2 Medium 上运行 LM-Debugger 所需的代码和数据文件的链接，它可以快速适应于其他模型，只需要改变后台的 API。

『camviz』单目深度估计结果可视化库

https://github.com/TRI-ML/camviz

https://www.tri.global/

CamViz 是一个由TRI-ML团队开发的可视化库，目的是为单目深度估计结果的可视化提供一个接口，包括深度图和重建的点云。它使用PyGame进行窗口显示和输入管理，并使用OpenGL进行二维和三维绘图和渲染。它提供了一种简单而直观的方式将信息存储为纹理和数据缓冲区，以便高效显示，也能快速创建用于图像显示的2D环境和用于点云可视化的3D环境。

『surgeon-pytorch』检视PyTorch模型中间层的工具库

https://github.com/archinetai/surgeon-pytorch

surgeon-pytorch 是一个辅助工具库，可以在不修改代码的情况下检查 PyTorch 模型的中间层。这对于获取语言模型的注意矩阵、可视化层嵌入或对中间层应用损失函数都是很有用的。它还支持提取模型的子部分，并独立运行、调试或者训练它们。借助 Surgeon 可以快速完成上述任务，无需改变原始模型的任何一行。

『xh』Rust写的用来发送HTTP请求的友好快速的工具

https://github.com/ducaale/xh

xh是一个友好和快速发送HTTP请求的工具。它重新实现了HTTPie的优秀设计，重点是提高性能。

『FerretDB』类似MongoDB的开源数据服务 · 4.7k Stars

https://github.com/FerretDB/FerretDB

https://www.ferretdb.io/

MongoDB 是一项改变许多开发者生活的技术，使他们能够比使用关系型数据库更快地构建应用程序。然而 MongoDB 放弃了它的开源根基，将许可证改为 SSPL，使其无法用于许多开源和商业项目。对于那些习惯使用 MongoDB 的开发者来说，FerretDB 是一个完美的解决方案，可视作可替代 MongoDB 的开源软件。

博文&分享

『Sketching Algorithms for Big Data』大数据算法基础课·笔记集锦

https://www.sketchingbigdata.org/fall17/lec/

『剑指 Offer』Python/Java/C++解题代码，『LeetBook 图解算法数据结构』配套代码

https://github.com/krahets/LeetCode-Book

LeetBook《图解算法数据结构》面向算法初学者、互联网求职者设计，主要内容包括：剑指 Offer 图文题解、数据结构与算法专栏。作者将内容整理成『剑指 Offer 一个月刷题计划』，核心理念为从易到难、从基础类题目到综合类题目，可以按照知识点类型顺序刷题，一个月搞定！

数据&资源

『MedMCQA』大规模多项选择题问答数据集，旨在解决现实世界的医学入学考试问题

https://github.com/medmcqa/medmcqa

https://medmcqa.github.io/

MedMCQA 拥有超过 19.4万个高质量的 AIIMS 和 NEET PG入学考试题，每个样本都包含一个问题、正确答案和其他需要更深入的语言理解的选项，为自然语言处理社区提供了一个开源数据集。

数据集涵盖 2.4k 个医疗保健主题，收集了麻醉、解剖学、生物化学、牙科、耳鼻喉科、眼科、骨科、儿科、精神病学、放射学等 21 个医学主题，主题多样性很高。

『Efficient Deep Learning』高效深度学习：深度学习过程加速技巧集

https://github.com/Mountchicken/Efficient-Deep-Learning

深度学习飞速发展，吸引着越来越多的学习者和从业者涌向了这个领域。作者整理汇总了自己在深度学习的过程中遇到了各种各样的问题和解决方案，让你获取高效深度学习的技巧。

Repo 包含高效编码的策略、高效数据处理的策略、加快训练过程的策略、提高 GPU 利用率的策略、有用工具的列表等6个部分，每个部分包含几篇文章，详细讲解各主题的技巧细节。

研究&论文

公众号回复关键字日报，免费获取整理好的论文合辑。

科研进展

2022.07.25 『图像超分辨率变换』 Reference-based Image Super-Resolution with Deformable Attention Transformer

2022.07.30 『数据提炼』Delving into Effective Gradient Matching for Dataset Condensation

2022.07.20 『联邦学习』FedDM: Iterative Distribution Matching for Communication-Efficient Federated Learning

2022.07.28 『目标检测』HorNet: Efficient High-Order Spatial Interactions with Recursive Gated Convolutions

论文：Reference-based Image Super-Resolution with Deformable Attention Transformer

论文时间：25 Jul 2022

领域任务：Image Super-Resolution，图像超分辨率变换

论文地址：https://arxiv.org/abs/2207.11938

代码实现：https://github.com/caojiezhang/datsr

论文作者：JieZhang Cao, Jingyun Liang, Kai Zhang, Yawei Li, Yulun Zhang, Wenguan Wang, Luc van Gool

论文简介：Reference-based image super-resolution (RefSR) aims to exploit auxiliary reference (Ref) images to super-resolve low-resolution (LR) images./基于参考的图像超分辨率（RefSR）旨在利用辅助参考（Ref）图像来超解低分辨率（LR）图像。

论文摘要：基于参考的图像超分辨率（RefSR）旨在利用辅助参考（Ref）图像来超解低分辨率（LR）图像。最近，RefSR已经引起了极大的关注，因为它提供了一种超越单幅图像SR的替代方法。然而，解决RefSR问题有两个关键的挑战：（i）当LR图像和参考图像有明显的不同时，很难匹配它们之间的对应关系；（ii）如何从参考图像中转移相关纹理以补偿LR图像的细节是非常具有挑战性的。为了解决RefSR的这些问题，本文提出了一种具有多个尺度的可变形注意力Transformer，即DATSR，每个Transformer由纹理特征编码器（TFE）模块、基于参考的可变形注意力（RDA）模块和残余特征聚合（RFA）模块组成。具体来说，TFE首先为LR和Ref图像提取对图像变换（如亮度）不敏感的特征，然后RDA可以利用多种相关纹理来补偿LR特征的更多信息，最后RFA将LR特征和相关纹理聚合起来，得到视觉上更愉悦的结果。广泛的实验表明，我们的DATSR在数量和质量上都达到了基准数据集的最先进性能。

论文：Delving into Effective Gradient Matching for Dataset Condensation

论文时间：30 Jul 2022

领域任务：Dataset Condensation，数据提炼

论文地址：https://arxiv.org/abs/2208.00311

代码实现：https://github.com/Guang000/Awesome-Dataset-Distillation

论文作者：Zixuan Jiang, Jiaqi Gu, Mingjie Liu, David Z. Pan

论文简介：In this work, we delve into the gradient matching method from a comprehensive perspective and answer the critical questions of what, how, and where to match./在这项工作中，我们从一个全面的角度深入研究了梯度匹配方法，并回答了什么、如何以及在哪里匹配等关键问题。

论文摘要：随着深度学习模型和数据集的迅速扩大，网络训练是非常耗时和资源成本的。与其在整个数据集上进行训练，用一个小的合成数据集进行学习成为一个有效的解决方案。在数据集提炼的方向上已经进行了广泛的研究探索，其中梯度匹配取得了最先进的性能。梯度匹配方法通过在原始数据集和合成数据集上训练时的梯度匹配直接针对训练动态。然而，对这种方法的原理和效果的深入研究是有限的。在这项工作中，我们从全面的角度深入研究梯度匹配方法，并回答了匹配什么、如何匹配、在哪里匹配等关键问题。我们提出，多级梯度的匹配要同时涉及类内和类间的梯度信息。我们证明了距离函数应该集中在角度上，同时考虑幅度以延迟过拟合。我们还提出了一个过拟合感知的自适应学习步骤策略，以修剪不必要的优化步骤，提高算法效率。消融和比较实验表明，与先前的工作相比，我们提出的方法显示出更高的准确性、效率和通用性。

论文：FedDM: Iterative Distribution Matching for Communication-Efficient Federated Learning

论文时间：20 Jul 2022

领域任务：Federated Learning, Image Classification，联邦学习，图像分类

论文地址：https://arxiv.org/abs/2207.09653

代码实现：https://github.com/Guang000/Awesome-Dataset-Distillation/blob/main/README.md

论文作者：Yuanhao Xiong, Ruochen Wang, Minhao Cheng, Felix Yu, Cho-Jui Hsieh

论文简介：Federated learning~(FL) has recently attracted increasing attention from academia and industry, with the ultimate goal of achieving collaborative training under privacy and communication constraints./联邦学习~(FL)最近引起了学术界和工业界越来越多的关注，其最终目标是在隐私和通信约束下实现协作训练。

论文摘要：联邦学习~(FL)最近吸引了学术界和工业界越来越多的关注，其最终目标是在隐私和通信约束下实现协作训练。现有的基于迭代模型平均化的FL算法需要大量的通信回合来获得一个表现良好的模型，这是因为不同client之间的数据划分极不平衡且非i.i.d。因此，我们提出了FedDM，从多个本地代理函数中建立全局训练目标，这使得服务器能够获得一个更全局的损失景观。详细来说，我们在每个client上构建合成的数据集，通过分布匹配与原始数据的损失景观进行局部匹配。与笨重的模型权重相比，FedDM通过传输更多信息和更小的合成数据，减少了通信回合，提高了模型质量。我们在三个图像分类数据集上进行了广泛的实验，结果表明，我们的方法在效率和模型性能方面可以超过其他FL对应的方法。此外，我们证明FedDM可以适应高斯机制，以保护差异化的隐私，并在相同的隐私预算下训练一个更好的模型。

论文：HorNet: Efficient High-Order Spatial Interactions with Recursive Gated Convolutions

论文时间：28 Jul 2022

领域任务：Image Classification, object-detection, 图像分类，目标检测

论文地址：https://arxiv.org/abs/2207.14284

代码实现：https://github.com/raoyongming/hornet

论文作者：Yongming Rao, Wenliang Zhao, Yansong Tang, Jie zhou, Ser-Nam Lim, Jiwen Lu

论文简介：In this paper, we show that the key ingredients behind the vision Transformers, namely input-adaptive, long-range and high-order spatial interactions, can also be efficiently implemented with a convolution-based framework./在本文中，我们展示了视觉Transformers背后的关键成分，即输入自适应、长距离和高阶空间互动，也可以通过基于卷积的框架有效实现。

论文摘要：最近在视觉Transformers方面取得的进展显示，在基于点积自我注意的新空间建模机制的驱动下，在各种任务中取得了巨大的成功。在本文中，我们展示了视觉Transformers背后的关键成分，即输入自适应、长距离和高阶空间互动，也可以通过基于卷积的框架有效地实现。我们提出了递归门控卷积（gnConv），用门控卷积和递归设计来执行高阶空间互动。新的操作是高度灵活和可定制的，它与卷积的各种变体兼容，并将自我注意中的两阶互动扩展到任意的阶数，而不引入大量的额外计算。gnConv可以作为一个即插即用的模块来改进各种视觉Transformers和基于卷积的模型。基于该操作，我们构建了一个新的通用视觉骨干系列，名为HorNet。在ImageNet分类、COCO物体检测和ADE20K语义分割上的大量实验表明，HorNet在整体架构和训练配置相似的情况下，比Swin Transformers和ConvNeXt要好得多。HorNet还显示了对更多训练数据和更大模型规模的有利可扩展性。除了在视觉编码器中的有效性外，我们还表明gnConv可以应用于特定任务的解码器，并以较少的计算量持续提高密集预测性能。我们的结果表明，gnConv可以成为一个新的视觉建模的基本模块，有效地结合了视觉变形器和CNN的优点。代码可在 https://github.com/raoyongming/HorNet 获取。

我们是 ShowMeAI，致力于传播AI优质内容，分享行业解决方案，用知识加速每一次技术成长！点击查看 历史文章列表，在公众号内订阅话题 #ShowMeAI资讯日报，可接收每日最新推送。点击 专题合辑&电子月刊 快速浏览各专题全集。点击这里回复关键字日报免费获取AI电子月刊与资料包。

作者：韩信子@ShowMeAI
历史文章列表
专题合辑&电子月刊
欢迎回复，拜托点赞，留言推荐中有价值的文章、工具或建议，我们都会尽快回复哒~

本文链接：https://blog.csdn.net/ShowMeAI/article/details/126533913

原作者删帖不实内容删帖广告或垃圾文章投诉

智能推荐

Linux下使用crontab定时任务进行Tomcat日志分割_crontab多个任务如何分割-程序员宅基地

文章浏览阅读722次。Linux下使用crontab定时任务进行Tomcat日志分割_crontab多个任务如何分割

AGV小车导航控制研一《智能控制》课程文献阅读作业_四轮agv传递函数-程序员宅基地

文章浏览阅读1w次，点赞4次，收藏55次。摘要AGV（即自动导向小车）是一种集控制、定位、各种传感器技术于一体的设备。随着智能车技术的不断发展，智能车的应用范围和功能都将大为拓展，现已逐渐用于工业与民用领域。但是由于负载变化、使用环境条件恶劣等原因，在实际运用时AGV小车在定位及控制上依然有许多难点需要攻克。本文即针对上述难点，研究并设计了一种新型的驱动方式和控制系统，利用模糊控制与PID控制相结合的方法，在开机初期误差矫正快，后期平稳，可以迅速跟踪期望轨迹。在实验状态下，运行速度为1米每秒时，0.5米的误差约5秒即可消除，达到稳定状态。引言_四轮agv传递函数

Android XML文件使用-程序员宅基地

文章浏览阅读230次。转自：http://www.cnblogs.com/zhengtao/articles/1924940.html一、布局文件：在layout目录下，使用比较广泛；　　我们可以为应用定义两套或多套布局，例如：可以新建目录layout_land(代表手机横屏布局)，layout_port(代表手机竖屏布局)，系统会根据不同情况自动找到最合适的布局文件，但是在同一界面的两套不同布局文

std::thread和std::this_thread的详细说明-程序员宅基地

文章浏览阅读2.5k次，点赞3次，收藏13次。std::thread类来表示执行的各个线程。执行线程是实际上是执行一系列指令，可以在多线程环境中与其他此类序列同时执行，同时共享相同的地址空间。std::this_thread命名空间包含了对当前线程的一些基本操作，如获取当前线程id、休眠当前线程、让渡当前线程的时间片给其他线程等。_std::this_thread

jQuery 父元素选择器 parent() 和 parents()_jquery父元素选择器-程序员宅基地

文章浏览阅读7.7k次。jQuery的父元素选择器小编很少使用，但却看到不少web开发者们经常使用。小编个人是不太推荐使用父元素选择器的。因为如果是列表的情况下，在循环时可以将当前的索引绑定给需要点击的按钮，通过索引查找元素。本篇文章在小编不推荐的情况下，还是决定写一篇。先来一段 HTML结构代码<table class="table table-bordered" id="user..._jquery父元素选择器

杰理之MCLK 主时钟【篇】_mclk wclk 区别-程序员宅基地

文章浏览阅读84次。也称IIS系统时钟，一般是采样频率的256倍、512倍，384倍。假设采样率是48K，MCLK输出的时钟是采样的256倍，则MCLK会输出 48K*256 = 12.288MHz。_mclk wclk 区别

随便推点

正则化的作用以及L1和L2正则化的区别_l1l2正则化原理和区别-程序员宅基地

文章浏览阅读3.5w次，点赞103次，收藏505次。0 正则化的作用正则化的主要作用是防止过拟合，对模型添加正则化项可以限制模型的复杂度，使得模型在复杂度和性能达到平衡。常用的正则化方法有L1正则化和L2正则化。L1正则化和L2正则化可以看做是损失函数的惩罚项。所谓『惩罚』是指对损失函数中的某些参数做一些限制。 L1正则化的模型建叫做Lasso回归，使用L2正则化的模型叫做Ridge回归（岭回归。但是使用正则化来防止过拟合的原理是什么？L1和L..._l1l2正则化原理和区别

【Win10】打开控制面板提示：操作系统当前的配置不能运行此应用程序-程序员宅基地

文章浏览阅读1.2w次，点赞2次，收藏19次。win10系统，打开控制面板，提示操作系统当前的配置不能运行此应用程序_操作系统当前的配置不能运行此应用程序

神经网络压缩剪枝量化嵌入式计算优化NCNN mobilenet squeezenet shufflenet_基于数据压缩的mec网络中系统能效的优化方法-程序员宅基地

文章浏览阅读1.1w次，点赞5次，收藏58次。性能提升方法本文github链接1. 小模型 mobilenet , 更精细模型的设计，紧致网络设计 mobilenet squeezenet shufflenet 123MobileNet逐通道卷积 + 普通点卷积 SqueezeNet 1∗1 和3∗3 卷积较少通道数量 ShuffleNet..._基于数据压缩的mec网络中系统能效的优化方法

高并发场景以及应对技巧-程序员宅基地

文章浏览阅读2.7k次。业务系统高并发（High Concurrency）限流：鉴于只有少部分用户能够秒杀成功，所以要限制大部分流量，只允许少部分流量进入服务后端。分流：负载就是问题，高并发问题。均衡就是解决手段。削峰：对于秒杀系统瞬时会有大量用户涌入，所以在抢购一开始会有很高的瞬间峰值。高峰值流量是压垮系统很重要的原因，所以如何把瞬间的高流量变成一段时间平稳的流量也是设计秒杀系统很重要的思路。实现削峰的常用的方法有利用缓存和消息中间件等技术。异步处理：秒杀系统是一个高并发系统，采用异步处理模式可以极大地提高系统并_高并发场景

登录界面转换实现html,一个登录界面的PS设计和HTML/CSS实现-程序员宅基地

文章浏览阅读341次。这样的登录界面可用在网站、桌面软件、Web软件等上面，你可以根据自己的需求改变界面配色。好的，先看看界面最终设计的效果：1、创建登录界面的背景在Photoshop中，选择“圆角矩形工具”，设置半径为10px。将前景色设置为#aeaeae。然后绘制如下的矩形框。尺寸大小取决于你自己。下面为这个登录背景框添加图层样式：透明度为 40%添加阴影:渐变叠加：从黑到白，具体参数如下:这时背景框的效果如下：2..._登录框效果图如何做成html

EM算法 - 2 - EM算法在高斯混合模型学习中的应用_em算法在高斯混合模型中的应用-程序员宅基地

文章浏览阅读8k次，点赞5次，收藏15次。声明： 1，本篇为个人对《2012.李航.统计学习方法.pdf》的学习总结，不得用作商用，欢迎转载，但请注明出处（即：本帖地址）。 2，由于本人在学习初始时有很多数学知识都已忘记，所以为了弄懂其中的内容查阅了很多资料，所以里面应该会有引用其他帖子的小部分内容，如果原作者看到可以私信我，我会将您的帖子的地址付到下面。 3，如果有内容错误或不_em算法在高斯混合模型中的应用