2020 年计算机视觉领域前 10 篇论文

原文：www.kdnuggets.com/2021/01/top-10-computer-vision-papers-2020.html

由 Louis (What's AI) Bouchard，蒙特利尔人，YouTube 和 Medium 上解释人工智能的内容

我们的前 3 名课程推荐

1. 谷歌网络安全证书 - 快速进入网络安全职业轨道。

即便今年世界发生了许多事情，我们仍然有机会看到大量令人惊叹的研究成果。特别是在人工智能领域，更准确地说是计算机视觉领域。今年突出了许多重要方面，比如伦理问题、重要偏见等。人工智能以及我们对人脑及其与人工智能关系的理解不断演变，显示出在不久的将来有着广阔的应用前景，我肯定会对此进行深入探讨。

这里是我精选的年度计算机视觉领域最有趣的 10 篇研究论文，以防你错过了其中任何一篇。简而言之，这基本上是一个最新突破的人工智能和计算机视觉的精选列表，包括清晰的视频解释、更深入的文章链接，以及代码（如果适用）。享受阅读，如果我遗漏了任何重要论文，请在评论中告诉我，或通过LinkedIn直接联系我！

每篇论文的完整参考文献列在本文末尾。

访问 GitHub 仓库中的完整列表

如果你分享了这篇文章，请在Twitter (@Whats_AI)或LinkedIn (Louis (What’s AI) Bouchard)标记我！

在 5 分钟内观看完整的 2020 年计算机视觉回顾

Sea-thru: 一种从水下图像中去除水分的方法 [1]

你是否曾想过没有水的海洋会是什么样子？去除水下图像中的蓝绿色调，还原珊瑚礁的真实颜色？使用计算机视觉和机器学习算法，海法大学的研究人员成功实现了这一目标！

这个 AI 从水下图像中去除水面！

你是否曾想过没有水的海洋会是什么样子？研究人员最近通过使用……

点击这里获取 Sea-thru 代码

神经电路策略实现可审计的自主性 [2]

来自 IST 奥地利和麻省理工学院的研究人员成功地使用一种基于微小动物大脑的新型人工智能系统训练了一辆自动驾驶汽车。他们仅使用了少数几个神经元来控制自动驾驶汽车，而不需要像流行的深度神经网络（如 Inceptions、Resnets 或 VGG）那样需要数百万个神经元。他们的网络仅使用了 75,000 个参数，由 19 个控制神经元组成，而不是数百万个！

一种新的受大脑启发的智能系统仅用 19 个控制神经元驾驶汽车！

模仿线虫的神经系统以高效处理信息，这种新的智能系统更具鲁棒性……

[NeRV：神经反射和可见性场

进行重新照明和视图合成](https://people.eecs.berkeley.edu/~pratul/nerv/) [3]

这种新方法能够生成一个完整的三维场景，并且能够决定场景的光照条件。所有这些都以非常有限的计算成本和与之前的方法相比惊人的结果完成。

从一组输入图像生成任意光照条件下的完整 3D 场景

这种新方法能够生成一个完整的三维场景，并且能够决定场景的光照条件……

YOLOv4：目标检测的最佳速度和准确性 [4]

第 4 版最近于 2020 年 4 月由 Alexey Bochkovsky 等人在论文《YOLOv4：目标检测的最佳速度和准确性》中引入。这个算法的主要目标是制作一个超快的目标检测器，在准确性方面具有高质量。

YOLOv4 算法 | You Only Look Once 第 4 版简介 | 实时目标检测

我最近发布了一篇帖子，解释了初始的 You Only Look Once，即 YOLO 算法的基础知识。然后…

PULSE: 通过生成模型的潜在空间探索进行自监督照片超分辨率 [5]

这个新算法可以将模糊的图像转换为高分辨率图像！

它可以将超低分辨率的 16x16 图像转换为 1080p 高清人脸！你不相信我？那你可以像我一样自己试试，不到一分钟的时间！但首先，让我们看看他们是怎么做到的。

这个 AI 让模糊的面孔清晰度提高 60 倍

这个新算法可以将模糊的图像转换为高分辨率图像！它可以将超低分辨率的 16x16 图像…

图像 GPT — 从像素生成预训练 [6]

一个好的 AI，比如 Gmail 中使用的 AI，可以生成连贯的文本并完成你的短语。这个 AI 使用相同的原理来完成图像！这一切都在无监督训练中完成，完全不需要标签！

这个 AI 可以使用 GPT 模型生成图片的另一半

一个好的 AI，比如 Gmail 中使用的 AI，可以生成连贯的文本并完成你的短语。这个 AI 使用相同的…

DeepFaceDrawing: 从草图中深度生成面部图像 [7]

现在你可以使用这个新的图像到图像翻译技术，从粗略或甚至不完整的草图中生成高质量的面部图像，完全不需要绘画技巧！如果你的绘画技能和我一样糟糕，你甚至可以调整眼睛、嘴巴和鼻子对最终图像的影响！让我们看看它是否真的有效以及他们是如何做到的。

AI 从草图生成真实面孔！

现在你可以使用这个新的图像到图像翻译技术，从粗略或甚至不完整的草图中生成高质量的面部图像，完全不需要绘画技巧！

PIFuHD: 多层次像素对齐隐式函数用于高分辨率 3D 人体数字化 [8]

这个 AI 可以从 2D 图像中生成 3D 高分辨率的重建图像！它只需要你的一张图片就可以生成一个看起来和你一模一样的 3D 头像，甚至从背面也是如此！

AI 从 2D 图像生成 3D 高分辨率重建 | PIFuHD 介绍

这个 AI 可以从 2D 图像中生成 3D 高分辨率的重建图像！它只需要你的一张图片就可以…

RAFT：用于光流的递归全对场变换 [9]

ECCV 2020 最佳论文奖颁给了普林斯顿团队。他们开发了一种新的端到端可训练的光流模型。他们的方法在多个数据集上超越了最先进架构的准确性，并且效率更高。他们甚至将代码发布在 Github 上供大家使用！

ECCV 2020 最佳论文奖 | 一种新的光流架构

ECCV 2020 最佳论文奖颁给了普林斯顿团队。他们开发了一种新的端到端可训练的光流模型……

点击这里查看 RAFT 代码

学习视频修补的联合时空变换 [10]

这个 AI 能够填补被移除移动物体后的缺失像素，并比当前最先进的方法更准确、更清晰地重建整个视频！

这个 AI 能够从视频中填补物体后面的缺失像素！

视频修补 — 微软研究院

点击这里查看这个视频修补代码

通过深度潜在空间转换进行旧照片恢复 [Bonus 1]

想象一下，将你祖母 18 岁时的旧照片，即使是折叠和撕裂的照片，恢复到高清晰度且没有任何伪影。这就是所谓的旧照片恢复，这篇论文刚刚开辟了一个全新的方向，使用深度学习方法来解决这个问题。

使用深度学习进行旧照片恢复

想象一下，将你祖母 18 岁时的旧照片，即使是折叠和撕裂的照片，恢复到高清晰度……

点击这里查看旧照片恢复代码

实时肖像抠图是否真的需要绿幕？ [Bonus 2]

人体抠图是一项非常有趣的任务，目标是找到图片中的任何人并去除背景。由于任务复杂，需找到具有完美轮廓的人或多人，因此非常难以实现。在这篇文章中，我回顾了这些年来使用的最佳技术以及 2020 年 11 月 29 日发布的一种新方法。许多技术使用基本的计算机视觉算法来完成这项任务，如 GrabCut 算法，它极其快速，但不够精确。

高质量背景去除，无需绿屏

这种新的背景去除技术可以从单张输入图像中提取一个人，无需绿屏……

点击这里获取 MODNet 代码

DeOldify [Bonus 3]

DeOldify 是一种为黑白图片或电影胶卷上色和修复的技术。它由 Jason Antic 开发并持续更新。它现在是为黑白图片上色的最先进方法，所有内容都是开源的，但我们稍后会回到这个话题。

这个 AI 可以将你的黑白照片色彩化，并提供全真实感的渲染！ (DeOldify)

这种方法称为 DeOldify，适用于几乎所有的图片。如果你不相信，可以亲自试试……

点击这里获取 DeOldify 代码

结论

正如你所见，这对计算机视觉来说是一个极具洞察力的年份。我一定会涵盖 2021 年最激动人心和有趣的论文，如果你能参与其中我会非常高兴！如果你喜欢我的工作并希望了解最新的 AI 技术，你应该关注我的社交媒体频道。

订阅我的 YouTube 频道。
关注我的项目 LinkedIn。
一起学习 AI，加入我们的 Discord 社区，分享你的项目、论文、最佳课程，寻找 Kaggle 队友，等等！

访问 GitHub 仓库中的完整列表

如果你分享了这篇文章，请在Twitter (@Whats_AI)或LinkedIn (Louis (What’s AI) Bouchard)*** 标记我！***

如果你对 AI 研究感兴趣，这里有另一篇很棒的文章：

2020: 一年精彩的 AI 论文——综述

最新 AI 突破的精心整理列表，按发布日期排序，并附有清晰的视频解释，链接到更多……

论文参考

[1] Akkaynak, Derya & Treibitz, Tali. (2019). Sea-Thru: 一种从水下图像中去除水的技术。1682–1691。10.1109/CVPR.2019.00178。

[2] Lechner, M., Hasani, R., Amini, A. 等神经电路策略实现可审计的自主性。Nat Mach Intell 2, 642–652 (2020)。 doi.org/10.1038/s42256-020-00237-3

[3] P. P. Srinivasan, B. Deng, X. Zhang, M. Tancik, B. Mildenhall, 和 J. T. Barron，“Nerv: 神经反射和可见性场用于重光照和视图合成，”在 arXiv，2020。

[4] A. Bochkovskiy, C.-Y. Wang, 和 H.-Y. M. Liao，Yolov4：目标检测的最佳速度和准确性，2020. arXiv:2004.10934 [cs.CV]。

[5] S. Menon, A. Damian, S. Hu, N. Ravi, 和 C. Rudin，Pulse：通过生成模型的潜在空间探索进行自监督照片放大，2020. arXiv:2003.03808 [cs.CV]。

[6] M. Chen, A. Radford, R. Child, J. Wu, H. Jun, D. Luan, 和 I. Sutskever，“从像素生成预训练，”在第 37 届国际机器学习大会论文集，H. D. III 和 A. Singh 编，机器学习研究论文集，卷 119，虚拟：PMLR，2020 年 7 月 13–18 日，第 1691–1703 页。[在线]。

[7] S.-Y. Chen, W. Su, L. Gao, S. Xia, 和 H. Fu，“DeepFaceDrawing：从草图中深度生成面部图像，”ACM 图形学交易（ACM SIGGRAPH2020 论文集），卷 39，第 4 期，72:1–72:16，2020. 可用：http://proceedings.mlr.press/v119/chen20s.html。

[8] S. Saito, T. Simon, J. Saragih, 和 H. Joo，Pifuhd：多级像素对齐隐函数用于高分辨率 3D 人类数字化，2020. arXiv:2004.00452 [cs.CV]。

[9] Z. Teed 和 J. Deng，Raft：用于光流的递归全对场变换，2020. arXiv:2003.12039 [cs.CV]。

[10] Y. Zeng, J. Fu, 和 H. Chao，学习联合时空变换用于视频修复，2020. arXiv:2007.10247 [cs.CV]。

[Bonus 1] Z. Wan, B. Zhang, D. Chen, P. Zhang, D. Chen, J. Liao, 和 F. Wen，旧照片修复通过深度潜在空间转换，2020. arXiv:2009.07047 [cs.CV]。

[Bonus 2] Z. Ke, K. Li, Y. Zhou, Q. Wu, X. Mao, Q. Yan, 和 R. W. Lau，“实时肖像抠图真的需要绿幕吗？” ArXiv，卷 abs/2011.11961，2020。

[Bonus 3] Jason Antic，DeOldify 的创作者，github.com/jantic/DeOldify

原文。转载已获许可。

相关：

2020：充满惊人 AI 论文的一年 — 回顾
AI、分析、机器学习、数据科学、深度学习研究 2020 年的主要发展和 2021 年的关键趋势
使用 Dask 和 PyTorch 的大规模计算机视觉

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

top-10-computer-vision-papers-2020.md

top-10-computer-vision-papers-2020.md

2020 年计算机视觉领域前 10 篇论文

我们的前 3 名课程推荐

在 5 分钟内观看完整的 2020 年计算机视觉回顾

Sea-thru: 一种从水下图像中去除水分的方法 [1]

神经电路策略实现可审计的自主性 [2]

[NeRV：神经反射和可见性场

YOLOv4：目标检测的最佳速度和准确性 [4]

PULSE: 通过生成模型的潜在空间探索进行自监督照片超分辨率 [5]

图像 GPT — 从像素生成预训练 [6]

DeepFaceDrawing: 从草图中深度生成面部图像 [7]

PIFuHD: 多层次像素对齐隐式函数用于高分辨率 3D 人体数字化 [8]

RAFT：用于光流的递归全对场变换 [9]

学习视频修补的联合时空变换 [10]

通过深度潜在空间转换进行旧照片恢复 [Bonus 1]

实时肖像抠图是否真的需要绿幕？ [Bonus 2]

DeOldify [Bonus 3]

结论

如果你对 AI 研究感兴趣，这里有另一篇很棒的文章：

更多相关话题

Files

top-10-computer-vision-papers-2020.md

Latest commit

History

top-10-computer-vision-papers-2020.md

File metadata and controls

2020 年计算机视觉领域前 10 篇论文

我们的前 3 名课程推荐

在 5 分钟内观看完整的 2020 年计算机视觉回顾

Sea-thru: 一种从水下图像中去除水分的方法 [1]

神经电路策略实现可审计的自主性 [2]

[NeRV：神经反射和可见性场

YOLOv4：目标检测的最佳速度和准确性 [4]

PULSE: 通过生成模型的潜在空间探索进行自监督照片超分辨率 [5]

图像 GPT — 从像素生成预训练 [6]

DeepFaceDrawing: 从草图中深度生成面部图像 [7]

PIFuHD: 多层次像素对齐隐式函数用于高分辨率 3D 人体数字化 [8]

RAFT：用于光流的递归全对场变换 [9]

学习视频修补的联合时空变换 [10]

通过深度潜在空间转换进行旧照片恢复 [Bonus 1]

实时肖像抠图是否真的需要绿幕？ [Bonus 2]

DeOldify [Bonus 3]

结论

如果你对 AI 研究感兴趣，这里有另一篇很棒的文章：

更多相关话题