DeepMind 实验室的专家创建了一个通用的 Perceiver IO 架构来处理所有类型的输入和输出数据。
为了解决我们在解决智能问题时遇到的所有挑战,我们需要尽可能具有适应性的工具。 宣布 Perceiver IO 的论文和代码,这是一种处理各种数据和任务的架构,同时还能优雅地扩展:https://t.co/9UU9b6276q 1/4 pic.twitter.com/PO9JSHt7yL
– DeepMind (@DeepMind) 2021 年 8 月 3 日
它基于 2021 年 6 月推出的原始感知器模型。 它处理图像、音频、视频及其组合,但仅限于具有简单输出的任务,例如分类。
为了解决这个问题,研究人员创建了一个更通用的架构版本——Perceiver IO。 它可以从各种输入产生各种各样的输出,使其适用于自然语言处理、计算机视觉和多模态理解等领域。
使用 Perceiver IO 评估光流或跟踪图像中所有像素移动的结果。 每个像素的颜色表示移动的方向和速度。 数据。 深度思维。
Perceiver 和 Perceiver IO 建立在变压器架构上,该架构适用于包含数千个元素的输入。 然而,据研究人员称,图像、音频和视频可能包含数百万个这样的元素。
“通过最初的感知器,我们解决了通用架构的主要问题:在不引入特定领域假设的情况下将转换器缩放到非常大的输入,”博客文章说。
研究人员还认为,Perceiver IO 可以实现前所未有的多功能性。
他们已在 GitHub 上发布了该架构的源代码,并希望这将有助于研究人员和从业人员开发应用程序,而无需花费资源使用专门的系统构建自定义解决方案。
回想一下,在 7 月底,DeepMind 介绍了 XLand 用于训练通用人工智能代理的广泛游戏环境。
7 月,AI 实验室专家收集并发布了由 AlphaFold 神经网络创建的最完整的人类蛋白质结构数据库。
今年 6 月,DeepMind 的科学家表示,强化学习足以实现通用人工智能。
在 Telegram 上订阅 ForkLog 新闻:ForkLog AI – 来自 AI 世界的所有新闻
发现文中有错误? 选择它并按 CTRL + ENTER
内容搜集自网络,整理者:BTCover,如若侵权请联系站长,会尽快删除。