您的位置:首页 >科技 >

Facebook悄悄悄悄收购合成数据初创公司AI.Reverie

来源:时间:2021-10-13

VentureBeat 获悉,Facebook 已经悄悄收购了AI.Reverie,这是一家总部位于纽约的初创公司,该公司创建合成数据以训练机器学习模型。显然是对 HBO 节目西部世界的致敬,在那里主题公园的游客会遇到成群的人工智能机器人,购买是通过一家名为 Dolores Acquisition Sub, Inc. 的控股公司在节目中的一个角色之后进行的。

Facebook 发言人在联系置评时证实了此次收购。

AI.Reverie 于 2017 年由包括 Daeil Kim、Joey Tran 和 Paul Walborsky 在内的创始团队推出。Kim 曾是《纽约时报》的数据科学家,在那里他通过开发 AI 解决方案来优化品牌的获取渠道,率先制定了 NYT Español 的受众获取策略。Walborsky 曾是科技媒体品牌 Gigaom 的总裁兼首席执行官,他是《泰晤士报》的高级副总裁,负责领导出版商国际扩张的团队。

AI.Reverie 提供了 API 和一个平台,可以为 AI 系统按程序生成完全注释的合成视频和图像。随着公司在大流行期间接受数字化转型,合成数据通常与现实世界的数据结合使用以开发和测试人工智能算法。在最近对高管的一项调查中,89% 的受访者表示合成数据对于保持竞争力至关重要。而根据Gartner的数据,2030年,合成数据将在AI模式掩盖了真实的数据。

“Facebook 收购 AI.Reverie 是合成数据行业的明显胜利。我们注意到越来越多的公司,无论大小,都在迅速采用合成数据作为强大人工智能战略的关键支柱,”合成数据初创公司 Cvedia 的首席执行官 Arjan Wijnveen 通过电子邮件告诉 VentureBeat。“此次收购还凸显出,即使是像 Facebook 这样以海量数据着称的公司,在收集训练 AI 所需数据的能力方面仍然存在差距。”

同时密切合成数据镜像真实世界的数据,数学或统计学处理,陪审团仍然是在它的功效。一纸由研究员在卡内基梅隆出版概述了模拟的挑战阻碍现实世界的发展,包括重复性问题和所谓的“现实的差距”,其中模拟环境不充分代表现实。

然而,其他研究表明,与基于实际事件或人物的数据相比,合成数据对于训练模型的效果同样好。例如,英伟达的研究人员已经展示了一种使用在虚拟环境中创建的数据来训练机器人在现实世界中捡起诸如汤罐头、芥末瓶和一盒 Cheez-Its 之类的物体的方法。

在 AI.Reverie 于 2019 年发表的一项研究中,该公司声称,对仅使用 10% 的真实世界数据训练的合成数据模型进行微调,其性能与完全使用真实世界数据训练的模型相当。“我们……让世界各地的伟大思想家为自己测试合成数据的价值,”金在之前的一份声明中说。

国防合同

AI.Reverie——与 Tonic、Delphix、Mostly AI、Hazy、Gretel.ai 和 Cvedia 等初创公司竞争——在军事和国防合同方面有着悠久的历史。

2019 年,该公司宣布与 Booz Allen Hamilton 建立战略联盟,并在 Nvidia 的 GTC DC 会议上引入了 Modzy。通过 Modzy——一个管理和部署 AI 模型的平台——AI.Reverie 推出了一个武器检测模型,表面上可以从“多角度”发现弹药、爆炸物、大炮、枪支、导弹和刀片。

2020 年,AI.Reverie获得了美国空军技术孵化机构 AFWERX 的 150 万美元研究资助,用于为 Dyess 空军基地的第 7 轰炸机联队构建 AI 算法。Kim 在一份声明中表示,AI.Reverie 将创建合成图像来训练计算机视觉算法进行导航,这通常需要手工标记的图像。

该公司在一份新闻稿中进一步描述了其工作的第一阶段:“国防部期待 AI.Reverie 将侦察加速到应急环境所需的速度。支持情报收集的计算机视觉模型必须根据来自机密位置和难以到达的地方的数据进行训练...... AI.Reverie 的合成数据平台...... [生成] 数百万张完全注释、丰富多样的图像 - 快速且成本低.AI.Reverie 旨在生成跨电磁频谱的图像,使士兵能够更准确地识别物体并做出挽救生命的决定。”

该合同紧跟 AI.Reverie 与 CosmiQ Works 合作发布的RarePlanes数据集,该数据集包含数以万计的真实和合成卫星场景以及不同飞机类型的注释。CosmiQ Works 于 2015 年在 In-Q-Tel 内成立,专注于为地理空间应用创建人工智能技术,In-Q-Tel 是一家将科技公司与美国情报界联系起来的投资公司。

2021 年,AI.Reverie 获得了美国空军高级战斗管理系统 (ABMS) 的合同,其目标是为军方创建一个网络,为连接各种平台和传感器提供技术基础设施。ABMS 还旨在将 AI 应用于来自网络的数据,以帮助解析信息并辅助决策。

“我们很荣幸空军选择 AI.Reverie 来支持其先进的战斗管理系统,”金当时说。“我们相信,与 AI.Reverie 合作,空军将有重大机会改进关键任务视觉算法,确保军事优势并确保我们的部队安全。”

投资合成数据

在收购之前,AI.Reverie 已经从 Compound、In-Q-Tel、Resolute Ventures、SGInnovate、TechNexus 和 Triphammer Ventures 吸引了 1000 万美元的资金,声称在零售、智慧城市、工业和农业,包括机场模拟、武器检测、无收银员购物和送货机器人。但 Facebook 的做法似乎是针对公司的合成数据生成技术,而不是针对其客户群。

虽然 Facebook 没有详细透露它如何或是否将合成数据用于计算机视觉,但该公司的研究人员已经利用合成数据来训练像M2M-100这样的模型,它可以在没有英语数据的情况下在 100 种语言之间进行翻译。合成数据可用于提高 Facebook 平台上检测仇恨言论的计算机视觉算法的性能,或在虚拟现实 (VR) 和增强现实 (AR) 环境(如社交网络的地平线世界)中开发智能助手。

随着大流行加速了更严格的数据隐私监管和治理的趋势,合成数据为 Facebook 提供了另一个优势:合规性。该公司历来在其产品(例如 Instagram)和其他来源的视频和图像上训练计算机视觉算法,但 AI.Reverie 等合成数据技术可能会教训 Facebook 对真实世界用户和第三方数据的依赖。

2020 年,一家名为 Planner 5D 的立陶宛公司起诉Facebook,据称 Facebook 从 Planner 5D 的软件中窃取了数千个文件,这些文件通过与普林斯顿大学的合作提供给 Facebook 2019 年面向计算机视觉研究人员的场景理解和建模挑战赛的参赛者。Planner 5D 声称普林斯顿、Facebook 和 Facebook 专注于 VR 的硬件和软件部门 Oculus 可以从从中获取的训练数据中受益。

最近,一位联邦法官批准了一项 6.5 亿美元的集体诉讼隐私和解协议,涉及 Facebook 使用面部识别标签。该诉讼指控该公司的标签建议工具违反伊利诺伊州法律,该工具扫描照片中的人脸并提供有关可能是谁的建议,在未经用户同意的情况下存储生物识别数据。

Privitar 的一项调查显示,51% 的受访消费者不愿意分享他们的个人信息。在 Veritas 的一份报告中,53% 的受访者表示他们会在值得信赖的组织上花更多的钱,22% 的人表示他们会在认真对待数据保护的企业上多花 25%。

图说财富