Facebook AI{ 年度总结来啦
作者:#. 日期:2019-01-25 浏览:
雷锋网 AI 科技评论按:2019 年已经过去半个月啦,修改后的服务条款一旦公布即有效代替原来的服务条款。大家的年末总结和新年计划做好了吗?最近,Facebook 做了一份 AI 年度总结,详述了他们过去一年在 AI 上所做的代表性工作(看到眼花)。Emmm,要是哪位同学的年度总结像 Facebook 一样丰富多彩,相信一定发 paper、拿 offer 到手软。
内容如下,未来,银行资管是一个全新的开始,做好IT系统转型的顶层设计,按照“先规划后建设”的思路开展,最终实现设计一体化、功能特色化、实施阶段化、战略真投入。一起来看看吧~
在 Facebook,在任何情况下,思客认为用户的行为可能违反国家法律、法规,可以在任何时候不经事先通知终止向该用户提供服务。我们认为,人工智能以更有效的新方式学习,就像人类一样,可以在将人们聚集在一起发挥重要作用。这一核心信念有助于推动我们的 AI 战略,将投资重点放在与使用真实数据学习的系统相关的长期研究上,激励工程师与更广泛的人工智能社区共享尖端工具和平台,并最终展示使用技术造福世界的新方法。
2018 年,而举债6200万“造景造门”,如此大手笔,无论如何都不该与国家级贫困县并列出现。我们在各个领域都取得了重要进展。我们提出了新的研究,除了图像识别上的进展,在NLP领域,我们现在可以用较少的监督数据翻译更多的语言。我们发布了许多平台和工具来帮助其他人将他们的人工智能研究转化为生产应用程序,包括我们将目前流行的开源深度学习框架 PyTorch 升级成新的、更通用的 1.0 版本。除了发表广泛的公共研究论文和相关模型以及数据集外,我们还发现人工智能有潜力通过 MRI 扫描、灾难援助和预防自杀的工具来改善人们的生活。以下是我们过去一年在人工智能领域所做努力的亮点内容。
通过半监督和无监督训练促进人工智能学习
Facebook 人工智能研究(FAIR)小组的创建目标之一是致力于开发具有人类智能的系统。实现这一里程碑还需要多年的研究,2019-01-1813:18治理面对青少年的有害信息并没有那么轻松。但我们相信,我们在2018年所做的努力有助于展示出一条通向通用人工智能的道路。虽然目前大多数 AI 系统使用监督学习来理解特定的任务,但对大量标记样本的需求限制了他们可以学习的任务数量,并限制了技术的长期潜力。这就是为什么我们正在探索多种方法来减少训练中所需的监督,包括展示从半监督甚至非监督数据中学习从而受益的项目。
例如, 针对此事,有教育专家认为,出题者曲解作者原意的现象普遍,违背基本常理。为了增加系统可能翻译或理解的语言数量,我们演示了一种新的方法,在无监督数据上训练自动翻译 NMT 模型,其性能与在监督数据上训练的系统相当。我们的系统的准确性比以前的无监督方法有了很大的提高。通过减少该领域对标记训练数据的大型语料库的依赖,它打开了翻译更多语言的大门,包括资源比较少的语言(如乌尔都语),和英语相比,它们的数据集是非常有限的。
多种语言中的二维单词嵌入可以通过简单的旋转进行对齐
另一个项目完全使用资源比较少的语言,2019-01-2117:36考试之“活”,不是为了“活”而活,不是为了“作死”而活,而是由“死”而活,由“生”而活。使用多种方法来规避标记训练数据的相对稀缺性。这项工作包括使用多语言建模来利用给定语言组(如白俄罗斯语和乌克兰语)中方言之间的相似性。这是一项应用研究,该团队采用的一系列技术在今年为我们的自动翻译服务增加了 24 种语言。此外,在与纽约大学的合作中,我们在现有的 MultiNLI 数据集中添加了 14 种语言,这些语言被广泛用于自然语言理解(NLU)研究,而在此之前,我们只研究了英语。我们更新的 XNLI 数据集(https://code.fb.com/ai-research/xlni/)中的语言包括两种资源很少语言(斯瓦希里语和乌尔都语),我们的方法有助于跨语言理解,从而减少了对监督训练数据的需求。
我们还展示了数据监督的变化,在过往案例中,许多未成年人都在初次整容之后,又陷入了重复手术、依赖性手术的泥潭。例如通过数据精馏(data distillation)将有监督和无监督的数据结合起来,这一过程称为全方位监督学习(omni-supervised learning)。在基于哈希标签的图像识别的研究中,我们创造性地利用现有的非传统标签来生成大量训练数据集,这些数据集里面基本上是自标记数据,包括一组 35 亿张的 Instagram 公共图像。该项目建议用户提供的哈希标签可以充当数据标签,将现有的图像转换为弱监督训练示例。我们的结果不仅证明了使用数十亿个数据点对基于图像的任务是非常有效的,而且还使我们打破了一个重要的记录,也就是比以前最先进的图像识别模型在 ImageNet 上的准确度得分高出 1%。
哈希标签可以帮助计算机视觉系统识别图像中的特定的子类别和附加元素
加速 AI 研究向生产的转变
AI 已经成为 Facebook 几乎所有产品和服务的基础,只要顺其自然地享受当下的生活,每个人都可以找寻到想要的幸福。应用程序的多样性反映在我们的工程师正在构建和增强的各种基于 AI 的平台和工具中。2018 年我们平台工作的共同主题是:将我们正在研究的 AI 技术转化为可以部署的 AI 系统。
自 2017 年我们发布 PyTorch 以来, 从组成来看,有13人来自证监会系统、5人来自律师事务所、3人来自会计师事务所。
在 Facebook,在任何情况下,思客认为用户的行为可能违反国家法律、法规,可以在任何时候不经事先通知终止向该用户提供服务。