苹果成为AWS大客户亚马逊每月坐收3000万美元

苹果公司的一些服务基于亚马逊的AWS服务

雷锋网(公众号:雷锋网)注:本文编译自CNBC

同义词替换:在句子中随机选取n个非停用词。对每个选取的词,用它的随机选取的同义词替换。 随机插入:在句子中任意找一个非停用词,随机选一个它的同义词,插入句子中的任意位置。重复n次。 随机交换:任意选取句子中的两个词,交换位置。重复n次。 随机删除:对于句子中概率为p的每一个词,随机删除。

在可预见的未来,这一开支仍在持续上升。在过去的几个月里,苹果签署了一份协议,承诺了在未来五年内,至少花费15亿美元来购买AWS服务。在最近的一个财政年度,苹果的营业额为309.4亿美元。

想要继续查看该篇文章相关链接和参考文献?

目前,苹果设备的市场已经接近饱和。据统计,苹果设备的月均活跃用户数量超过10亿,其中iPhone的用户是主力军。这也就意味着,这家公司对计算和存储的需求量极高。

雷锋网版权文章,。详情见转载须知。

我向你介绍EDA:简单数据增广技术,可以大大提升文本分类任务的性能(在EDA Github repository有简单的实现代码)。EDA包含四个简单操作,能极好地防止过拟合,并训练出更强健的模型,分别是:

  这些操作都有效吗?

云计算的市场从来都不缺乏竞争者,但亚马逊云计算服务(AWS)的领先地位一直无人撼动,一度成为亚马逊公司盈利最丰厚的业务。即使是同样身为科技巨头的苹果公司也不得不依赖AWS。

点击【EDA:最简单的自然语言处理数据增广方法】即可访问:

苹果AWS开支提升,亚马逊成为最大赢家

尽管苹果是AWS服务最大的客户之一,但它支付的费用仅占AWS营收的一小部分。不过,即便如此,AWS从苹果公司获得的收入也高于Adobe、Capital One、Intuit、Lyft和Pinterest等公司。

不同大小的数据集下全部五种文本分类任务的EDA平均性能增益。n_aug表示每原生句子生成的增广句子的数量。

现在,我们来看看数据增广技术中每个单独操作的效果是什么样的。同义词替换好理解,但是另外三个操作真的起作用吗?我们可以做一个实验,单独做其中一种操作,并代入不同的α值,参数α大致可理解为“句子中被改变的单词的百分比”:

在不同大小的数据集下,对比其它五种文本分类方法,EDA操作的平均性能增益。参数α大致可理解为“句子中被每种增广操作改变的单词的百分比”。SR:同义词替换。RI:随机插入。RS:随机交换。RD:随机删除。

枣阳市公安局相关负责人介绍,自2012年9月1日起正式实施的国家标准《机动车运行安全技术条件》(GB7258-2012)明确规定,设计时速在20公里以上、50公里以下,重量超过40公斤的电单车被作为“轻便摩托车”,纳入机动车管理范畴。因此,醉酒驾驶超标电单车被认定为醉酒驾驶机动车,也将被以危险驾驶罪立案入刑。(完)

苹果拒绝对这一消息作出评论,亚马逊也没有作出回应。

雷锋网注:图片来自Google图片

文本分类任务的性能表现,相对于训练集的使用百分比。使用EDA(简单数据增广),在小数据集时,远胜常规方法。

你能看到,在小数据集时,性能增益非常大,达到大约2-3%,数据集大的时候,增益变小(~1%)。但是,各项操作综合起来,如果设置的增广参数合理(句子中改变的单词不超过四分之一),能使训练出的模型更健壮。

数据增广常用于计算机视觉。在视觉领域,你几乎肯定可以翻折、旋转或镜像一幅图片,而不用担心它的标记发生变化。然后,在自然语言处理(NLP)领域,情况完全不同。改变一个词有可能改变整个句子的意思。所以,没有简单的方法能做到数据增广。真的是这样么?

据CNBC报道,苹果和亚马逊之间的关系甚是微妙,竞争归竞争,合作归合作。有知情人士透露,苹果每个月至少会花3000万美元来购买亚马逊的云服务。从这笔巨额费用,我们可以看出苹果欲将iCloud等在线服务的质量速度双双提高的决心,哪怕它要依赖竞争对手来完成这一目标。

实际上,苹果在AWS服务上的支出一直在提升。2019的第一季度,苹果在这方面的开支平均每个月超过3000万美元,比去年上涨了10%。如果在接下来的一年里,苹果一直保持这种规模,那么,今年它在AWS服务上的开支可能会超过3.6亿美元,然而,去年这一数字为3.5亿美元。

目前,Lyft已承诺在2021年底向AWS支付至少3亿美元,而Pinterest表示,在未来六年内,会向AWS支付至少7.5亿美元。这就意味着,Lyft平均每年要花1亿美元来购买AWS服务,Pinterest则要花1.25亿美元。Snap也表示,截止2022年底,自己公司会在这方面支付11亿美元,其中,2019年至少会支付1.5亿美元。

  EDA会保留增广句子的真实标记吗?

ProCon数据集原生及增广句子的潜在空间图

自然语言处理(NLP)是信息时代最重要的技术之一,也是人工智能的关键部分。NLP的应用无处不在,因为人们几乎用语言进行交流:网络搜索,广告,电子邮件,客户服务,语言翻译,医学报告等。近年来,深度学习方法在许多不同的NLP任务中获得了非常高的性能,使用单个端到端神经模型,不需要传统的,任务特定的特征工程。在本课程中,学生将深入了解NLP深度学习的前沿研究。

苹果依赖亚马逊,两者亦敌亦友

这些技术真有效吗?出乎意料,答案是肯定的。尽管生成的某些句子有点怪异,但是在数据集中的引入一些噪声,对于训练出一个健壮的模型来说,是极有好处的,特别是数据集比较小的时候。这篇论文指出,在5个文本分类任务的对比测试中,基于几乎所有大小的数据集,使用EDA都击败了常规训练方法,在训练数据集较小的时候,表现尤其突出。平均来说,用EDA训练一个循环神经网络(RNN),只需50%的训练数据,即可达到常规方法同等的精度。

不过,除了自身的努力,苹果还需要其他公司的提供云服务支持,比如,亚马逊、谷歌、微软等。

同时,民警将李某驾驶的两轮电动车送相关部门鉴定,鉴定结果为机动车。固定证据后,民警多次打电话通知,李某拒不到派出所接受调查。随后,枣阳警方以涉嫌危险驾驶罪将李某列为网上逃犯。

可以看到增广句子的潜在空间图紧紧围绕着原生句子!这表明所生成的增广句子极大可能的保留了原始句子的标记。雷锋网雷锋网雷锋网(公众号:雷锋网)

不可否认的是,苹果一直致力于建设自己的基础设施:去年1月,苹果宣布,五年之内为自己的数据中心投资100亿美元。在12月的时候,苹果表示,2019年的投资总额将达到45亿美元。

最后,对于一个真实句子,我们应该增广出多少句子呢?答案取决于你的数据集的大小。如果你的数据集很小,很可能会出现过拟合,此时你应该生成多一些的增广句子。如果数据集比较大,增加太多的增广句子,意义不大,因为原有的数据已经能训练出一个好的模型了。这个图表显示了相对于每个原生句子生成的增广句子的数量的性能增益:

今年4月24日,枣阳市公安局民警远赴福建省福州市将李某抓获。目前,李某因涉嫌危险驾驶罪被刑事拘留。

AWS是亚马逊公司的核心业务之一。2018年,AWS创收256.6亿美元,占亚马逊年度总收入的11%。

AWS“圈粉”无数,预订单已达193亿美元

越来越多的客户承诺会在未来购买亚马逊的服务,AWS服务首当其冲。亚马逊在一份文件中表示,截止到2018年底,合同超过一年的客户所承诺支付的金额总计193亿美元。

调解中,民警闻到李某身上散发着浓烈的酒气,遂当即询问李某如何从兴隆镇过来。面对民警询问,李某一会称是骑两轮电动车过来的,一会称是走过来的。后询问得知,李某驾驶一辆两轮电动车而来。调处纠纷后,民警将李某传唤至派出所接受调查,经呼气测试,李某体内酒精含量为207.30mg/100mL。

我知道你在考试这个问题。真的能在做增广操作的同时,保留其真实标记吗?我们用画图形的方法来验证一下。

雷锋网原创文章,。详情见转载须知。

我们已经演示了在文本分类中,简单数据增广能显著提升性能。如果你正用小数据集训练一个文本分类器,并想取得更好的效果,请在模型中编程实现这些操作,或者从Github中下载EDA代码。更多详情请查看原文。