机器心脏报告。
作者:泽南
9岁的字节跳动宣布“全引擎将投资”企业技术服务市场,他一上来就计划做50年。
CVPR每年夏天举办的活动是人工智能领域最受欢迎的活动之一。在这场万名学者参与的多日活动中,引领下一个方向的前沿研究将不时涌现,就像2016年一样。
2009年的ResNet和YOLO,2009年的ImageNet和2015年的事件是一样的。
这些业内广泛应用的模型和数据集,经过不断进化和发展,如今已经成为相机中的识别算法,手机上的人脸解锁功能,拍照的美颜工具,甚至自动驾驶汽车上的红绿灯识别能力。
计算机视觉与模式识别会议
大会上还有各种图像识别比赛。来自科技公司和学术机构的研究人员将与最先进的技术竞争。由于赛制更贴近现实,参赛队伍提出的解决方案很可能在几周内出现。
App,成为手机上的新功能。
在今年的CVPR,由AI Benchmark组织的“移动AI”。
“挑战赛”吸引了人们的目光,获得“实时移动检测场景大赛”的队伍得分比第二名高出8倍多。
这个名为ByteScene的团队来自字节跳动。
绝对优势夺冠
在CVPR 2021年的MAI比赛中,来自字节跳动的工程师团队ByteScene获得了实时移动场景检测(Camera Scene)的冠军。
比赛的冠军。
这是苹果A11处理器上的TensorFlow Lite深度学习框架(适用于iPhone X和iPhone 8/8 Plus)。
Ml运行实时移动场景检测算法的竞争。任务人工智能算法需要实时预测摄像机输入图像的场景类别。场景类别有30个,但训练集只有9900个。
图片,对于人工智能来说,有很大的过拟合风险。
ByteScene团队利用迁移学习的方法,想出了一个容量只有8.2Mb的小模型,在平均延迟只有4.4的情况下,实现了Top 1 95%的识别准确率。
毫秒,最终得分是第二名的8倍多。
实时移动场景检测技术已应用于Tik Tok和剪辑等产品。由于操作简单,使用体验智能,这项技术提升了App上的用户体验。
短视频是目前最热门的应用方向,但人们往往很难做出高质量的视频。“智能模板匹配”为大众用户提供了一种低门槛的快速视频创作方法,真正实现了“一键拍摄”。
在CVPR。
比赛中使用的图像场景检测和分类算法,通过预测每个素材中的场景类别,为智能模板匹配提供重要依据,让普通用户通过简单的操作就能剪辑出高质量的视频。
提出这项技术、在比赛中获得冠军并将其应用于Tik Tok的技术团队是字节跳动的“智能创意团队”。团队的研究领域涵盖音视频、计算机视觉、语音、图形图像、工程软件开发等方向。
现在,这个团队的技术已经成为“火山引擎”的一部分,正式对外开放。
数字化智能转型的业务正在吸引越来越多的互联网公司。6月10日,字节跳动智能科技品牌火山发动机首届品牌发布会在京举行。
随着火山发动机一系列核心技术的发布,字节跳动正式宣布进入企业to B市场。
把字节跳动的「秘密」开放出去
企业和个人用户市场的挑战是不同的。进入ToB市场时,字节跳动首先表明了自己的态度:向企业客户公开自己的“秘密”。
做企业服务不是为了字节从零开始。就像一直在实践的概念一样,字节跳动的to B业务也是由需求驱动的。
故事开始于2017年,当时字节跳动因为今天的头条个性化推荐系统刚刚成为讨论的话题,一家手机厂商突然发现了,希望利用这项技术来优化自己的应用商店。
“最后,我们决定接这个订单,这是To B在字节跳动的第一个订单,”字节跳动副总裁杨振源说。“效果出奇的好,客户的广告收入一下子就增加了。
17%,双方的技术团队都进行了升级。经过这次合作,我们决定继续朝这个方向努力。」
很快,其他手机厂商就来找你了。之后,字节跳动开始尝试推广计算机视觉和数据分析产品。
6, 2020
月,字节跳动正式推出了企业技术服务平台火山引擎,依托大数据、人工智能等技术能力,以及增长理念与方法论,这家公司希望能够为客户提供技术产品与解决方案,帮助企业完善数字化转型底层建设。上个星期的正式发布,则宣告了字节跳动已下定决心,要将成立至今的所有技术能力开放给全行业。不论是神秘的推荐系统,还是强大的 AI
美颜功能,在抖音、今日头条、西瓜视频等应用上的技术,所见即所得。
「字节跳动在过去九年间的高速增长,沉淀了经过大规模实践验证的增长方法、工具和技术能力,」火山引擎总经理谭待说道。「这些能力在火山引擎上有机地组合成为了统一的基础服务、技术中台、智能应用和行业解决方案四层架构。其中包含
60 多款单品,被统称为『智能增长技术』。」
具体说来,它提供的能力包括三个方面:
首先是增长方法:其中包括字节跳动多年来自用的创意生产、内容制作、个性化匹配、用户运营能力等,其特点是数据驱动。在字节跳动自身的实践中,从算法改进、功能点验证,甚至每个产品的命名都是以数据驱动方式来进行的。
然后是实用工具:做好一个工具并不容易,在字节内部数千人团队研发的工具支撑了这家公司的业务扩张,它们现在也通过火山引擎对外输出能力。
最重要的是技术能力:用技术解决数字化问题,可以支持业务的爆发增长。在这方面,火山引擎把支持抖音、今日头条等全系产品的同款技术对外提供,包括基础架构、云原生、个性化推荐、音视频处理能力等,它们可以帮助企业更好地实现业务的数字化转型。
综合了方法、工具和技术,火山引擎提供的全链路方案以数据为资源,构建于字节跳动的基础服务之上。这种高度整合的能力降低了企业实现智能化的门槛。
按照字节跳动的总结,这套智能增长技术体系可用四个层次概括:
在最底层是统一基础服务,火山引擎打造了统一的云原生操作系统,一方面可以屏蔽底层 IT 的差异性,支持研发敏捷的迭代,也能够提供弹性、稳定的算力支持。
在这其上是为开发者们准备的技术中台,而智能应用通过数据产品和业务工具来提升非技术人员的工作效率。最后在部分行业中,字节跳动已经打造出了一系列成型的解决方案。
一线字节工程师,向所有企业服务
火山引擎并不只是让已有内容的展示更加灵活,还能为人们带来全新的应用体验。在电商场景中,通过它的 AR
技术,人们可以在手机上试妆、试色、试鞋;通过推荐系统主动推送产品,可以改善用户体验,并提升销量。
抖音同款的 AR 试妆,可以让消费者无需去柜台试色号,在手机上就能体验商品,这项技术为一家美妆交易类客户提升了 12.6% 的购买转化率。
在「智能增长技术」的产品矩阵中,个性化推荐算法很受企业客户青睐。利用高效的信息匹配机制,不同领域的客户获得了效果显著的增长。发布会上一组数据显示,使用火山引擎提供的推荐算法后,某电商客户的人均点击率提高
48.3%,人均 GMV(成交金额)更是提高了 100% 以上,多家手机厂商客户的应用商店、浏览器、负一屏等场景的点击率也有大幅增长。
这样为企业带来实际增长的案例有很多。在合作过程中,它们得到的都是技术研发人员直接的服务:字节跳动选择的组织模式简洁明了,用技术中台直接市场化的方式来支持火山引擎,没有创建新部门。
据介绍,在最新的视频编解码国际标准贡献排在全球前三的先进视频团队,创造了大量抖音爆款特效的智能创作团队,还有推荐算法、数据等不同领域优秀的团队,都在为火山引擎的企业客户服务。
「只有这样才能保证开放出去的是字节跳动内部最好的技术,」谭待说道。
目前,火山引擎的「智能增长技术」已服务了众多客户,包括苏宁、京东、vivo、建设银行、银河证券、吉利、bilibili 和华润,并获得了人们的认可
点燃火种
为什么要做火山引擎,把技术开放出去?字节跳动认为现在到了合适的时候。
「从客户的角度来看,人们对于字节跳动的技术工具很感兴趣。作为科技公司,字节跳动的数字化应用是非常『激进』的。除了抖音和今日头条,我们的内部报表和流程,甚至
HR 系统的绩效评估也是高度数字化分析的。这些内容为公司内部决策有很好的效果,提升了效率。」杨震原表示。
对于字节跳动自身来说,将技术应用到更广泛的范围内,也能让研发团队找到更加合理的发展方向。
「我们的优势在于自身业务的规模与复杂性。在做好自身业务的过程中,我们会发现很多问题、了解大量需求。这些需求打磨出了我们服务的能力,」杨震原说道。
除了众多大公司客户,字节跳动还希望将火山引擎的能量拓展至初创团体,并开放更丰富的技术与服务能力。发布会上,火山引擎推出了火种计划。
「对于小微企业来说,火种计划可以帮助他们在人力和资源有限的情况下,用上比较好的基础服务工具。」谭待说道,火种计划将向小微企业限时免费开放多款智能应用及数据产品,首批名额一千家。而在工业智能化转型过程中,互联网公司的技术无法生搬硬套,需要针对具体场景做更深入的优化,火山引擎也在与行业领军企业合作,共同研究解决方案,促进行业的数字化转型升级。
开放自身领先技术的举动,在科技公司中并不让人陌生。推动云服务成为新时代基础设施的亚马逊
AWS,最早就是工程师们将自身运维工具、管理平台开放的一次「无心插柳」。但如今字节跳动的入局,显然会为企业服务市场带来新的冲击。
在火山引擎宣布大规模应用之后,一些声音认为字节跳动正在切入云服务市场,是要做中国「第四朵云」。不过对此这家公司的态度较为谨慎,表示:火山引擎目前还没有推出公有云产品,对市场相关猜测不做评论。
不论如何,做企业服务就需要持续而大规模的投入。字节跳动表示,自己有做好这件事情的决心和耐心。
「To B 市场行业间差异巨大,业务链条长,上下游复杂,我们需要学习的东西还有很多,」杨震原说道,「我们接下来可能需要在 30 年、50
年里一直做这件事情,才能取得更好的成功。」