以服务于中国广大创业者为己任,立志于做最好的创业网站。

标签云创业博客联系我们

导航菜单

快手靠播放量怎么赚钱 快手发视频能赚钱吗么

  

     

  

     

  

  智东西(公众号:zhidxcom)   

  

  文| 李水青   

  

  近年来,短视频成为移动互联网全速发展的地方,Aauto Quicker也成为最大的流量收割者之一。   

  

  据统计,2018年,Aauto快手短视频App日活跃量达2亿,日播放量达200亿;大约每七个中国人中就有一个是Aauto的内容制作人,每天有超过1500万部新作品。同时,超过1600万人通过Aauto Quicker App获得收入,总收入超过200亿。   

  

  自2011年成立以来,从一款Gif生成工具,Aauto faster已经成为日常生活最赚钱的短视频内容社区之一,先后被百度、腾讯等互联网巨头投资,发展速度惊人。   

  

  作为新一代视频平台,Aauto faster的AI“黑科技”也贯穿其内容、分发、互动的每一个环节,让人想一探究竟。   

  

  近日,Zhidx来到Aauto quick总部,有幸拜访了Aauto quick的异构计算架构师钟辉,了解了这个“全国视频社区”背后的AI技术应用,以及英特尔提供的硬核“设备”。钟辉的电脑屏幕上显示着“2020年春节前38天”的倒计时,对他来说就像是“高考倒计时”。据了解,快手上个月刚刚中标2020年央视春晚独家互动合作伙伴。   

  

     

  

  一、快手,越来越像家AI公司   

  

  很多“Aauto faster”用户都可以体验到,Aauto faster APP中有很多很酷的视频特效和打包功能,这也是Aauto faster AI“秀技能”的一大窗口。   

  

  在录制和制作体验方面,梵高特效中的场景语义分割、雷神中的手势识别、国内首创的“智能剪影”、不选择手机配置的“换小孩脸”特效中的移动终端实时GAN都是自主研发。   

  

     

  

  在消费者交互体验方面,其视频增强、转码、播放、渲染、直播、游戏服务都涉及到很多不同的智能技术,比如将720P视频升级到1080P的超分割算法。   

  

  内容方面,Aauto faster在内容安全、原创保护、视频配音等方面都有自己的“多模态内容理解”逻辑。   

  

  具体来说,Aauto faster让机器提取用户上传的文本、图像和音频中的特征,通过知识图谱、语义理解和分类检索技术,将视频与音乐的起伏进行匹配,检查内容是否涉及色情和赌博,判断内容是否抄袭其他网络名人视频。   

  

     

  

  Aauto quick的相关负责人告诉郅都,Aauto quick更致力于通过机器学习、强化学习和图形表达学习来践行“包容性”价值观。   

  

  具体来说,通过新一代推荐系统,Aauto Quicker一方面采用“基础曝光爬坡”的机制,让所有用户的内容既能获得关注,又能沉淀精品;另一方面,利用“基尼系数”平衡流量分布,将大主播的流量适当分配给长尾用户,从而在流量维度上缩小“贫富差距”。   

  

     

  

  二、面临存储、网络和计算挑战,搭建异构计算平台   

  

  在AI和大数据的驱动下,它在Aauto faster中从“内容生产”到理解、分发、消费、互动的每一个环节都有所体现。作为一个专注于短视频/直播的全国性社区,Aauto faster的AI应用数据中心在存储、网络和计算方面都面临着巨大的挑战。   

  

  Aauto faster的异构计算架构师钟辉表示:“一方面,每天新增作品超过1500万件,内容数据、行为数据和数据特征提取带来巨大的存储挑战;另一方面,训练和推理中的特征参数越来越多,导致模型越来越大,带来了这些数据在网络中传输的挑战。加上每天几千亿。   

的展示,这当中也带来了计算和内存挑战。”

  

  

快手的一大关键解法是构建“异构计算平台”。

  

简单地说,“异构计算”就是在CPU加上各种加速器,如FPGA(Field Programmable Gate

  

Array,现场可编程门阵列)、ASIC(Application Specific Integrated Circuit,专用集成电路)、GPU等等。

  

近年来,CPU性能提升已经遇到了明显瓶颈,每年仅提升约3%,但是数据的增长率却达到30%,所以供需之间有一个巨大的缺口,异构计算应运而生。

  

在加速器上,快手选择英特尔的FPGA产品加持其数据中心。FPGA是可编程的器件,具有灵活、低延迟的特点,正好契合快手快速发展的AI模型、算子。

  

钟辉说:“相比于GPU,FPGA更适用于线上强调实时推理的应用场景,并且在数据中心,FPGA是有网口的,而GPU是没有的,所以有一些任务GPU是不擅长做的。”

  

  

三、三大类异构平台,基于英特尔FPGA

  

钟辉介绍,快手异构平台分为三大类,分别是基于英特尔A10、E3S10和PAC S10的器件。

  

以A10为例,它的峰值算力可以达到1.366TFLOPS,它也有一列列的片上的SRAM,这就构成了片上的分布式存储,可以提供6MB的SRAM;区别于CPU和GPU,它的片上的SRAM是分布式的,所以它可以提供高达8TB/s的并行带宽,非常满足深度学习模型的需求。

  

  

另外,A10也有片外的DDR,从接口来说,它提供了PCIe的接口,可以以加速卡的形式插在服务器上,构成一个异构计算系统。

  

同时,A10的网络接口也是GPU所没有的。从开发工具来说,传统的FPGA开发有一个非常大的问题,那就是开发周期非常长,现在英特尔推出了OpenCL的开发语言降低了开发难度,虽然还不能像软件一样去做硬件,但是对于有一定硬件背景设计人员来说,开发难度和周期可以明显降低。

  

钟辉说:“另外一个很有意思的是英特尔E3S10,这个大加速卡上面是E3的CPU,视频编解码能力非常强,因为它里面还有专门的GPU。然后,再加上S10的FPGA,就构成了一个比较齐全的异构加速卡。”

  

四、比CPU方案功耗效率提升8倍

  

钟辉接着介绍了快手基于OpenCL的开发案例:“我们在数据中心部署FPGA,面临‘上天’和‘入地’两个方面的挑战。”

  

“上天”是说FPGA是部署在云上的,因此快手团队首先要提高业务服务容量,充分利用FPGA来降低线上服务延时,同时像开发软件一样去交付硬件,从而实现高速的业务迭代;“入地”则谈的是部署,则要求成本可担负、具有稳定性且能耗更低,另外,还需要规模化、容器化部署,以解决资源的弹性部署。

  

  

以DRN(Deep Ranking

  

Network)加速为例,当时商业化部门的排序网络在业务高峰期出现了抖动,需要采用异构方案来做加速。考虑到其中以计算为主的工作负载占到了CPU负载的50%,所以团队把计算这一块Off-

  

loading到FPGA上去。

  

在硬件设计上,团队通过矩阵乘法将算法映射到FPGA的阵列结构上。但是,由于用了上千个乘法单元,运行达到几百兆,DDR根本无法满足。所以团队就采用了Systolic

  

Array(脉动阵列)结构,把输入数据放到分布式的SRAM上,从而提供了这个应用要求的算力和带宽,同时降低了功耗。

  

  

钟辉说:“我们可以看到,相比于CPU方案,延迟降低了约1.5倍,最大吞吐大概提升了1.7倍左右,功耗有接近5倍的降低,从功耗效率来说提升了近8倍。这个我们已经在数据中心当中规模化的部署了,这是我们商业化的一个业务场景。从FPGA在数据中心落地的角度来讲是比较领先的。”

  

  

结语:社交媒体平台全面AI化,海量数据还靠算力

  

长期以来,社交媒体平台一直不算走在AI技术舞台的中心,但通过此次的实地探访,我们发现这家“国民级”短视频公司的AI技术似乎比我们从App表面上看到的要深入得多。

  

在快手AI应用背后,日均新增超1500万作品、千亿级的展示、越来越大的算法模型都为存储、传输和计算带来了巨大的挑战,对此,快手选择英特尔CPU、FPGA支持的“异构计算”器件来加以应对,从而实现了延迟、功耗效率的极大优化。

  

随着AI技术渗透到各行各业,社交媒体行业的AI化也深入到内容生成、内容分发、用户互动、引导消费等各个环节。计算力是AI发展的三大要素之一,很多企业已有成熟的算法和更充分的数据,这时利用异构计算等技术来提升算力也成为一大关键举措。

  

感谢阅读。点击关注上船,带你浪在科技前沿~