先说检测机制(注意,这是所有视频平台的原理,不仅限于Tik Tok,Tik Tok可能会用到其中一部分,但不是全部)。
一、初级检测:MD5检测机制。
所有文件都有自己的MD5,不会相互复制。当一个视频第一次上传到Tik Tok(其他平台也一样),系统会自动读取这个视频的MD5。
值,并将其输入您自己的数据库。当一个视频(如果不确定是否是第一次)上传到Tik Tok时,系统将读取该视频的MD5值,并将其与数据库中的现有条目进行比较。如果你找到一致的。
MD5,判断后面的视频是抄袭的,没有一致的结果,然后做出如下判断。
B.关键帧提取和比较。
所有的视频都是通过快速播放图片形成的,每张图片称为一帧。当一个视频第一次上传到某个平台时,系统会自动读取视频的一些时间帧(即前几秒的图片),然后通过算法对图片进行处理,得到视频的图片。
MD5值(或类似值)将该值与当前时间的对应关系存储在数据库中(例如,视频第三秒是狗,第六秒是狗。
是狗和它的主人。当一个视频上传到平台时(如果不确定是不是第一次),系统会读取视频的时间帧,并与数据库中已有的数据进行比较。如果找到一致的时间框架,将判定以下视频为抄袭。如果没有一致的结果,进行以下判断。
骨灰级检测:人工智能算法。
在B检测方法的基础上,进一步分析了一些时间帧的特征,例如,取出AB两个视频的第9秒帧进行比较,以同样的方式将两张图片等分为9块,其中8块。
所有块都是相同或相似的内容,只有一个块不同,这个块大概就是水印;然后比较多个时间段。如果都一样,则判定两个视频相似,平台算法设置相似度超过xx%,表示抄袭。
这里只是人工智能算法中最底层的算法之一。一两个比较复杂的句子不清楚,没必要知道。
D.其他检测方法:人肉报告。
Tik Tok有这个功能,可以举报当前视频抄袭,平台算法设置超过xx。
当人们报告它时,他们会将此视频提交给人工审核团队进行进一步确定。不过说实话,目前Tik Tok这个部门的人很少,大部分都是学黄色的,所以意思是A最好,软件可以改成md5。
另外,视频的水印/去水印/过滤/马赛克/镜像反转/字幕/加帧/删帧会改变原来的md5,而修改视频文件名不会影响MD5。
那么B的方法就是:改变时间框架。例如,如果源视频有15秒长,则在它之前添加1秒钟的内容,或者减去1秒钟的内容,然后在视频的结尾适当地加减1秒钟,并重新组合15。
几秒钟的视频。如果是长视频平台,比如西瓜视频,最常用的方法有:拼接多个视频,添加自己的标题和片头,以及转场等。
根据我们的测试经验,Aauto Quicker、Tik Tok、美拍等短视频产品使用的是A法,可能升级为b法,而西瓜视频、搜狐视频等长视频平台使用的是a b法。
你可能要问,C法很牛逼,哪个平台用这个技术很难,开发一套很贵,普通公司用不了,用爱奇艺/优酷等平台,只是比较低端的技术,我国内的互联网监控系统用的是最牛逼的人工智能算法,主要功能是扫黄。
其实手段也没那么可怕。一是多个平台相互承载,被举报的概率很低;第二,不要带太有名的视频。如果6点半动陈翔,或者pappi酱,就得说是自己做的。你认为每个人都会关心你吗?