别笑,你可能也分不清这些视频是不是AI的。 * { margin: 0; padding: 0; outline: 0; } body { font-family: “PingFang SC”, system-ui, -apple-system, BlinkMacSystemFont, “Helvetica Neue”, “Hiragino Sans GB”, “Microsoft YaHei UI”, “Microsoft YaHei”, Arial, sans-serif; line-height: 1.6; } .__page_content__ { max-width: 667px; margin: 0 auto; padding: 20px; text-size-adjust: 100%; color: rgba(0, 0, 0, 0.9); padding-bottom: 64px; } .title { user-select: text; font-size: 22px; line-height: 1.4; margin-bottom: 14px; font-weight: 500; } .__meta__ { color: rgba(0, 0, 0, 0.3); font-size: 15px; line-height: 20px; hyphens: auto; word-break: break-word; margin-bottom: 50px; } .__meta__ .nick_name { color: 576B95; } .__meta__ .copyright { color: rgba(0, 0, 0, 0.3); background-color: rgba(0, 0, 0, 0.05); padding: 0 4px; margin: 0 10px 10px 0; } blockquote.source { padding: 10px; margin: 30px 0; border-left: 5px solid ccc; color: #333; font-style: italic; word-wrap: break-word; } blockquote.source a { cursor: pointer; text-decoration: underline; } .item_show_type_0 > section { margin-top: 0; margin-bottom: 24px; } a { color: 576B95; text-decoration: none; cursor: default; } .text_content { margin-bottom: 50px; user-select: text; font-size: 17px; white-space: pre-wrap; word-wrap: break-word; line-height: 28px; hyphens: auto; } .picture_content .picture_item { margin-bottom: 30px; } .picture_content .picture_item .picture_item_label { text-align: center; } img { max-width: 100%; } .pay_subscribe_notice { margin: 30px 0; padding: 20px; background: fffbe6; border: 1px solid ffe58f; border-radius: 8px; } .pay_subscribe_badge { display: inline-block; padding: 4px 12px; background: faad14; color: fff; border-radius: 4px; font-size: 14px; font-weight: 500; margin-bottom: 12px; } .pay_subscribe_desc { font-size: 15px; line-height: 1.8; color: rgba(0, 0, 0, 0.7); margin-bottom: 12px; } .pay_subscribe_hint { font-size: 13px; color: rgba(0, 0, 0, 0.4); } .__bottom-bar__ { display: flex; justify-content: space-between; align-items: center; position: fixed; bottom: 0; left: 0; right: 0; height: 64px; padding: 8px 20px; background: white; box-sizing: border-box; border-top: 1px solid rgba(0, 0, 0, 0.2); } .__bottom-bar__ .left { display: flex; align-items: center; font-size: 15px; white-space: nowrap; } .__bottom-bar__ .right { display: flex; } .__bottom-bar__ .sns_opr_btn { display: flex; align-items: center; user-select: none; background: transparent; border: 0; color: rgba(0, 0, 0, 0.9); font-size: 14px; } .__bottom-bar__ .sns_opr_btn:not(:last-child) { margin-right: 16px; } .__bottom-bar__ .sns_opr_btn > img { margin-right: 4px; }
别笑,你可能也分不清这些视频是不是AI的。
原创 数字生命卡兹克 数字生命卡兹克 2024-10-08 09:31 北京
昨天,我和我的小伙伴们都拜倒在了一个AI视频的测试下。
就是给你10个视频,让你来选这是不是AI生成的。
我,一个专门做AI的自媒体,在一顿狂点之下,轻敌了,堪堪拿了60分。。。
我的小伙伴,有不及格的,有70分的,但是最高的那个也才90分。
痛。。太痛了。
我放其中的三个视频,给大家看一下:
你们可以评论区留言猜一下,谁是AI谁不是AI,反正我看的快眼花了。
友情提示:这三不是全AI,是真有一个是真实的视频。
只能说,AI要是真的想骗我,有时候真的一骗一个准,我还得摇着脑袋说,这肯定不是AI。
我们都尚且如此,更不用说对AI不是那么关注的普通人了。
被骗上的新闻也是屡见不鲜。
比如之前一个案例,一个由“AI马斯克”背书的一家所谓的外汇公司轻松骗走了一名82岁的退休老人69万美元(大概495万元人民币)的毕生积蓄。
还有B站UP主滤镜粉碎机拍的视频,用AI口型驱动后的自己,骗走了老妈的2万块钱。
7月份,在X上还有个视频非常的火,就是所谓的拜登退出总统竞选后首次发表视频讲话。
但这个视频,其实就是彻头彻尾的AI。
当真相大白的那一刻,网友们全部麻了。
防不胜防,真的,当现在AI视频越来越逼真,在口型驱动、AI换脸技术几乎快没有任何门槛的情况下,一些伪造的视频,对一些对AI不太了解的人,几乎就是降维打击,难以分辨。
现在做这种视频,真的很简单,去年这种技术火起来的时候,就是2D数字人还有heygen那套让霉霉说中文,让郭德纲说英文,普通人用起来,还稍微有点难度,效果也没那么好,语音不够真,唇形也有破绽。
一年以后,门槛几乎已经被拉到了0,而且效果也走到了你不仔细识别真假难辨的地步。
典型的如很多手机APP,我就不说名字了。
你直接上传一段念123456的视频,再加一段配音,直接就用AI对完口型完事。就跟很久以前影视圈的那群Idol一样,不背台词上来念123456,再后期配音。
现在AI更近一步,直接把这种技术,下放给了所有普通人。
现在已经不知道有多少带货的短视频,是用12345+AI换出来的了,抖音上刷到太多太多了。
还有比如剪映里,有个视频翻译,你只需要上传一段你自己的视频,它就能把你说中文的声音,翻译成另外5种语言,口型还一模一样。
门槛低到有手就行,真的。
但是我觉得,做归做,在如今法规不完善的情况下,知道如何识别是否是AI换口型做出来的AI视频,还是有必要的。
有两个我自己认为比较实用,也是可能为数不多的方法。
第一个,看口唇和牙齿。
我大概用一个故事来解释一下这种换口型的原理。用张三来举例子吧。
比如张三这哥们,最近迷上了做木偶戏。木偶戏本身都是肢体艺术,但是张三想更近一步,让观众看到木偶好像在说话。
于是,张三想到了一个很抽象的办法,先录下自己说话的声音,然后用橡皮泥给木偶做一个能动的嘴巴。他把这个橡皮泥的新嘴巴安在木偶脸上,然后根据录音的节奏移动木偶的嘴巴,以便跟说话时候的口型对齐。
这样一来,木偶看上去就真的在说话。
AI对口型技术和这个木偶戏很像。它先找到视频中人物的嘴巴,然后根据声音创造一个新的会动的嘴巴,最后把新嘴巴”安装”到原来的脸上。
这种假嘴巴,如果你细看的话,还是会发现一些问题的,比如嘴巴周围可能有点模糊,像是用橡皮擦蹭过的那种感觉。
一些技术不是很好的AI对口型,他的嘴巴跟踪做的不是很好,还会产生轻微的抖动现象。
最有效的,还是认真看牙齿,至少现在的AI,还达不到那种完美一致性的牙齿的动作和物理效果,经常会产生一些奇奇怪怪的BUG。比如霉霉这个AI视频。
牙齿都重影了,都有好几层了。
这个东西你只要有心留意,或者只是多看几遍,肯定能还是能感觉的出来的。
第二个方法,就是看动作是不是重复。
这个对于每次都上传新的视频片段的做法是无效的,因为每次都是实拍换口型而已,但是可以有效的鉴别2D数字人。
比如这个Reid Hoffman和自己AI分身访谈的视频。
你会发现,这个AI分身翻来覆去就那么几个重复的动作。
一些做的不是特别好的2D数字人,因为动作匹配算法不是很好,还会有一些莫名其妙的耸肩、点头或用来强调的手势,说话时目光游离,不自然的眨眼等等。
就是你能明显的感觉到,一些肢体动作是完全不匹配你的说话的重音和节奏的。
但是有些做的好的,你可能看不出来,这时候,就需要你去数对方的动作了。
因为2D数字人做法,是你录一段35分钟的视频,这个视频里会包含一些动作,后面你不管怎么驱动,其实动作都是从这35分钟的原始片段里去取。
所以,你会发现,姿势必然会重复。
这个就是识别AI视频,或者说AI数字人的一个为数不多的识别方法了。
显然,类似的AI伪造视频,在社交媒体上,只会越来越继续增长。X上已经快被类似的视频淹没了。没有门槛,足够整活。在法规不完善的今天,你拿这些“创作者”也没有任何办法。
道高一尺,魔高一丈。
我也不知道,类似的产物会最终走向何方。
但是,我觉得让普通人都知道、了解这项技术,可能是对抗一些不法分子的最有效的途径之一。
毕竟,这世界上。
还是好人多。
以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~谢谢你看我的文章,我们,下次再见。
>/ 作者:卡兹克、小瑞
>/ 投稿或爆料,请联系邮箱:wzglyay@gmail.com
数字生命卡兹克
 阅读 赞  分享 ‘%3E %3Cg transform=‘translate(0 -2.349)‘%3E %3Cpath d=‘M0 2.349h24v24H0z’/%3E %3Cpath fill=‘%23576B95’ d=‘M16.45 7.68c-.954 0-1.94.362-2.77 1.113l-1.676 1.676-1.853-1.838a3.787 3.787 0 0 0-2.63-.971 3.785 3.785 0 0 0-2.596 1.112 3.786 3.786 0 0 0-1.113 2.687c0 .97.368 1.938 1.105 2.679l7.082 6.527 7.226-6.678a3.787 3.787 0 0 0 .962-2.618 3.785 3.785 0 0 0-1.112-2.597A3.687 3.687 0 0 0 16.45 7.68zm3.473.243a4.985 4.985 0 0 1 1.464 3.418 4.98 4.98 0 0 1-1.29 3.47l-.017.02-7.47 6.903a.9.9 0 0 1-1.22 0l-7.305-6.73-.008-.01a4.986 4.986 0 0 1-1.465-3.535c0-1.279.488-2.56 1.465-3.536A4.985 4.985 0 0 1 7.494 6.46c1.24-.029 2.49.4 3.472 1.29l.01.01L12 8.774l.851-.85.01-.01c1.046-.951 2.322-1.434 3.59-1.434 1.273 0 2.52.49 3.472 1.442z’/%3E %3C/g%3E %3C/g%3E %3C/g%3E%3C/svg%3E) 推荐 ’ fill=‘%23000’ fill-opacity=’.9’/%3E%3C/svg%3E) 留言