微信公众号悄悄上线AI音色克隆,微信的一小步,却是AI的一大步。 * { margin: 0; padding: 0; outline: 0; } body { font-family: “PingFang SC”, system-ui, -apple-system, BlinkMacSystemFont, “Helvetica Neue”, “Hiragino Sans GB”, “Microsoft YaHei UI”, “Microsoft YaHei”, Arial, sans-serif; line-height: 1.6; } .__page_content__ { max-width: 667px; margin: 0 auto; padding: 20px; text-size-adjust: 100%; color: rgba(0, 0, 0, 0.9); padding-bottom: 64px; } .title { user-select: text; font-size: 22px; line-height: 1.4; margin-bottom: 14px; font-weight: 500; } .__meta__ { color: rgba(0, 0, 0, 0.3); font-size: 15px; line-height: 20px; hyphens: auto; word-break: break-word; margin-bottom: 50px; } .__meta__ .nick_name { color: 576B95; } .__meta__ .copyright { color: rgba(0, 0, 0, 0.3); background-color: rgba(0, 0, 0, 0.05); padding: 0 4px; margin: 0 10px 10px 0; } blockquote.source { padding: 10px; margin: 30px 0; border-left: 5px solid ccc; color: #333; font-style: italic; word-wrap: break-word; } blockquote.source a { cursor: pointer; text-decoration: underline; } .item_show_type_0 > section { margin-top: 0; margin-bottom: 24px; } a { color: 576B95; text-decoration: none; cursor: default; } .text_content { margin-bottom: 50px; user-select: text; font-size: 17px; white-space: pre-wrap; word-wrap: break-word; line-height: 28px; hyphens: auto; } .picture_content .picture_item { margin-bottom: 30px; } .picture_content .picture_item .picture_item_label { text-align: center; } img { max-width: 100%; } .pay_subscribe_notice { margin: 30px 0; padding: 20px; background: fffbe6; border: 1px solid ffe58f; border-radius: 8px; } .pay_subscribe_badge { display: inline-block; padding: 4px 12px; background: faad14; color: fff; border-radius: 4px; font-size: 14px; font-weight: 500; margin-bottom: 12px; } .pay_subscribe_desc { font-size: 15px; line-height: 1.8; color: rgba(0, 0, 0, 0.7); margin-bottom: 12px; } .pay_subscribe_hint { font-size: 13px; color: rgba(0, 0, 0, 0.4); } .__bottom-bar__ { display: flex; justify-content: space-between; align-items: center; position: fixed; bottom: 0; left: 0; right: 0; height: 64px; padding: 8px 20px; background: white; box-sizing: border-box; border-top: 1px solid rgba(0, 0, 0, 0.2); } .__bottom-bar__ .left { display: flex; align-items: center; font-size: 15px; white-space: nowrap; } .__bottom-bar__ .right { display: flex; } .__bottom-bar__ .sns_opr_btn { display: flex; align-items: center; user-select: none; background: transparent; border: 0; color: rgba(0, 0, 0, 0.9); font-size: 14px; } .__bottom-bar__ .sns_opr_btn:not(:last-child) { margin-right: 16px; } .__bottom-bar__ .sns_opr_btn > img { margin-right: 4px; }
微信公众号悄悄上线AI音色克隆,微信的一小步,却是AI的一大步。
原创 数字生命卡兹克 数字生命卡兹克 2024-11-18 09:01 北京
这篇文章,可能是我有史以来最特殊的一篇文章。
因为当你点开右上角的三个点,点击听全文的时候。
可能你会发现,你听到的不再是那个永远跟其他人一样,相同的男声。
而是,AI克隆的我的声音。
此时,微信可能会用我的声音,来为你朗读出这篇文章。
之所以,我一直在说可能,是因为我虽然在后台设置好了,但是只有这篇新发的文章,我才能知道,我的声音到底有没有生效。
不过,再怎么说,这都是微信的一小步,却是AI的一大步,真的。
这个周末,在登录手机端公众号后台的时候。
意外的发现公众号版本又更新了,更新到了2.29.1,当然版本号无所谓,重要的是,这个设置里面的新功能:朗读音色。
以前是绝对没有这个功能的,作为一个几乎以公众号为生的我,对公众号后台的一点点变动,都会非常的敏感。
点开以后,会有一个系统默认的音色,你可以,创建自己的音色。
点击创建新的音色,就会进入到一个新页面,会让你现场朗读一句话。
甚至会从你的实际文章中,抽取一些片段,来让你读,非常的有意思。
这里我正好也解释一下,为啥现在微信、豆包、kimi等等产品,在做AI音色克隆的时候,都要让你现场读一段文本,再用这段音频去做音色克隆,而不是让你随便上传一段音频呢?
原因很简单,因为合规和风控。
前段时间三只羊AI音频事件,还有AI雷军国庆节在微博上骂了7天等等,我想大家应该都能感受到,AI克隆音色这玩意一旦放开,会有多少跟诈骗相关的风险。
一旦放开,可以随便上传一段音频,最开心的不是你我他,而是骗子。
看我号的读者,应该尚且知道AI音频的东西,在收到一些身边亲近人的语音的时候会产生一些警惕,但是我们家里的老人呢?他们很多人对现在的AI并不是很了解,一旦AI音色克隆放开,很容易就是骗子拿着你4、5秒的音频去发给你的爷爷奶奶舅舅舅妈,骗取他们的信任。
且万一有一些人,如果真的石乐志,克隆一些官员的声音,那…后果基本不敢设想。
所以,现在基本清一色都是这种方式,让你用实时录制的方式,念出文本上的随机的话,还不能念错。
用这种方式,来证明你是你。
尽最大的可能,提高门槛,降低风险。
在你读完这段话后,就会嘟嘟嘟的进入克隆的步骤,速度很快,大概十几秒就能完全搞定。
然后,你就可以听到,克隆好的声音示例了。
音色基本很完美,跟我声音一样,情绪是TTS的老问题了,不说了,整体质听感上,是还算OK的。
最后,就可以应用了。
我测试了一下,老的文章还是不会变的,可能只有新的文章,才能支持我的音色。
所以只有这篇发出来,我才能知道,我的音色,来听全文,到底是个什么感觉,以及,到底会不会用我的音色。。。
其实,我脑子里幻想过,公众号到底会怎么接入AI,来帮这个可能是最大的长图文平台赋能。
想过AI创作,想过AI起标题,想过AI搜索,想过AI总结,但是没想到的是,来的第一个,居然是AI音色克隆。
不过其实细想想,也合理。
公众号这个载体,我一直调侃说,我可能是最后给公众号送终的那一批人。
短视频俯瞰众生,短图文在侧不断侵蚀羽翼,身后还有播客虎视眈眈。
长图文,变的越来越像一个日落西山的老人,守着自己的一亩三分地,尽可能的给大家种出最好的果实。
而公众号,作为长图文领域无与伦比的王者,非常坦率的讲,一直有一个在我看来很大的问题,过往很难解决,就是IP化很难。
我说的难,是它天然的隔离感。
短视频为什么做一个人的IP,比公众号简单很多?是因为内容载体。
在公众号上,你看到的永远是冷冰冰的文字,即使作者把这段话,写的登峰造极,写的舌灿莲花,你能看到的也依然是文字,是神交。
而短视频呢?你看到的不是文字,是一个具象化的人,你知道他长什么样,哦这个人有点长的有点潦草头发看着总是好久不洗,哦还有一个人带着眼镜总是说话的时候张不开嘴。
而那些内容,更是他亲口念出来的,你看到所有的文字,不是冷冰冰的文字,而是他在读,你听到的除了信息,还有情绪,还有他的笑与泪。
这是声音的力量。
在上古时期,没有文字,本就一直以声音传递智慧。
先民口耳相传,吟游四方。
这就是为啥,在短视频上做IP,要比公众号,简单的多。
而这一次更新,我觉得很有趣的一点是,微信公众号这一次的更新,他们把声音,给补上了。
你不仅可以看到我的文字,更可以听到,我的声音。
在过往,我们用文字表达思想,用图片传递视觉,现在又多了一个维度,可以用我们自己的的声音来传递情感。
声音终于成为了我们这群做图文内容的人的有机组成部分,而不在只是,机械的朗读。
我乐意看到微信的每一次变化,特别是跟AI有关的更新。
这是微信的一小步,却也是AI的一大步。
AI,很多时候就像空气一样,只有当你感受不到它,觉得他是我们生活中理所应当的一部分,这时候,AI就算是真正的成功进入每个你我一样的普通人的生活中了。
微信,作为可能是我们国内,最大的超级APP,没有什么,比他跟AI的结合,影响范围更广了。
以后的某一天,可能所有的公众号,都有了自己的专属声音。
那时候,还会有谁在乎,这是不是AI呢?
这一切,难道不是本来就这样的嘛。
以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~谢谢你看我的文章,我们,下次再见。
>/ 作者:卡兹克
>/ 投稿或爆料,请联系邮箱:wzglyay@gmail.com
数字生命卡兹克
 阅读 赞  分享 ‘%3E %3Cg transform=‘translate(0 -2.349)‘%3E %3Cpath d=‘M0 2.349h24v24H0z’/%3E %3Cpath fill=‘%23576B95’ d=‘M16.45 7.68c-.954 0-1.94.362-2.77 1.113l-1.676 1.676-1.853-1.838a3.787 3.787 0 0 0-2.63-.971 3.785 3.785 0 0 0-2.596 1.112 3.786 3.786 0 0 0-1.113 2.687c0 .97.368 1.938 1.105 2.679l7.082 6.527 7.226-6.678a3.787 3.787 0 0 0 .962-2.618 3.785 3.785 0 0 0-1.112-2.597A3.687 3.687 0 0 0 16.45 7.68zm3.473.243a4.985 4.985 0 0 1 1.464 3.418 4.98 4.98 0 0 1-1.29 3.47l-.017.02-7.47 6.903a.9.9 0 0 1-1.22 0l-7.305-6.73-.008-.01a4.986 4.986 0 0 1-1.465-3.535c0-1.279.488-2.56 1.465-3.536A4.985 4.985 0 0 1 7.494 6.46c1.24-.029 2.49.4 3.472 1.29l.01.01L12 8.774l.851-.85.01-.01c1.046-.951 2.322-1.434 3.59-1.434 1.273 0 2.52.49 3.472 1.442z’/%3E %3C/g%3E %3C/g%3E %3C/g%3E%3C/svg%3E) 推荐 ’ fill=‘%23000’ fill-opacity=’.9’/%3E%3C/svg%3E) 留言