用AI五分钟就能生成一档播客?感觉降维打击了。 * { margin: 0; padding: 0; outline: 0; } body { font-family: “PingFang SC”, system-ui, -apple-system, BlinkMacSystemFont, “Helvetica Neue”, “Hiragino Sans GB”, “Microsoft YaHei UI”, “Microsoft YaHei”, Arial, sans-serif; line-height: 1.6; } .__page_content__ { max-width: 667px; margin: 0 auto; padding: 20px; text-size-adjust: 100%; color: rgba(0, 0, 0, 0.9); padding-bottom: 64px; } .title { user-select: text; font-size: 22px; line-height: 1.4; margin-bottom: 14px; font-weight: 500; } .__meta__ { color: rgba(0, 0, 0, 0.3); font-size: 15px; line-height: 20px; hyphens: auto; word-break: break-word; margin-bottom: 50px; } .__meta__ .nick_name { color: 576B95; } .__meta__ .copyright { color: rgba(0, 0, 0, 0.3); background-color: rgba(0, 0, 0, 0.05); padding: 0 4px; margin: 0 10px 10px 0; } blockquote.source { padding: 10px; margin: 30px 0; border-left: 5px solid ccc; color: #333; font-style: italic; word-wrap: break-word; } blockquote.source a { cursor: pointer; text-decoration: underline; } .item_show_type_0 > section { margin-top: 0; margin-bottom: 24px; } a { color: 576B95; text-decoration: none; cursor: default; } .text_content { margin-bottom: 50px; user-select: text; font-size: 17px; white-space: pre-wrap; word-wrap: break-word; line-height: 28px; hyphens: auto; } .picture_content .picture_item { margin-bottom: 30px; } .picture_content .picture_item .picture_item_label { text-align: center; } img { max-width: 100%; } .pay_subscribe_notice { margin: 30px 0; padding: 20px; background: fffbe6; border: 1px solid ffe58f; border-radius: 8px; } .pay_subscribe_badge { display: inline-block; padding: 4px 12px; background: faad14; color: fff; border-radius: 4px; font-size: 14px; font-weight: 500; margin-bottom: 12px; } .pay_subscribe_desc { font-size: 15px; line-height: 1.8; color: rgba(0, 0, 0, 0.7); margin-bottom: 12px; } .pay_subscribe_hint { font-size: 13px; color: rgba(0, 0, 0, 0.4); } .__bottom-bar__ { display: flex; justify-content: space-between; align-items: center; position: fixed; bottom: 0; left: 0; right: 0; height: 64px; padding: 8px 20px; background: white; box-sizing: border-box; border-top: 1px solid rgba(0, 0, 0, 0.2); } .__bottom-bar__ .left { display: flex; align-items: center; font-size: 15px; white-space: nowrap; } .__bottom-bar__ .right { display: flex; } .__bottom-bar__ .sns_opr_btn { display: flex; align-items: center; user-select: none; background: transparent; border: 0; color: rgba(0, 0, 0, 0.9); font-size: 14px; } .__bottom-bar__ .sns_opr_btn:not(:last-child) { margin-right: 16px; } .__bottom-bar__ .sns_opr_btn > img { margin-right: 4px; }

用AI五分钟就能生成一档播客?感觉降维打击了。

原创 数字生命卡兹克 数字生命卡兹克 2024-09-18 09:30 北京

原文地址: https://mp.weixin.qq.com/s/33owTCQkHtdFQRPQgHcC6A

不是,直接给一篇文章,然后用AI就能生成十几分钟的双人播客,两人有打断、有调侃、有语气,一个捧哏一个逗哽各司其职,比人聊的还好听,你敢信?

这个中秋假期,我信了,真的。

Google做的一款AI笔记应用,NotebookLM,这几天更新了一个新功能,就是根据文本,生成双人播客。

他们称这个功能,为音频概览。

我把我前几天写的那篇OpenAI上线o1的公众号文章扔了进去,生成了一个播客,给你们听下效果。

这个语气,这个聊天的感觉,我人麻了。

几乎跟真人无异,在一个人说话的时候,另一个人甚至会在其中穿插一些嗯啊之类的语气反应,还会打断,附和。

最重要的是,这种形式,真的很有趣。

过往,我们已经看到了无数,使用AI帮助自己学习的例子。

比如我自己最喜欢的,把一个名词或者一句我不懂的话,扔给Claude或者ChatGPT,然后附一段我自己最喜欢的Prompt:

“我是一个六年级的小朋友,请用极度详细、通俗易懂的例子帮助我理解这部分信息。”

他会给我讲解的非常非常细致,比如,解释一下最近海外独角兽文章中的一句话:“纯靠语言的经典 scaling law 做 pre-train 的这个物理规律是不是就遇到瓶颈了?”

无敌好用,真的,在我学习路上陪伴了我N久,非常适合我这种笨比门外汉。

但是不管是解释、还是思维导图、还是各种摘要或提问,其实有一个共同点,那就是:

全部都是基于文字的。

但是这种有一个很大的问题是,并不是每个人,或者说每个时间,都是通过阅读来学习的。

很多人其实是听觉学习者,或者在一些不方便阅读的时候,使用听觉来获取信息以及学习,比如播客两个最典型的场景,其实是做家务和开车

这两个场景,占据了相当大的时间,但是这个时候,你想阅读,是不可能的。

播客的使用量也急剧上升,不管是国内还是国外,播客也都证明了,理解一个主题的最有效方式之一,是倾听两个有趣且投入的人进行对话。

但播客的数量,就那么点,求人不如求己,被动学习不如主动学习。

所以,在此基础上,Google NotebookLM的“音频概览”应运而生。

只能说他们太懂学习了。

网址在此:https://notebooklm.google/

记得上魔法,然后登录google账号就能直接用。

进去了,先创建一个笔记本,每个笔记本你可以理解为,是一个单独的知识库。

你可以扔网址、扔文件,也可以只粘贴文字。

我把我的人物简历PDF扔进去以后,他就会自动对内容进行解析,给你弹出笔记本指南。

你可以跟知识库一样随便问随便学习,可能列出目录、时间线等等,当然,最屌的还是那个音频概览。

点一下生成,最多耗时五分钟,你就能得到一个大约十分钟的,由两个AI 主持人进行“深度探讨”的英文音频播客。

我把两人聊我简历的这段小播客,扔到飞书妙记里,给大家看一下大概的内容。

这两人聊的,真的很有趣,情绪价值拉满,中间还会针对我的经历做一些讨论,给我加一些奇奇怪怪的梗。

说实话,听到有人用很聊天的感觉,在聊我的故事,那感觉还是有点羞耻的,但是,不知不觉,这6分钟很快就听完了。。。

整体,这个效果好是好,但是在我听了十几段我把各种乱七八糟的文件、笔记、研报、文章、网站扔进去之后,我也发现了三个很大的问题。

1. 那还是语言问题,作为一个中国人,我还是喜欢听自己的母语,没有什么比中文更酷的语言了,但是现在的NotebookLM,只能生成英文,这肯定不够,11Labs还能生成29种语言呢。

2. 不支持声音克隆,就跟文本、绘图、音乐一样,一定会有人希望用这个东西去做自己的播客的,如果全世界都是现在这两人的声音,那听一听肯定就还是腻了,如果能跟11Labs一样,支持语音克隆,自定义声音,那就完美了。

3. 文本的幽默性还是不够,播客大家很多人听,也是希望能既有趣又有用,真要哐哐的在那听1小时干货,那人也麻了,所以你看为啥半拿铁订阅者那么多,是因为他们真的讲的很有趣啊。。。而NotebookLM受限于自己家的Gemini,在幽默和文本上,真的还是差Claude一大截。

不过音频概览这个功能,也仅仅只上线了几天而已,我的要求可能确实有点多,没事,问题不大,未来可期。

我也顺道,加入了他们官方的Discord群聊,把群里的聊天记录,翻到了上线前的那一天,也发现了很多有趣的使用场景。

有个叫paradroid的老哥,把Discord一天的聊天记录粘贴到NotebookLM里,每天晚上听一个简短的播客,来总结群里一天的聊天。

有天文博物馆的老哥,用他来做音频,帮助教育工作。

也有高中教师,把它当作给学生复习的音频资料。

还有数学家,用NotebookLM制作的播客,辅助自己理解论文。

等等等等。

好像有一种全新的场景,被开辟出来了。

我觉得,与其担心被AI取代,不如想想怎么利用好这些工具来提高自己。

比如说,就这个小东西,我们可以用它来:

  1. 快速消化大量信息,把长篇大论变成有趣的对话。

  2. 在做家务或者开车的时候”阅读”那些平时没时间看的文章。

  3. 练习英语听力,顺便学点新知识。

  4. 甚至可以用来准备演讲稿,听听别人(虽然是AI)怎么聊你的观点。

多个模态之间的相互流转,一定会是未来最主要的旋律。

无需抵制,大胆去用就行了。

就像黑悟空中,黄梅老儿那句经典的台词一样:

既见未来,为何不拜。

一个样。

但是,没错,但是来了。

再牛逼的AI,再有趣的场景,我觉得,也不能替代真实的人际交流。

毕竟,没有什么比和朋友面对面地聊天,一起分享观点和笑声更让人愉快的了。

所以,你要不要一起找个时间,跟你的朋友,坐下来好好聊聊天啊?

说一句:

“我请客,咱们边吃火锅边聊聊天,怎么样?”

以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~谢谢你看我的文章,我们,下次再见。

>/ 作者:卡兹克

>/ 投稿或爆料,请联系邮箱:wzglyay@gmail.com

数字生命卡兹克

![](data:image/svg+xml,%3Csvg xmlns=‘http://www.w3.org/2000/svg’ width=‘24’ height=‘24’ viewBox=‘0 0 24 24’%3E%3C!— Icon from Lucide by Lucide Contributors - https://github.com/lucide-icons/lucide/blob/main/LICENSE —%3E%3Cg fill=‘none’ stroke=‘%23888888’ stroke-linecap=‘round’ stroke-linejoin=‘round’ stroke-width=‘2’%3E%3Cpath d=‘M2.062 12.348a1 1 0 0 1 0-.696a10.75 10.75 0 0 1 19.876 0a1 1 0 0 1 0 .696a10.75 10.75 0 0 1-19.876 0’/%3E%3Ccircle cx=‘12’ cy=‘12’ r=‘3’/%3E%3C/g%3E%3C/svg%3E) 阅读![](data:image/svg+xml,%3Csvg width=‘25’ height=‘24’ viewBox=‘0 0 25 24’ fill=‘none’ xmlns=‘http://www.w3.org/2000/svg’%3E%3Cpath fill-rule=‘evenodd’ clip-rule=‘evenodd’ d=‘M16.154 6.797l-.177 2.758h4.009c1.346 0 2.359 1.385 2.155 2.763l-.026.148-1.429 6.743c-.212.993-1.02 1.713-1.977 1.783l-.152.006-13.707-.006c-.553 0-1-.448-1-1v-8.58a1 1 0 0 1 1-1h2.44l1.263-.03.417-.018.168-.015.028-.005c1.355-.315 2.39-2.406 2.58-4.276l.01-.16.022-.572.022-.276c.074-.707.3-1.54 1.08-1.883 2.054-.9 3.387 1.835 3.274 3.62zm-2.791-2.52c-.16.07-.282.294-.345.713l-.022.167-.019.224-.023.604-.014.204c-.253 2.486-1.615 4.885-3.502 5.324l-.097.018-.204.023-.181.012-.256.01v8.218l9.813.004.11-.003c.381-.028.72-.304.855-.709l.034-.125 1.422-6.708.02-.11c.099-.668-.354-1.308-.87-1.381l-.098-.007h-5.289l.26-4.033c.09-1.449-.864-2.766-1.594-2.446zM7.5 11.606l-.21.005-2.241-.001v8.181l2.45.001v-8.186z’ fill=‘%23000’/%3E%3C/svg%3E) 赞 ![](data:image/svg+xml;charset=utf8,%3Csvg xmlns=‘http://www.w3.org/2000/svg’ width=‘24’ height=‘24’ viewBox=‘0 0 24 24’%3E %3Cg fill=‘none’ fill-rule=‘evenodd’%3E %3Cpath d=‘M0 0h24v24H0z’/%3E %3Cpath fill=‘%23576B95’ d=‘M13.707 3.288l7.171 7.103a1 1 0 0 1 .09 1.32l-.09.1-7.17 7.104a1 1 0 0 1-1.705-.71v-3.283c-2.338.188-5.752 1.57-7.527 5.9-.295.72-1.02.713-1.177-.22-1.246-7.38 2.952-12.387 8.704-13.294v-3.31a1 1 0 0 1 1.704-.71zm-.504 5.046l-1.013.16c-4.825.76-7.976 4.52-7.907 9.759l.007.287c1.594-2.613 4.268-4.45 7.332-4.787l1.581-.132v4.103l6.688-6.623-6.688-6.623v3.856z’/%3E %3C/g%3E%3C/svg%3E) 分享 ![](data:image/svg+xml;charset=utf8,%3Csvg xmlns=‘http://www.w3.org/2000/svg’ xmlns:xlink=‘http://www.w3.org/1999/xlink’ width=‘24’ height=‘24’ viewBox=‘0 0 24 24’%3E %3Cdefs%3E %3Cpath id=‘a62bde5b-af55-42c8-87f2-e10e8a48baa0-a’ d=‘M0 0h24v24H0z’/%3E %3C/defs%3E %3Cg fill=‘none’ fill-rule=‘evenodd’%3E %3Cmask id=‘a62bde5b-af55-42c8-87f2-e10e8a48baa0-b’ fill=‘%23fff’%3E %3Cuse xlink:href=‘%23a62bde5b-af55-42c8-87f2-e10e8a48baa0-a’/%3E %3C/mask%3E %3Cg mask=‘url(%23a62bde5b-af55-42c8-87f2-e10e8a48baa0-b)‘%3E %3Cg transform=‘translate(0 -2.349)‘%3E %3Cpath d=‘M0 2.349h24v24H0z’/%3E %3Cpath fill=‘%23576B95’ d=‘M16.45 7.68c-.954 0-1.94.362-2.77 1.113l-1.676 1.676-1.853-1.838a3.787 3.787 0 0 0-2.63-.971 3.785 3.785 0 0 0-2.596 1.112 3.786 3.786 0 0 0-1.113 2.687c0 .97.368 1.938 1.105 2.679l7.082 6.527 7.226-6.678a3.787 3.787 0 0 0 .962-2.618 3.785 3.785 0 0 0-1.112-2.597A3.687 3.687 0 0 0 16.45 7.68zm3.473.243a4.985 4.985 0 0 1 1.464 3.418 4.98 4.98 0 0 1-1.29 3.47l-.017.02-7.47 6.903a.9.9 0 0 1-1.22 0l-7.305-6.73-.008-.01a4.986 4.986 0 0 1-1.465-3.535c0-1.279.488-2.56 1.465-3.536A4.985 4.985 0 0 1 7.494 6.46c1.24-.029 2.49.4 3.472 1.29l.01.01L12 8.774l.851-.85.01-.01c1.046-.951 2.322-1.434 3.59-1.434 1.273 0 2.52.49 3.472 1.442z’/%3E %3C/g%3E %3C/g%3E %3C/g%3E%3C/svg%3E) 推荐 ![](data:image/svg+xml,%3Csvg width=‘25’ height=‘24’ viewBox=‘0 0 25 24’ fill=‘none’ xmlns=‘http://www.w3.org/2000/svg’%3E%3Cpath d=‘M22.242 7a2.5 2.5 0 0 0-2.5-2.5h-14a2.5 2.5 0 0 0-2.5 2.5v8.5a2.5 2.5 0 0 0 2.5 2.5h2.5v1.59a1 1 0 0 0 1.707.7l1-1a.569.569 0 0 0 .034-.03l1.273-1.273a.6.6 0 0 0-.8-.892v-.006L9.441 19.1l.001-2.3h-3.7l-.133-.007A1.3 1.3 0 0 1 4.442 15.5V7l.007-.133A1.3 1.3 0 0 1 5.742 5.7h14l.133.007A1.3 1.3 0 0 1 21.042 7v4.887a.6.6 0 1 0 1.2 0V7z’ fill=‘%23000’ fill-opacity=’.9’/%3E%3Crect x=‘14.625’ y=‘16.686’ width=‘7’ height=‘1.2’ rx=’.6’ fill=‘%23000’ fill-opacity=’.9’/%3E%3Crect x=‘18.725’ y=‘13.786’ width=‘7’ height=‘1.2’ rx=’.6’ transform=‘rotate(90 18.725 13.786)’ fill=‘%23000’ fill-opacity=’.9’/%3E%3C/svg%3E) 留言