完蛋!我被“AI”包围了! * { margin: 0; padding: 0; outline: 0; } body { font-family: “PingFang SC”, system-ui, -apple-system, BlinkMacSystemFont, “Helvetica Neue”, “Hiragino Sans GB”, “Microsoft YaHei UI”, “Microsoft YaHei”, Arial, sans-serif; line-height: 1.6; } .__page_content__ { max-width: 667px; margin: 0 auto; padding: 20px; text-size-adjust: 100%; color: rgba(0, 0, 0, 0.9); padding-bottom: 64px; } .title { user-select: text; font-size: 22px; line-height: 1.4; margin-bottom: 14px; font-weight: 500; } .__meta__ { color: rgba(0, 0, 0, 0.3); font-size: 15px; line-height: 20px; hyphens: auto; word-break: break-word; margin-bottom: 50px; } .__meta__ .nick_name { color: 576B95; } .__meta__ .copyright { color: rgba(0, 0, 0, 0.3); background-color: rgba(0, 0, 0, 0.05); padding: 0 4px; margin: 0 10px 10px 0; } blockquote.source { padding: 10px; margin: 30px 0; border-left: 5px solid ccc; color: #333; font-style: italic; word-wrap: break-word; } blockquote.source a { cursor: pointer; text-decoration: underline; } .item_show_type_0 > section { margin-top: 0; margin-bottom: 24px; } a { color: 576B95; text-decoration: none; cursor: default; } .text_content { margin-bottom: 50px; user-select: text; font-size: 17px; white-space: pre-wrap; word-wrap: break-word; line-height: 28px; hyphens: auto; } .picture_content .picture_item { margin-bottom: 30px; } .picture_content .picture_item .picture_item_label { text-align: center; } img { max-width: 100%; } .pay_subscribe_notice { margin: 30px 0; padding: 20px; background: fffbe6; border: 1px solid ffe58f; border-radius: 8px; } .pay_subscribe_badge { display: inline-block; padding: 4px 12px; background: faad14; color: fff; border-radius: 4px; font-size: 14px; font-weight: 500; margin-bottom: 12px; } .pay_subscribe_desc { font-size: 15px; line-height: 1.8; color: rgba(0, 0, 0, 0.7); margin-bottom: 12px; } .pay_subscribe_hint { font-size: 13px; color: rgba(0, 0, 0, 0.4); } .__bottom-bar__ { display: flex; justify-content: space-between; align-items: center; position: fixed; bottom: 0; left: 0; right: 0; height: 64px; padding: 8px 20px; background: white; box-sizing: border-box; border-top: 1px solid rgba(0, 0, 0, 0.2); } .__bottom-bar__ .left { display: flex; align-items: center; font-size: 15px; white-space: nowrap; } .__bottom-bar__ .right { display: flex; } .__bottom-bar__ .sns_opr_btn { display: flex; align-items: center; user-select: none; background: transparent; border: 0; color: rgba(0, 0, 0, 0.9); font-size: 14px; } .__bottom-bar__ .sns_opr_btn:not(:last-child) { margin-right: 16px; } .__bottom-bar__ .sns_opr_btn > img { margin-right: 4px; }
完蛋!我被“AI”包围了!
原创 数字生命卡兹克 数字生命卡兹克 2023-11-05 17:59 天津
众所周知,我是一个什锦区的AI博主,每天都在各种AI领域之间反复横跳,然后努力的分享一些很酷的AI干货。
但是每天也都被各种朋友问:“大佬,有没有能XXX的AI工具?大佬,这个东西是什么XXXAI做的?大佬,我能请教一下XXX不”
我真怕啥时候给我来一句:“大佬,你能用AI给我生个猴子🐒不”
…
所以,这篇文章,我想好好盘点一下从ChatGPT出现到现在,真正实用且主流的AI工具。
包含大语言模型、AI PPT、AI 绘图、AI音频、AI数字人、AI视频这6个部分。
这近半年我作为AI什锦区博主的高强度的输出,做这种盘点,应该还算是有点说服力的对吧。
所以你们想要最全最实用的AI工具大全,真的看我这一篇,就够了。
我选出来17个,基本上涵盖了我自己也是99%以上的AI工具使用时间,全文也不含任何广告,放心食用吧。
大语言模型
Top1. ChatGPT
整个AI行业无可争议的No.1,现在估值都翻到600亿美刀了。引领整个行业变革的大哥,无需多言,我自己绝大多数时间都是在用GPT去处理各种东西。目前支持多模态(识别图片),传文件,写代码,跑程序,画图片。马上又可以原生的支持ChatPDF了,更能将各类工具混合在一起形成AI Tools,这是真的通用AGI的雏形了。
教程我也写了太多太多,在我公众号里搜索ChatGPT就能看到。但是我还是想放两篇天天被问的最多的教程∶
(PS∶虽然都是几个月前写的,但是至今也没失效!刚刚亲测,能用)
Top2. Claude
AI大语言模型领域的万年老二,我已经用的很少了,但是他支持100K的超长文本输入还是目前独一档,很多超长的会议纪要、论文等等,我还是会用Claude来去做整理和总结的。
Top3. 智谱清言
国产替代。很多人其实因为种种原因,比如单位、网络限制,魔法限制等等,只能用国产,那还是推荐智谱清言,我心中的国产大模型No.1,基本上就是ChatGPT的国产平替,多模态写代码画图什么都有,而且效果都不错,毕竟大名鼎鼎的ChatGLM在国际上还是有很强的影响力的。
AI PPT
Top1. MotionGo
大家经常问我的另一个问题就是,大佬,做PPT有什么AI工具?MotionGo还是可以的,毕竟大部分的PPT都是演示,再做PPT之前基本上都会有一个脑图或者文档(不要说你没有。。。),MotionGo支持传word、txt、Xmind之类的直接生成PPT,这点还是很香的。
AI 绘图
Top1. Midjourney
目前AI绘图领域综合效果最好、审美最强、最适合小白的产品,大部分直出的图都可以直接拿来用,直接集成在了Discord里,操作傻瓜,目前也在急速迭代中,正在All in 3D。
Top2. Stable Diffusion
AI绘图的奠基者之一,生态的起点。虽然本身的模型质量和审美都挺拉的,但是架不住它是开源的。百万级别的开发者和艺术家,基于源SD1.5模型,微调并训练了无数的优质模型。不仅如此,还有无数的插件应运而生,比如鼎鼎大名的ControlNET、AnimateDiff、Defourm等等。超强的自定义特征也使他最容易嵌入工作流中,上限极高。
对着公众号私信”SD”,就有秋叶大佬的SD整合包链接了,可以直接下载,同时再附上我写过的几期模型推荐:
AI绘图StableDiffusion最强大模型盘点 - 诸神乱战
AI绘图StableDiffusion最棒LoRA模型盘点 - 小样也能出奇迹
Top3. Dalle3
OpenAI出的AI绘图,集成在了ChatGPT上,NewBing也可以白嫖。拥有目前最强的语义理解能力,很多很复杂的画面,MJ画不了,SD可以靠草图勉强实现,但是Dalle3可以靠提示词硬生生画出来,语义理解目前碾压式的领先。同时可以支持在画面上生成文字,除了审美差一点画风少一点,其他几乎无短板。
Top4. Clipdrop
Stable Diffusion母公司Stability出的应用,集成了很多有趣的AI功能,包括去人去物体、增强、扣背景、重新打灯等等,方便快捷。很久之前也写过一篇文章介绍过:
AI 音频
Top1. 11Labs
目前我认为在TTS(文字转音频)这个领域,当之无愧的“最强”AI音频。仅需30秒到5分钟左右的极少的数据集,就可以直接克隆任何一个人的声音,完美复刻他的说话方式、他的音色,甚至连他的情绪都复刻过来。之前我也写过文章介绍过:
仅需30秒完美复刻任何人的声音 - 最强AI音频11Labs
Top2. So-Vits-SVC
SVC,你就把它简单的理解成一个特定人物声音的变成器,你自己先录一段音频,然后把这个音频扔给AI,AI就自动产出另一个人声音的音频了。目前最主流效果最好的就是这个 So-Vits-SVC了。对着公众号私信”S”,就有羽毛大佬做的这个项目的本地整合包。我也写过两篇教程(分别是4.0和4.1版本)介绍过:
Top3. Stable Audio
https://stableaudio.com/generate
同样是Stable Diffusion母公司Stability出的AI音乐应用,目前在所有AI音乐生成里面质量最高,但是同时上手难度也挺大,毕竟那些乐理、乐器的专业名词真的很难写…
AI 数字人
Top1. Heygen
作为最近最炙手可热的AI热门应用,Heygen用霉霉讲中文、郭德纲讲音域之类的视频出尽了风头。提供了照片驱动(直接让照片动起来说话)、数字人训练(上传5分钟的视频)、一键翻译视频等等。目前最全能的AI数字人六边形战士,除了贵(1个月最低29美刀15分钟),什么都好。
偷偷说一句,Heygen的声音技术是由11Labs提供的。
Top2. 奇妙元
AI照片驱动的国产替代,在照片驱动领域跟Heygen不相上下,我用的也非常多,之前我视频号的几个乔布斯、特朗普、巴菲特的视频就是用11Labs+奇妙元做的:
Top3. 商汤如影
http://senseavatar.sensetime.com/
国内定制数字人领域的王者,毕竟商汤就是做人像出身,在数字人定制这块是Top级的,很多需要直播的群友在体验了市面上一些数字人产品后,甚至给我反向安利商汤如影…目前支持PC和APP端。
AI 视频
Top1. Runway
AI视频领域的王者,前几天生成模型Gen2更新以后,画质和稳定性大幅提升,配合MJ效果直逼电影级画质。而且Runway是一个综合站,不仅可以生成视频,还可以视频抠像、删背景、运动追踪啥都行。。我之前也用Runway做了两个作品:
Top2. PIKA
同样是AI视频领域的佼佼者,Runway的竞品,但是只专注于AI视频生成,集成进了Discord里,对语义理解很好,你的文字prompt真的是会起作用的,不像RunwayGen2油盐不进,但是目前画质跟RunwayGen2相比还是差了一个世代,等他们更新2.0版本。不过优点嘛,就是免费。
如果你跟我一样成为PIKA的超级合作者的话,生成的视频也没水印,还有专线嘿嘿…
Top3. Topaz Viedo AI
目前视频画质增强、修复的最强AI。在超分领域属实万金油。软件我也整合好了,对着我公众号私信”T”就有下载链接了。后面我也会写一篇Topaz Vide AI的教程和参数选用,敬请期待~
写在最后
以上就是我选出来的大语言模型、AI PPT、AI 绘图、AI音频、AI数字人、AI视频这6个部分的17个应用。
当然还有很多或新或旧的其他的应用,比如做动捕的WonderStudio、做3D的Luma AI、AI视频领域的两个新秀Genmo和Moonvalley、SD上现在很火的AI视频框架AnimateDiff、照片驱动D-ID、PPT的Gamma等等等等。太多太多了。
但是我觉得或多或少泛用性都有点问题,要么打不过上面的这17个,要么应用领域太窄,要么上手门槛太高,对普通AI玩家意义不是很大。
上面这17个,足够支撑你在现在的AI时代,混的风生水起了。
以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,并给我个星标⭐~感恩。
数字生命卡兹克
 阅读 赞  分享 ‘%3E %3Cg transform=‘translate(0 -2.349)‘%3E %3Cpath d=‘M0 2.349h24v24H0z’/%3E %3Cpath fill=‘%23576B95’ d=‘M16.45 7.68c-.954 0-1.94.362-2.77 1.113l-1.676 1.676-1.853-1.838a3.787 3.787 0 0 0-2.63-.971 3.785 3.785 0 0 0-2.596 1.112 3.786 3.786 0 0 0-1.113 2.687c0 .97.368 1.938 1.105 2.679l7.082 6.527 7.226-6.678a3.787 3.787 0 0 0 .962-2.618 3.785 3.785 0 0 0-1.112-2.597A3.687 3.687 0 0 0 16.45 7.68zm3.473.243a4.985 4.985 0 0 1 1.464 3.418 4.98 4.98 0 0 1-1.29 3.47l-.017.02-7.47 6.903a.9.9 0 0 1-1.22 0l-7.305-6.73-.008-.01a4.986 4.986 0 0 1-1.465-3.535c0-1.279.488-2.56 1.465-3.536A4.985 4.985 0 0 1 7.494 6.46c1.24-.029 2.49.4 3.472 1.29l.01.01L12 8.774l.851-.85.01-.01c1.046-.951 2.322-1.434 3.59-1.434 1.273 0 2.52.49 3.472 1.442z’/%3E %3C/g%3E %3C/g%3E %3C/g%3E%3C/svg%3E) 推荐 ’ fill=‘%23000’ fill-opacity=’.9’/%3E%3C/svg%3E) 留言