手把手教你如何一键生成自己的【数字人】,让“自己”给自己打工!
|
admin
2024年12月28日 21:3
本文热度 47
|
上一篇文章介绍了纳米搜索的多模态搜索功能,另外它特有的【慢思考模式】【多模型协作】让很多朋友表示很震撼。写的功能很好理解,纳米搜索支持将输出的答案原文进行二次创作,目前支持小红书体、新闻稿、口播稿、脱口秀等7种文风的改写。这个功能算是打通了自媒体人搜与写的工作流程,直接将搜索的结果一键转换为不同场景的文稿,我们要做的只是对文稿进行正确性的确认以及风格化的加工。读的功能比较新颖。可以将搜索的结果进行语音播报,支持选择不同人的声音。目前收录了李雪琴和徐智胜等人,脱口秀自由了。比较特别的是,可以选择训练出自己的声音,实测声音相似度很高,大家可以试试。如果你认为搜索的结果有用,那就可以将搜索结果通过智能播客的功能做成播客视频分享给其他人。全流程只有点选的操作,80岁老奶奶都会,具体流程如下:想想朋友听着自己声音的播客,想想还挺刺激的。纳米搜索的写与读功能,实际上是服务于AI搜索结果的输出与分享场景,创新地引入播客功能,使得知识分享变成一个更有趣的社交场景。入口在网页端首页的下方,很显眼的大字【AI爆款视频】,下面我就以【做一个介绍纳米搜索的口播视频】为目的,给大家详细演示一下怎么操作。进入功能主页面后会展示可以创作的爆款视频类型,包括抖音、小红书、视频号、B站等,应有尽有!同时介绍了平台对于这几个视频平台内容特色的理解,选择不同的类型会有相应的优化,这里演示以视频号为例。进入视频号创作流程后,左侧一列可以选择视频的类型,目前包含了4种高频的类型,我这就属于干货分享的类型。页面的中央则是素材上传区域,基本上你能想到的素材类型都可以上传,本地的文件、网页链接、粘贴的文本,流媒体目前支持了抖音和B站。上传完所有参考的素材后直接点击下方的生成口播稿,就可以先按照官方的默认的配置生成一篇干货分享语气的初稿。在中间的口播稿工具一栏,可以重新选择口播的风格以及钩子的类型,我这里选择了经验和高价值类,符合我分享内容的主题。点击重新生成后,就会在右侧得到一篇符合要求的口播稿。这时可以手动修改也可以继续让AI帮你编辑。到这一步,你其实是可以利用里面的文本编辑功能把文章修改完,直接复制出去写一篇公众号的。这里我们选择继续生成口播视频,点击下一步。这时,会首先进入到标题的确认流程,系统会根据你选择的语气以及钩子类型帮你自动生成十条标题。你可以根据左侧的热门标题进行重新生成,也可以对已有的标题进行手动编辑或者AI润色。接下来,会进入多格式导出流程,这里可以选择导出多格式的文稿;还可以导出音频格式,可以选择系统内置的音色,这里和上面的播客功能比较类似。选择一个预设的形象后直接选择导出,这时系统会给到一个导出倒计时,一般会提示12分钟,实际导出时长要短一些。除了使用预设的数字人形象,还可以根据自己的形象去定制数字人,这里只需要上传自己一段10s-5min的朗读视频即可,理论上时长越长效果越好,但对应的处理时长就会更长。这里我自己对着系统给的文稿录了一段20s的视频,上传创建后,整体的数字人训练时长大概在15分钟左右。训练完成后,选中自己的数字人,点击导出视频,导出时长大约5分钟左右。给大家直接看实际效果,鄙人献丑了整体画质没有涂抹,就嘴部有一点模糊,眼神和微表情也都模仿得很到位,包括我期间点手机的手势也被训练进去了。(为了效果更好,大家录制视频时可以多加一些手势)另外声音相似度大概有90%,剩下的10%还是有点AI的味道。纳米搜索可以说是自媒体人提效提质的一大神器,数字人目前在电商带货、打造个人IP方面的应用还是很广的。技术进步的意义,就是让普通人也能感受科技带来的快乐!
阅读原文:原文链接
该文章在 2024/12/30 15:17:47 编辑过