抖音上的“注意看,这个男人叫小帅”,为什么都是同一个人念的?

2022/10/181.6 万浏览综合
TapTap
星彡P丨文
前段时间“用嘴画画”的AI很火时,BB姬聊过几次,当时网络上有一种“画师下岗”的焦虑在传播着。作为一个技能点在文字上的人,几个月以来人们对AI的态度变化,对我来说都非常抽象。
实际上,AI取代人工早已经是近十年来信息化行业的主旋律。之前有个在游戏公司打工的朋友就跟我聊起,像育碧之类的大厂普遍淘汰了传统地编工作流,环境素材都改用AI生成。
TapTap
AI绘画不过是把这个时代变革的切面摆到了台面上,让普通人如我也能观察到罢了。我的这个朋友倒也乐观,毕竟AI的应用面只会越来越大,没有什么人类能做到的事情可以幸免。
举个例子,在AI绘画之前很多人没有意识到,AI早已经在短视频领域掀起一股工业革命,大规模的流水线短视频正在取代个人产出。这不是危言耸听……
TapTap
如果有人自认为是超然世外的风雅之士,将科学文明的恩泽不当回事,跑到无人山野衔草结庐体验原始野趣,那自当别论。但若居住在城市,无论如何喜欢清静,总也免不了抖音快手的烦扰,对手机外放这件事伤透脑筋。
可以想象一下,跑食堂吃饭或者公交上瞌睡,每每遇到对面的大爷/阿姨外在看短视频,顿时会感觉不妙,果然不一会儿就听到了——
“注意看,这个男人叫小帅。”
TapTap
紧接着小美、大壮如约而至,各种奇妙的称呼轮番上阵。
反派永远叫丧彪,千条叔心里有故事,主角总是路上遇到佛布勒,跟金发妹搞搞暧昧,一脚踢爆找麻烦的卡乐咪。
看了上面这段话,可能有的人DNA已经开始动了,有段时间在哪里都能听到、看到这样的电影解说视频,仿佛全世界的电影就这几个角色名。
TapTap
(FBI=FBL=佛布勒,很神奇吧)
只要把关键剧情的画面片段,配上娓娓道来的解说旁白,再加上背景音乐的升华,一部适合打工人在带薪拉屎时的消遣作品就诞生了。
做视频的人往往是把一部两小时左右的电影浓缩进5分钟左右的内容里,几十集的电视剧没由来变成了10分钟的梗百科。
TapTap
“注意看”、“下一秒”、“没想到”的旁白套路甚至可以衍生到游戏解说,不管是吃鸡还是CSGO,只要是打枪的游戏都能给你整出个特种兵传奇故事来。
最生草的是,我一度以为这些视频是真人配音,等刷的多了,才发现全网的电影解说都是一个声音,简直就像坠入了抖音的多元宇宙。
TapTap
TapTap
不止是抖音,就连“腾爱哔”这样的长视频网站也无法幸免。B站上搜索“电影解说”或者“追剧”,点开“10分钟以下”的筛选选项,简直像打开新世界的大门。
这些解说视频到底是怎么做出来的?为什么说话都一个吊样?——对此好奇的我,后来才知道是AI配音的声音,直接两眼一黑。
TapTap
稍微了解一下就知道了,目前最出名的当属微软的Microsoft Azure(云端服务平台)的文本转语音服务,特别是“云希”的音色。
微软官网下面有试玩的选项。这个音色几乎媲美人类的声音,不管是语气和停顿,都十分自然,一点也没有机器的生硬感。
https://azure.microsoft.com/zh-cn/products/cognitive-services/text-to-speech/#features
TapTap
(官网的试玩,可以浏览器缓存找到文件)
官网只能试用,不能下载。不过之前BB姬聊到“原神玩家/三相之力指示器”的时候,提过一嘴浏览器的油猴插件使用方法。
Greasy Fork上能搜索到一种叫“Azure Speech Download”的脚本,算是弥补了Demo页面不能下载保存语音的遗憾。
https://greasyfork.org/zh-CN/scripts/444347-azure-speech-download
只要在浏览器有油猴插件的情况下,安装以上的脚本,就可以读取缓存。如果你想在本地脱网使用,也可以在网上搜索“微软 Azure AI配音”,能下载到学习版。
除了微软Azure,网上其实还有类似不错的AI语音软件,比如另一款阿里云的智能语音交互服务,里面的“艾飞”音色也是短视频常客。当然,这种软件正常商用都是按时间语句收费的,基本上抖音上使用的都是盗版软件。
TapTap
回到正题。视频解说跟微信公众号一样,可以算是“传统”自媒体了。作为快讲类的电影解说鼻祖,谷阿莫和他的《 几分钟看完 XXX 电影 》系列也已经快有10年了。
几年前,电影解说圈子还算是百花齐放,偶尔我也会睡前躺在床上刷一会电影号,毕竟不动脑子看剧真的很爽。从小众的文艺片,到主流的好莱坞电影基本都有人做解读,不怕没有乐子。
当时大家吐槽的点集中在千篇一律的背景音乐,像什么《Bad Style - Time Back》《Else - Paris》《Fight - BeatBrothers》《Hoang Thuy Linh - See Tình》……
TapTap
(音乐软件上的歌单)
很多音乐单独播放旋律都很抓耳,最开始我也很好奇,用听歌识曲搜索加过APP歌单,但架不住每次刷到电影解说就是那几首歌,实在听吐了,每次听到就想切掉。
这时候视频制作已经有流水线化的迹象了,没想到最近两年,原本就已经很内卷的电影解说行业迎来了一场真正的“工业革命”——由于AI语音的出现,现在做电影解说的博主可能连说话的力气都省下来了。
卷,都可以卷,内卷到最后,迎来统一标准化,流水线的AI配音短视频正在取代个人产出。就像工厂咔咔生产出来的预制菜“毁灭”低端餐饮,自动驾驶未来会取代部分驾驶环境。一些事情正在发生,一些不久会发生。
TapTap
乐观点看,在AI不能完全取代人类之前,我们至少还有一段蜜月期,这段时间的特点是:行业门槛往往会变得模糊,一些人会被替代,利益受到波及,但总体来说我相信是利好的。
最先被淘汰的往往是处于行业底层的守门人(风格化的产出较少,机械化的操作较多),但由于技术升级,行业门槛变得模糊,不需要教育和训练也能很快上手,反而成了一件人人都能做的事情。最终可能还扩大了就业范围,产生了更多的坑位。
比如:①以前剪辑视频是项技术活,你需要懂电脑技术,捣鼓PR软件。现在随便谁手机下个剪影、快影,输入几张照片就可以一键制作;②以前做视频还要麦克风,要考虑收音环境。现在只要动动手指,靠AI就能帮你读稿,连说话的功夫都剩了。
TapTap
接着就是产能大爆炸,初阶产品(就像AI配音的电影解说、AI绘画的二次元美少女)会在很短时间内达到冗余,但不是说AI会降低审美门槛——问题又回到老生常谈的环境问题,以及电影爱好者与短视频用户的争议。
有人觉得侮辱电影的艺术,有人觉得电影解说完全可以当作消遣,版权方电影制作方的态度也很暧昧,需要的时候可以让AI配音的电影解说引流,不需要的时候一张诉状敲起版权大棒。
TapTap
当然,我一直觉得艺术没有门槛,内容创作是个人就行。虽然可能接受度有所不同,但标准不是唯一的。任何自立山头区分妄图定义别人审美的行为,最后只会让人变成恶龙,遭到反噬。
绘画、配音、写小说等等领域要不要用AI得看消费者,其实就是老话“市场说了算”。但现阶段短视频随处可见的AI配音,经常跟“学习版”“破解版”绑定在一起——从道德上来讲,盗版是不值得提倡的;从技术上来讲,又是大势所趋。
TapTap
本来《XX分钟看电影》就是一种灰色二创了,结果AI配音普及后出现了更低端更滥用的形式,所以经常B站上评论充满嘲讽与不解。包括之前的AI绘画也存在一定版权的争议,都是技术走的太远,法律伦理还没有跟上的缘故。
当然,正规商业使用就不存在纠结的问题。比如之前国内配音界有个非常有名的CV叫“姜广涛”,因为某些事被警察带走了,留下了一堆二次元手游的烂摊子。
TapTap
米哈游的《未定事件簿》与网易的《时空中的绘旅人》跟着遭了秧,于是先后采用AI配音对姜广涛的声音数据进行提取分析训练再制作,进行紧急救火。
CV塌房且没法补救的情况,放到二次元手游不少,日本声优也会有拜厕之类……一般来说,厂商要么直接换人,要么角色从此变成哑巴。
前者是个吃力不讨好的活,很难让先入为主的人满意;后者像更早之前《光与夜之恋》因为CV李元韬睡粉骗炮的事情塌房,角色陆沉经历了好几个月的“失声期”,还搞出过摩斯电码通话的笑话。
TapTap
TapTap
需要的时候,AI只是其中一种方案。一个玩家/观众/读者(或是其他身份)能接受的方案面前,唯一需要做的,就是比较经济效益上哪个更划算。
题外话。很早之前我有看网文小说的习惯,那时候网上有很多“笔趣阁”式的小说软件,一些高级点的会自带有AI配音的功能,方便开车或者临睡前“听”小说。
TapTap
(微信读书现在的听书)
就我个人体验来讲,早期AI配音机械味比较浓,还远不能跟人比。当时也有不少主打听书的软件,甚至会开出“朗读赚外快”的兼职来吸引人填充数据库,说明市场需求确实很大。
可谁也没想到,短短几年时间AI语音发展如此迅速。现在的小说软件听书功能,你很明显能感觉到慢慢的开始有语音语调的变化,虽然跟人类的朗读情绪完全不能比,但完全已经可以凑活了。
TapTap
(有声书的广告)
让AI说话像人,可能只是第一步,AI配音的应用场景未来也不仅仅是给短视频、网文小说配个音,比如说给虚拟人赋予“人格”?
畅想一下,AI建模的小姐姐+AI配音的软妹音+AI赋予的性格感情……二次元梦寐以求的老婆诞生了。当然,这只是未来的设想。
TapTap
(前段时间,引起过争议的微软小冰骂人现象)
更不用说AI产出的质量短时间没法替代真正有经验的从业者,很长一段时间里它会成为工具,需要人来调教才能达到最优解。
最近几年破圈的例子,不论是最近的AI绘画,还是之前的AI翻译、AI编曲、AI配音……都是差不多的模式。
-END-
225
120
79