人人都能打造“数字人”!腾讯杀入AIGC创作领域-亚洲ca88官方网站

发布时间:2024-02-28 12:59:24 来源:亚洲ca88官方网站

  大家好,我是数字人大亨,很荣幸能够与大家探讨一个非常关注的话题:AIGC(AIGC即AIGenerated Content,是指利用人工智能技术来生成内容)是否能代替人类进行创作?历史证明,人类的创造力和创作风格是随时代和技术革新不断演进的。在内容创作,尤其是创作优质个性化内容方面,AIGC和人类的协同是非常必要的一环。

  3月底,在2023新榜大会上,腾讯内容平台部副总经理姚天恒通过他的数字人大亨”做了这样的演讲开场。令人关注的是,这一个数字人不仅在形象上高度逼真,而且在语音、语调、唇动等方面也非常真实,甚至连姚天恒惯常的表情和动作都毫不马虎地模拟了出来。

  数字人“大亨”是以姚天恒真人为原型打造,采用腾讯智影最新人工智能技术,通过深度学习他本人少量的真实音频、视频数据生成的分身模型。借此机会,腾讯也正式对外发布了全新的AI智能创作助手“腾讯智影”,通过为内容创作者提供一系列的智能创作工具,帮助创作者在内容创作时提质增效。

  腾讯在AI领域的动作很快,距离腾讯在2022全年业绩财报电话会上坦言AI“非常令人兴奋”,并表态未来可能将AI纳入微信和QQ,刚刚过去一周时间,腾讯就分别在博鳌亚洲论坛2023年年会“下一代互联网”论坛上透露正在研发类ChatGPT聊天机器人,并且集成集成到QQ、微信,以及腾讯云的版本“都会有”,以及正是在“2023新榜大会”上发布“腾讯智影”。

  然而,很多人都没想到“腾讯智影”发布的第一时间,人们久可以在微信小程序中找到并体验,与此同时,用户还能够正常的使用PC浏览器登陆启“腾讯智影”平台,以获得更便利的操控体验。

  在官方主页能够正常的看到,腾讯智影主要提供“人”“声”“影”三个方面的能力。其中在“人”的方面,“智影数字人”是腾讯智影最核心的功能。用户可通过输入文本或音频内容,即可生成数字人播报视频。按照每个用户差异化的应用需求和场景,“腾讯智影”又细分为视频剪辑、文本配音、数字人播报、视频审阅等多个功能。

  具体而言,在“人”的方面,“智影数字人”是腾讯智影最核心的功能。用户可通过输入文本或音频内容,即可生成数字人播报视频;在“声”的方面,腾讯智影则提供了文本配音、音色定制、智能变声等功能;在“影”的方面,通过腾讯智影文章转视频能力,创作者可以直接将自己撰写的文字转化为视频内容,无需进行繁琐的素材收集和处理;此外,腾讯智影分段式的素材呈现方式,让创作者能够迅速处理分镜、添加卡点、滤镜、特效等,从而快速缩短视频制作的周期和成本。

  如此强大的功能,再凭借腾讯微信小程序的覆盖面,自然在第一时间成为市场关注的焦点。

  相较其他视频剪辑工具,“智影数字人”是腾讯智影最核心的功能。用户只要输入文本或音频内容,几分钟内即可生成数字人播报视频,极大降低了“数字人”生成门槛,也成为本次体验的重点。

  在“腾讯智影”主界面点击“数字人播报”后即可打造属于自身个人的数字人主播。用户第一步是要选择相应的数字人形象(提供2D和3D两个类别可供选择)后,即可进入数字人创作界面。

  这里要提示警醒我们的是“腾讯智影”需要在Chrome浏览器进行访问,即便是腾讯QQ浏览器也会提示PC用户更换浏览器进行工作。在3D主播生成界面能够正常的看到,左侧主要是工具栏界面,数字人、背景、配乐等细节都可以单独编辑,以“数字人编辑”为例,用户都能够对3D主播的形象及动作、画面、字幕等细节进行个性化打造。

  从服装样式、服装颜色、人物姿势到动作,“腾讯智影”都提供了预设模式给用户选择,用户只应该要依据个人偏好进行点选即可,上手非常快。

  追求易用性的同时,“腾讯智影”在细节上并没有完全“放权”。用户都能够选择3D数字人各种动作表达,配合文字内容形成自然、连贯的播报,但数字人具体发型、面部表情其实是没办法做个性化定制的,不过在“高级编辑”中,用户还是可以上传自己的视频、音频和图片资料,进而强化数字人主播内容的差异化。

  不过目前“腾讯智影”只对免费用户开放了部分体验功能,其余大部分需要用户付费使用。如免费版,能够得到每个月5分钟的免费数字人生成视频时长,每天3次的智能工具使用等;398元一的年高级会员是每个月10分钟的数字人生成视频时长或高级+专业音色的文本配音服务二选一,以及每天50次的智能工具等。而在数字人定制上,目前照片定制数字人形象的价格为首年3999元,视频定制数字人形象的价格为首年7999元。

  值得一提的是“腾讯智影”内部已经嵌入了金币体系,部分服务需要用“金币”付费,而金币除了注册时赠送的1000金币外,还可通过签到等活跃行为获得。

  抛开数字人的打造,“腾讯智影”本身是一款影音剪辑工具,对于不少“小白”用户而言,其在文本配音、视频剪辑等方面的工具属性更具实用性。

  在“腾讯智影”主界面中点击“文本配音”后进入相应编辑界面,在顶部菜单栏找到“导入文本”的选项,平台支持doc、docx、txt等格式的文本,默认文本上限 8000个字,注意满足半小时左右的配音需求了。

  不同于其他视频剪辑软件,用户能对配音的节奏(整体速度、局部速度),发音等等进行,最为强大的地方是智影“文本配音”支持不同句,不同字添加不同配音的,比如旁白、开场、小会的话都能选用不同的人声。

  除配音功能非常人性化外,“文本配音”本身预置了舒适款配音素材可选,用户都能够根据视频配音、文章播报、新闻播报、有声小说、语音助手等分类快速选择最对自己最合适的配音模板,而且顶部还有语气和情绪的分类,再加上“百变”标签人物下的方言选项,足以为用户所带来灵活多变的文本配音。

  而对于高阶玩家,“文本配音”还提供了“定制专属音色”服务,系统可按照每个用户上传音色进行“声音复刻”,从而打造独一无二的配音。

  除了极其强悍的配音功能外,视频剪辑也是“腾讯智影”的基础功能。从素材到音轨,从转场到特效,“腾讯智影”的视频剪辑功能能说是相当强大,无论是初学者还是专业剪辑师都能快速上手。

  素材和快捷键能够说是“腾讯智影”剪辑功能的一大特色,在轨道区进行创作,免不了对素材进行雕琢,智影目前已具备十余种种素材调整操作功能,而且右上角的快捷键栏也上线余个预设快捷键,极大提升了剪辑效率。

  相对功能强悍的PC版,微信“腾讯智影”小程序同样可以在一定程度上完成数字人、智能配音等热门功能,但受限于手机操作空间,视频剪辑等功能并非其主打,而是引入了当下最热门的“AI绘画”。

  进入AI绘画页面后,发现“腾讯智影”在绘图方面支持文本生图和图生图两种生成方式,其中图生图只能生成动漫风格一种风格,但可以额外添加文字修饰,以更加准确地生成自己想要的效果。

  而文本生图支持的风格则比较多元,有2D动漫、2.5D动漫、国风、彩漫、素描、线稿、人像特写、油画、印象派共9种,比较遗憾的是暂时只支持生成人像。从最终生成效果来看,“AI绘画”最终成像效果是比较让人满意了。

  总体而言,“腾讯智影”本身并非全新产品,本次在AI上的升级,让其不仅兼顾了市场上已有的功能,而且更是从一个视频创作工具升级为“智慧”的创作助手,无疑能进一步解放短视频创作者生产力,更让入门级用户也能通过数字人践行自己的想法,极大推动了AIGC内容产业落地。

  从引爆AI作画领域的DALL-E 2、StableDiffusion等AI模型,到以ChatGPT为代表的接近人类水平的对话机器人,AIGC不断刷爆网络,其强大的内容生成能力给人类带来了巨大的震撼。学术界和产业界也都形成共识:AIGC绝非昙花一现,其底层技术和产业生态已形成了新的格局。

  就内容生产而言,AIGC作为新的生产力引擎,让我们从过去的PGC、UGC,已经不可避免地进入AIGC时代。AIGC代表着AI技术从感知、理解世界到生成、创造世界的跃迁,正推动人工智能迎来下一个时代。

  经过了2022年的预热,2023年AIGC领域将迎来更大发展。AIGC生成内容的类型不断丰富、质量不断的提高,也将有更多的企业积极拥抱AIGC。

  AIGC的大爆发不仅有赖于AI技术的突破创新,还离不开产业生态加快速度进行发展的支撑。在技术创新方面,生成算法、预训练模型、多模态技术等AI技术汇聚发展,为AIGC的爆发提供了肥沃的技术土壤。

  AIGC领域目前呈现AIGC的内容类型不断丰富、内容质量不断的提高、技术的通用性和工业化水平越来越强等趋势,这使得AIGC在消费互联网领域日趋主流化,涌现了写作助手、AI绘画、对话机器人、数字人等爆款级应用,支撑着传媒、电商、娱乐、影视等领域的内容需求。目前AIGC也正在向产业互联网、社会价值领域扩张应用。

  AIGC技术让聊天机器人接近人类水平日益成为现实,当前以ChatGPT为代表的聊天机器人已经在刺激搜索引擎产业的神经,未来人们获取信息是否会更多通过聊天机器人而非搜索引擎?这已经使谷歌等公司面临的巨大压力。

  AIGC也在极大的提升数字人的制作效能,并且使其更神似人。比如腾讯AI LAB的虚拟歌手AI艾灵,能够基于AIGC实现作词和歌曲演唱。在元宇宙领域,AIGC在构建沉浸式空间环境、提供个性化内容体验、打造智能用户交互等方面发挥及其重要的作用。比如,扎克伯格在元宇宙的岛屿上,能够最终靠发出语音命令生成创造海滩、变换天气,添加不同的场景等。

  而只有借助AGIC,元宇宙才可能以低成本、高效率的方式满足海量用户的不同内容需求。返回搜狐,查看更加多

上一篇:《杭州新闻联播》首推全 AI 掌管播报真人主播能回家春节了 下一篇:“数字主播”上线:冬奥手语播报AI数字人
分享到: