您的位置 首页 科技

从文生图到文生视频,AI行业卷疯了

前段时间,穿着太空服的埃隆马斯克一瞬间进到二次元的视频在网上造成爆裂,令人吃惊的是,动漫动画片的埃隆马斯克不但精妙绝伦,背景姿势也十分连贯性有效,而这一切都来源于一位斯坦福大学中国…

前段时间,穿着太空服的埃隆马斯克一瞬间进到二次元的视频在网上造成爆裂,令人吃惊的是,动漫动画片的埃隆马斯克不但精妙绝伦,背景姿势也十分连贯性有效,而这一切都来源于一位斯坦福大学中国人博士研究生设计的一款名字叫做“Pika”的视频生成专用工具。只需在此软件的视频输出框中键入“埃隆马斯克衣着太空服,3D动漫”核心关键词,一个穿着太空服的可爱卡通埃隆马斯克便可跃然于屏上。

近些年,伴随着AIGC创变多元业态运用的加速落地,整个市场的风潮,已经渐渐从文生文、文生图,转移到了文生视频行业。实际上,AIGC从文字到图片是大的发展方向,许多产业链人员早已觉察到了销售市场风向,中国巨量引擎、阿里巴巴、百度搜索等科技大型厂都已慢跑进场。

AIGC迈进视频时代

据统计,巨量引擎于11月18日上线了文生视频实体模型PixelDance;阿里巴巴略逊一筹也正式上线Animate Anyone实体模型;百度搜索文心大模型的类似作用则以内测中,没多久便以软件方式对外开放。显而易见,AI技术性与文生视频的结合早已在业内掀起了一股新的潮流。而国内玩家之所以这么积极主动地结局合理布局,背后的原因显而易见。

最先,文生视频应用非常广泛,具有巨大的市场潜力。短视频行业尽管大势所趋,但短视频的制作水平却无法跟上各大平台暴发的小视频要求。而文生视频产品的日渐成熟和广泛运用,也将为时下比较热门的短视频行业带来一些变化。例如,影视剧游戏等领域便是文生视频落地关键情景,文生视频通过文字就能编辑和形成需要的情节,完成艺术创意辅助和降低成本。而凭着为主要内容形成创变这一特色优势,文生视频的发展前景都是不容置疑。

次之,文生视频操作十分便利,能有效降低各项成本。大家都知道,个性化视频后期制作不便、成本过高,因此一款简单的视频形成专用工具,就成了不少行业和企业的向往,而AI文生视频专业能力的创新则是这一问题带来全新解决方法。文生视频简单的说就是不用短视频制作步骤,只用简单文字就可以生成想看的视频素材内容,值得一提的是,还可以伴随着键入情境与关键字不断创新,真是能够降低视频后期制作准入门槛和开支,算得上是创作者在数字经济时代中的“福利”。

最终,文生视频平台作用震撼,能进一步增强企业竞争优势。在如今的AI跑道上,文生图的运用早就五花八门,相比而言,能够很好地“占领”文生视频这一阵地游戏玩家则是屈指可数。说到底,是文生视频的产品卖点更强大,其难度自然也就就可想而知了。只不过是,难度很大也伴随着高颜值,如果有哪一个企业能拥有强大的算率、跨行业合作意识与技术主体性等优点推动这一跑道,那其在业内产生差异化竞争力都将为期不远。

百尺竿头更进一步

文生视频作为一种新兴的媒体方式,正以前所未有的方法决定着人们的日常生活。现阶段,在企业形象宣传、智能化人、科普创作、网上社交等领域中对文生视频技术性有一定的应用。而为了保证视频生成的流畅性、现实感,中国入局的游戏玩家如巨量引擎、阿里和百度搜索等都在各个方面下足功夫。

一方面,各游戏玩家搜集了海量数据,以提升视频生成实际效果的多样化。文本生成短视频实体模型通常需要海量数据去学习外挂字幕相关性、帧手机照片写实性感与时间信息报告,但缺乏高品质匹配的数据集,就无法合理组合角色、无法有效架构设计情景,因而,形成短视频的合理性及衔接性就会大打折扣。阿里巴巴为了保证形成实际效果的多样化,就要其科研人员搜集了大概3500万单的文本短视频对和60亿文字图象对来优化分析,让产生的短视频达到了预期效果。

另一方面,各游戏玩家制定了分层次在线编辑器,以提升文生视频词义的一致性。从简单文字生成高品质短视频,那就需要文生视频平台可以准确预测文本的用意,随后在保证输入文本行文结构的前提下形成精准的健身运动。为了实现这一目标,阿里巴巴的研究者制定了2个分层次伺服电机,即固定不动CLIP伺服电机与可课程内容伺服电机,各自获取高端词义和低等小细节,然后将合并到短视频扩散模型中,能够更好地保证了画面质量下形成视频内容词义连贯性。

此外,各游戏玩家也提高了视频尺寸,以确保视频生成实际效果的高品质。文生视频最预期的效果就是用户得出引导词,系统自动生成一切设计风格相对应短视频,但这对于视频尺寸给出了不小的考验。阿里巴巴的文生视频将视频尺寸上升到了1280×720,还改善了初始的600个去噪step,以改进形成短视频中出现的小细节、伪像和噪音污染。巨量引擎文生视频提出了根据文字具体指导+头尾帧照片引导的视频生成方式,促使视频生成的动态变得更加强大。

工欲善其事必先利其器

随着人工智能视频技术的不断发展,AIGC行业正在向AI短视频歪斜,AI文生视频的风口期也许即将来临,而参与到AI短视频创作里的游戏玩家也将会越来越多。即使是在这样的大环境下,不论是已经推出模型巨量引擎和阿里,或是正要发布插件的百度搜索,能进入文生视频跑道,其本身都是有着不可忽视依仗。

一来,参加游戏玩家算率储备充足,能够很好地摆脱文生视频在研发的不足。做为文生文、文生图的更新,文生视频对算率及其模型工程化能力要求比较高。据统计,文生视频的人工智能模型主要参数为10亿等级至100亿级别。而我国在文生视频行业有一定的规划的行业巨头中,不论是巨量引擎或是阿里巴巴、百度搜索,它在主要参数里的积淀都已十分浓厚。由此可见,这些具有算率储备的云服务厂商在探索视频生成类应用上有着独特优势。

二来,参加游戏玩家领域阅历丰富,能极大加快文生视频问世和迭代的速率。文生图和文生视频的人工智能模型在基础技术框架上有着很高的相似度,一定程度上而言,文生视频可以看作是文生图的升级版技术性,这就意味着,文生图的技术和经验能够文生视频加以运用和借鉴。而大家都知道,巨量引擎、阿里巴巴、百度等游戏玩家早就在文生图行业有一定的深耕细作,甚至一些商品早已资金投入商业,凭借文生图技术层面积累,其在文生视频领域也将实现大幅度发展。

三来,参加游戏玩家资源整合能力强劲,可以为其文生视频的高速发展增添助力。相对于文字和图片,短视频能承载的信息内容更高,也就是说,需要制造出更生动、超清,现实感更强大的短视频,各游戏玩家在文生视频方面的投入成本费都将更高一些。但是,值得一提的是,做为互联网大厂,阿里巴巴、百度搜索、巨量引擎经过多年的发展,其在人才、资产、算率等多个网络资源与实力方面的优势和权利不可小觑,归功于此,其文生视频平台都将拥有更强的市场竞争力和影响力。

山雨欲来风满楼

文生视频不但改变了传统传媒行业,同时也为具体内容升级产业链演变带来了很多新的商机和概率。只不过是,目前我国文生视频产品仍在持续发展的初始阶段,虽然看起来文生视频与文生图的逻辑性极其相似,但实际上,文生视频难度大得多,需要突破的瓶颈也有许多。

一是,文生监控数据要求严格、测算难度高,参加游戏玩家离产出率让人满意短视频还有一定间距。相对于文字和图片,视频在多维度信息内容表述、界面多元性及动态层面有更大优点,但是这同时也意味着,文生视频对算力的要求将进一步加大;文生视频所涉及到的自然语言理解、视觉处理、界面生成等行业,必须攻克的技术难题也在不断增加。而国内的游戏玩家,目前仍然欠缺高品质匹配数据,所以其在词义精确性、清晰度和持续性等多个方面可能会面临严峻考验。

二是,文生视频成本费消耗大,商业运营模式较单一,参加玩家想要将商业化的跑通还有一定难度。与文照片对比,文生视频的计算复杂性提高,相对成本消耗也会随之有所上升。此外,图片生成类的运营模式较为单一,收费方式和收费依据比较趋同化,而视频生成模型收费依据则与其说相近。尽管图片生成类在跨模态大模型中的商业化的程度高,可以为视频生成的市场化市场前景提供一定参照,但是作为新型产业,文生视频的市场化需要跑通还需一定时间。

三是,国内外企业陆续加强了对文生视频投入与研究,该赛道的市场竞争将会进一步更新。AI视频生成跑道早已十分热闹,不但有国外AI新成立公司Pika labs公布的“Pika 1.0”,也有谷歌搜索上线的AI视频生成实体模型“W.A.L.T”等。当然除了外国公司对文生视频技术性的高度关注外,中国百度搜索、阿里巴巴、字节数、腾讯官方、360、万兴科技、昆仑万维、鸿泉文化艺术、美图照片等企业都纷纷进军这一领域,并推出了有关的人工智能模型,显而易见,视频生成领域的竞争正逐步日趋激烈。

从文照片到文生视频,AIGC赛道的市场竞争早已十分激烈。虽然国内文生视频的推进相对缓慢,还是并没有大牌明星产品的出现,但多数有人才、懂技术的文生视频目前正在层出不穷。只不过是,除了以上考验以外,文生视频目前还有一些数据隐私保护和安全性问题要解决,真真正正的市场化运作和营运能力也仍需要认证。而谁能在此次“抢占市场”中成为最后的大赢家,我们也只能翘首以待。

本文来自网络,不代表热点新闻立场,转载请注明出处:http://www.redianxinwen.cn/13973.html

作者: admin

为您推荐

发表评论

邮箱地址不会被公开。 必填项已用*标注

联系我们

联系我们

13000001211

在线咨询: QQ交谈

邮箱: 2562541511@qq.com

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
返回顶部