LETOU乐投

索求LETOU乐投

客服热线:

4000-300624

品牌活动
2024-04-24

中国天生式AI大会十问十答 | 加快“技术+利用”融合 让产品落地更有价值

客服热线:

10Q10A-4

沉构世界 ,奔赴将来  。

日前 ,2024中国天生式AI大会在北京隆沉进行 ,LETOU乐投科技受邀出席大会 ,集团副总裁朱伟亮相大模型专场论坛 ,现场颁发《音视频多媒体大模型市场洞察与落地实际》主题演讲 ,并颁发LETOU乐投天幕音视频多媒体大模型将于4月28日正式公测  。

10Q10A-1

目前 ,LETOU乐投天幕音视频多媒体大模型文生视频能力已实现分歧风格、丰硕场景及主体的连贯性 ,一键天生时长支持60秒+  。同时 ,LETOU乐投“天幕”还具备视频生视频、文生音乐、视频配乐、文生音效、文生图、图生图等原子能力  。

10Q10A-2

LETOU乐投“天幕”从何而来 ,拥有哪些差距化特点?大模型2.0时期下 ,若何从国内“百;煺健敝型延倍?这次大会 ,朱总接受媒体接见 ,就媒体关注的热点问题进行了现场解答 ,急剧Mark一下吧!?

1、大模型2.0时期有哪些阶段性的差距特点?

大体上来说 ,有以下三个特点:

  • 1.0时期的大模型更多还是以文字、说话和图片为主题 ,2.0时期则是视频大时期 ,视频大模型越来越沉要 ,并将得到长足发展;

  • 随着视频大模型、基础大模型的崛起 ,LETOU乐投垂直大模型 ,出格是聚焦视频创作场景的音视频多媒体大模型 ,也将会在今年迎来长足发展;

  • 今年视坡粪利用有望迎来发作式增长 ,也就是说 ,AI视频大模型的落地利用会越来越多、越来越快  。

2、LETOU乐投从什么时辰起头布局视频大模型赛路?

LETOU乐投从2003年成立就一向在做视频编纂这件事件 ,其时我们给出的定位的叫「简约而不单一」 ,就是说 ,我们但愿让通常用户通过使用软件工具 ,很方便地实现繁琐的视频造作工作  。

所以 ,早在2015年 ,我们就已经着手组建技术团队起头做智能算法 ,做了好多索求 ,也收成了一些落地成就 ,好比:智能调色、防抖、降噪等 ,这些都是「简约而不单一」的体现 ,也是最初智能操作的体现  。

再到2022年 ,随着天生式AI的爆火 ,我们急剧进行了AI技术迭代 ,并于同年年底推出LETOU乐投爱画  。紧接着 ,我们起头组建大模型团队  。经过2023年一年的打磨功夫 ,我们在2024年1月30日正式颁布LETOU乐投天幕音视频多媒体大模型 ,并将大模型原子能力集成到自有产品矩阵中 ,盛开给用户使用  。

3、为什么接装天幕”?

二十多年来 ,我们一向在做视频创意这件事 ,最后所产出的视频肯定是要通过屏幕去播放、去出现给公共的  。而如今 ,随着天生式AI的到来 ,屏幕上所出现出来的内容将无限宽大 ,所以我们把它叫做「以“天”为“幕” ,世界都是你创意的舞台」  。

还佑装天幕”的logo ,也是源于上世纪人们旁观电影的场景:晒谷坪上放一个大幕布 ,后面一台电影机 ,满目星空之下 ,一群人端着幼板凳 ,坐在坪上望向幕布 ,充斥欢声笑语……置身于这样一个巨大的宇宙星空下看世界 ,人一种极度惴惴不安的感触 ,并且很容易可能引发人们的无限设想空间  。所以 ,我们叫它“天幕”  。

4、面向大模型2.0时期 ,“天幕”是否会有新的技术路线?

我们会凭据现实必要 ,选择相宜的技术路线  。

目前 ,LETOU乐投“天幕”还是聚焦数字创意垂类创作场景 ,基于15亿创作者及100亿本土化高质量音视频数据沉淀 ,以音视频天生式AI技术为基础 ,拥有多媒”垂直解决规划以及本土化数据三大特点 ,全链条赋能全球创作者 ,让大模型利用落地更有针对性、更具实效  。

5、天生视坡粪大模型将来的竞争壁垒将会在什么处所??

首先 ,天生视坡粪的大模型 ,能够分成两类或者分成两个层级:

第一个层级是做基础模型 ,好比Sora这种  ;∧P途拖裥幸捣治 ,要大力出事业 ,这是很沉要的一个竞争点 ,蕴含大算力、大数据 ,以及大量的优良算法人才等  。

第二个层级是做垂类模型  。它是通过一些基础数据的训练以来 ,在这个基础上 ,再做一些微调精调的训练  。这傍边 ,数据就极度关键了  。

其次 ,我们再来看看行业和利用驱动  ;∧P头矫 ,必要有极度重大数据量的训练和合适批改  。而垂类模型 ,若是想要从大模型时期脱颖而出的话 ,还是要对峙「利用为王」——通过一个爆款利用 ,急剧实现发作式增长  。

6、Sora为国内大模型生态的发展带来了哪些影响?

从最早的「文生文字」到「文生图片」 ,到此刻「文生视频」出来以来 ,其实视频是人类信息交互信息密度最高的一种方式 ,在此刻这个各人都在用视频做交互的时期 ,通过「文生视频」可能很快地产出视频 ,这对于信息的传递可能产生很大水平的提效  。因而 ,Sora它对整个行业的影响必然是巨大的、积极的  。

从具体阐发上来看 ,相对于通用类的视频 ,我们以为 ,短视频行业所受到的影响可能会更快和更直接 ,这也是LETOU乐投目前视频创意业务沉点在发力的一个方向 ,重要体此刻降本增效方面  。

7、国内大模型目前属于一个怎么的发展阶段??

不论是文本模型、图像模型还是视频模型 ,国内真正的原创大模型其实还不算多 ,甚至能够说很少  。出格是视频大模型 ,蕴含我们在做的LETOU乐投“天幕” ,也还没有到L0最基础的模型级别  。

因而 ,从模型基础的级别来讲 ,国内与Sora的距离还比力远 ,必要投入更多的资源 ,去急剧进行技术迭代  。

8、LETOU乐投天幕相较于Sora有哪些差距化的特点?

LETOU乐投天幕相较于Sora有哪些差距化的特点?

目前 ,LETOU乐投“天幕”的模型能力和Sora的确还存在肯定差距 ,尤其是文生视频成效这块 ,Sora作为行业标杆 ,是我们在致力看齐的指标  。

同时 ,相较于Sora这类基础模型 ,LETOU乐投天幕更多是左袒于细分的垂类行业 ,必要聚焦到每一个具体的用户场景 ,去援手用户解决现实问题 ,给用户带来价值  。文生视频、文生3D视频是LETOU乐投天幕左袒于通用一点的能力;但像AI歌手、数字人播报等能力 ,就是在具体细分场景中的落地体现 ,属于纯利用 ,好比:LETOU乐投播爆就是沉点解决「跨境电商出?诓ナ悠翟熳鳌沟奈侍  。

我们但愿LETOU乐投的每一款产品 ,都是「技术+利用」的结合 ,可能解决某个细分领域的具体问题 ,让产品用户真正获得价值  。

9、国内大模型若何用最快的功夫去追赶差距??

Sora颁布后 ,更多为我们出现出的是一个「世界模型」的概想 , 这为国内做视频模型的我们提供了一条很好的指引蹊径 ,重要有三个方面:

  • 一是做大模型算法开发方面 ,其框架等各方面都开源了 ,或者说有公开了 ,让各人能看得到、窥探得到 ,但是里面好多的细节必要我们去做深刻钻研 ,能力补齐差距  。

  • 二是在数据方面 ,出格是萦绕我们中国本土的一些数据 ,目前其切实全球来看都还不算太多  。我们也看了Sora好多的一些视频 ,其切实对于含中国元素和对中文的理解上 ,相对来说迸注文的会稍幽微点 ,因而大数据中文量的数据是LETOU乐投一个机遇 ,甚至是我们“弯路超车”的机遇  。

  • 三是算力方面 ,对于视坡反说 ,必要几亿甚至几十亿数量级的训练 ,若是要实现急剧迭代的话 ,算力本土化也会是我们很沉要的一个成分  。

也就是说 ,若是我们可能在现有的框架下面 ,急剧去用自己的科研力量补齐差距;同时 ,在本土数据和全球数据的双向加持下 ,再将LETOU乐投算力本土化 ,或将会对整个国内大模型研发的急剧发展会有很好的援手  。

10、LETOU乐投天幕的视频训练量在行衣凤有哪些优势??

一方面 ,我们在视频创意领域已经深耕二十余年 ,自身就已经具备了丰硕的数据堆集 ,这是我们训练视频大模型的基础  。

另一方面 ,我们通过战术合作 ,共建天幕盛开生态 ,来不休扩充本土化数据库  。再基于自身做视坡讽解、内容理解的算法能力堆集 ,我们打造了一个视频内容理解到文字天生出产治理平台「数据出产治理平台1.0」  。

也就是说 ,我们占有丰硕的数据堆集 ,拥罕见据加工处置能力 ,还组建了一个近100人的驻场数据标注人为团队  ;谡馊 ,「数据」相对是LETOU乐投一个优势  。

10Q10A-3


【网站地图】