当前位置:文章 > 列表 > 正文

可灵3.0加入AI拜年战场!者于工位搓好莱坞大片,分镜逻辑封神 - 韩媒

隆重。
📅 2026-02-20 05:41:50 🏷️ 六堡茶批发多少钱一斤 👁️ 252
可灵3.0加入AI拜年战场!者于工位搓好莱坞大片,分镜逻辑封神

此次我喂给AI一段同时考察主体一致性、连续加减速之运动体谅,以及多区域切换时之镜头跟随与时序控制之提示词: 咱再玩点有意思之,来点跨界融合看看效果,我给出之提示词如下: 然后我就会得到一名香蕉猫与优雅企鹅于纽约街头盘算之吃豆腐脑之「玄虚抓马」大戏:暴露出来之疑难也不少:第一帧底色白底直接出错,后半段香蕉猫之嘴形没对上,角色与底色之融合度也偏低,整体看下来,此为此轮里生成效果最差之一名…… 好消息为,于全新之可灵视频3.0生成页面中,直接给模型安排上之名「分镜」小版块,长下面zhei样: 此其实也说明之模型于书契架构体谅、方位变换下之稳固渲染以及跨镜头一致性保上之本领已相当扎实之。

于为乎,一名阴雨夜贵妃猫娘娘与大臣小狗对峙之宫斗片段之画面就新鲜出炉之,别说还真有点紧迫刺激彼味儿之。

推理。

好莱坞大片也为手拿把掐,10秒钟切换7名镜头,从引擎轰鸣火花飞溅,再到男女主激烈争执,让我此名导演有点汗流浃背之... 智能分镜本领确实夯,模型确实更能体谅镜头言辞之,像书契与者物之一致性上表现也蛮超出预期。

为之让友友们更清楚地做对比,我把我输入与输出之角色形象截取对比之一下,大家觉得主体一致性表现如何。

角色情绪与眼神动作皆完全拿捏到位,而且猫猫之特写镜头给之格外好,看来此AI为懂点镜头言辞之。

(有没有四川之朋友点评一下,此口音说之正宗不。

觉受「自定义分镜」功能还为更适合对提示词与分镜脚本较量熟之朋友去用。

) 画面此块基本没啥可挑之,直接给满分,者物主体一致性也确实还原得甚到位,马斯克与奥特曼本者看之估计皆得一愣。

Information Theory。

1)智能分镜|音画齐步|主体一致性:格外适合做多镜头多对话之AIGC视频,于AI短剧、影视此类场景极其适用。

为之更好考察模型之主体遵循本领,此次我喂给AI之为一段包含者物多视角、多动作之提示词,并上传之两名不同视角之者物形象照: 既要上传参考图,又要自己拆分镜头、逐一标注每名镜头之主体,若折腾此么一圈,最后生成效果还不抱负,u1s1,多少会有点难受…… 原本提示词里明确为小狗说“老师”,但模型于生成时把此句台词顺带分给之小猫,导致角色说话之对应关系被打乱,整体台词逻辑现之点偏差~ 咱们日常生成视频时,始终不停反复抽卡之主要缘由之一便为——提示词太长、镜头太多,视频模型接不住。

先天下之忧而忧,后天下之乐而乐。

不光我一名者玩嗨之,各位脑洞大开之网友们也纷纷share自己之大作之,下面此小哥直接搓出来之名超燃篮球赛大片,并直言够逼真。

此“草台班子”之操作,寒之多少者之心。

协调。

好大之口气,大家皆要知道,相比角色一致性,书契一致性其实更难。

发展

可灵之黑金会员可先于Web端体验一波,非黑金用户也不用急,觉受全面敞开应甚快就会来~ 此次,可灵视频3.0打之第三名招牌就为——字形保留高保真。

bug确实也有,但大部分也为今多模态模型之通病,模型对于咱日常工娱乐来说足够用之。

而且说实话,对我来说此种需自定义镜头之方式也略微麻烦。

彼我就不客气之,此次我给出AI之需求指令中,明确提到之光影变化、镜头切换以及旁白配合之多镜头场景,此就要求AI于不断运动与切换之历程中,依然能保较高之书契一致性: 大明星猫猫一名眼神给出去,直接现场教学啥叫“身体成之一名X型”,别说此小身材搭配此小眼神整之还挺曼妙: 咱先来看对繁文本指令之遵循本领如何~ 我给出之提示词中涉及之一名场景,四名镜头,两段角色对话与一名底色音乐。

整体来说可给名80分内样。

勿以恶小而为之,勿以善小而不为。男孩

还有网友感慨,以后拍电影怕为皆不用找真者演员之,此不嘛,者家直接找AI演之波超玄虚之家大戏,脑洞太大之… 者物之肤色明显变深之,发型也从原本之斜偏,直接变成之寸头…… 我最近正好于重温《甄嬛传》,但光看剧已有点不过瘾之,索性直接让AI来一段后宫宫斗cut,于为我给它喂之一大段带双者对话、明确镜头切换之繁提示词: 唯一之小bug现于之台词上。

实在哪些功能最好用、适合啥样之用场景,我也帮友友们整理好之(省流版): 尤其为经常做AI短剧、AIGC自媒体之朋友,对镜头切换之数量与品质要求皆较量高,此类疑难就更明显之…… 最后,咱再来试一名可灵3.0视频模型中我自认为极其有意思之一名本领——说方言 咱平日里只要生成涉及「主体角色」之AI视频,有名几乎90%皆会遇到之疑难—— 也不知道可灵此回受之啥启发,于视频3.0中直接搞之名多图或视频之主体参考功能。

Reliability。

字形稳得住,方言还得再练 实在实测效果咱往下看,顺带也欢迎大家来评评我此几部春节档大片,导之水平到底行不行。

然后我就会得到一名香蕉猫与优雅企鹅于纽约街头盘算之吃豆腐脑之「玄虚抓马」大戏:暴露出来之疑难也不少:第一帧底色白底直接出错,后半段香蕉猫之嘴形没对上,角色与底色之融合度也偏低,整体看下来,此为此轮里生成效果最差之一名…… 接下来玩玩分镜头叙事功能。

于音频办理上,小猫与小狗之语气、情绪与台词匹配度甚高,发音里之轻重缓急也办理得不错,角色之表情与眼神跟对白对得也甚准。

再来测测:视频O3 OMNI emm…我为觉得镜头1与3与我给之原参考形象为近乎1:1还原之,然则镜头2就明显现之疑难。

总之来说,智能分镜本身为靠谱之,多镜头架构基本不会出大疑难,只为于台词与音频分发上偶尔会冒出一些小bug~ 此不仅为把艺者推到舆论之火上烤,更为对台下所有粉丝与线上观众之不负责。

先说长处,我只能说此智能分镜确实挺智能,涉及到之镜头、台词全部1:1地还原之,respect啊。

我疑虑此里头之缘由或为因我喂给AI之本身没有严格意义上之正面形象,故AI自己脑补之一下。

膝伤

大幂幂此波,纯粹为给不专业之主办方背之黑锅,也难怪粉丝们要为她鸣不平,坚决要求讨名说法之。

但疑难也甚明显,咱此一题考之其实为方言本领,事实上,两位一名天津话没说对,一名北京话也没对上,反倒寻常话说得相当标准…… 按照官方之说法,模型支中、英、日、韩、西多语种生成,四川话、粤语等地道方言与各地口音。

上传一段3–8秒之角色视频就能提取外观与声响,多图主体模式下再补一段3秒以上者声就能绑定固定声线支原生自定义分镜,视频时长也晋级到15秒,甚适合需讲清楚一段典故、或者做中长视频实质之友友。

岗位

主体相似度上之一名level,模型对繁提示词之体谅更到位之,用于多镜头、多动作场景里更稳。

2)书契一致性:贼适合办理AI电商广告等场景之书契讯息,文本形态基本能做到1:1还原。

大家伙快来看看,AI给我搓出来之名近乎达到「商用水平」之香水广告宣传片demo: 反正此波实测下来我最直观感受就为: 年还没到呢,可灵就超绝不经意甩出一名「过大年谋划」:推出可灵3.0多模态全家桶。

量子位 | 公众号 QbitAI 一名火急火燎、赶之打卡之上班牛马,于马路上横冲直撞之名场面视频,此不就到手之嘛(doge): 角色明明只为换之名动作,结局上一秒与下一秒长得就已不为同一名者之…… 吾等可直接绑定者物角色形象,并上传不同视角之参考图,此样一来模型于主体识别上就更稳稳稳之。

突破。

先看我导之此出《拳王》(赛博版)动作大戏,10秒钟狂切6名分镜头: 突然想起来,我上一次用可灵还为于测试O1模型,此次实测下来,能明显觉受到3.0相比O1好用、也好玩之不少。

(我猜或跟我提示词之动词太多有关系……) 我主打一名先尝为快。

申亮亮。

平台一共给咱提供之两种样貌:智能分镜自定义分镜 除之O3视频模型,可灵此次还顺手上新之另一位全能视频选手——O3 OMNI,彼此OMNI实在能干点啥呢: 我一度疑虑为不为AI对北京话、天津话不太熟,于为我索性再加一道题,让AI复生成之一名兵马俑说四川方言之视频: 让每名者,皆能上桌当——大导演 即便镜头处于延续旋转运动中,香水瓶身之logo书契依旧保清晰、不变形。

(翻译:俺们AI生出来之字儿不变形 不为,谁也没跟我说本年之AI春节大战搞得此么猛猛猛啊。

若需求没彼么高、又像我一样对提示词不算精通之话,还为更推荐大家直接用「智能分镜」。

(我为觉得不如智能分镜之效果好) 跟手动拆分镜说byebye 10秒内,万圣节之小兔子成之跳跃动作,并依次穿过落叶地面、南瓜灯与墓碑三名区域,自动补全之参考图中未给出之萌萌视频,不戳不戳。

灾难片自我也不于怕之,浓雾封城、街道废弃、广告牌疯狂摇晃……咋样,为不为有点《后天》内味儿之: 于全新之「O3 OMNI」模型里,吾等可直接自定义分镜,此次我上传之两张参考图(香蕉猫+优雅企鹅),然后把分镜脚本也一并塞之进去: 俩者大裤衩子大背心一穿,吃大饼吃之彼叫一名香啊,你别说,还挺入乡随俗。

此回对味儿之,虽兵马俑长相有点惊悚,然则此四川话说之倒为蛮厉害之。

制度。原创新闻

唯一之大bug:底色音乐没给我生成要,为能再来一段BGM就更对味儿之…… 要为此样之话,我有名大胆之想法,咱让奥特曼与马斯克跑天津来吃煎饼果子,顺便来一段地地道道之“贯口”: 我于智能分镜中,吾等可直接把一整段包含多镜头、多动作、多角色之提示词一股脑丢进去,AI会自动帮吾等分成不同之镜头。

当然,稳不稳还得——实测说之算。

金观平

上一篇:2岁时被大舅带之买菜盒失踪40年,家者给大舅上坟时,告知之孩子已找到之消息 下一篇:全隐藏式车门把手,强制禁止!来年1月1日起实施——