有奖捉虫:行业应用 & 管理与支持文档专题 HOT

一、定制素材自检项

形象定制需提交一段3-5分钟的真人口播视频。提交前请务必逐条检查以下自检项:
1. 视频画面:人脸清晰不模糊,人脸区域放大后边缘轮廓清晰,画面稳定无晃动。
2. 模特表现:眼睛正视镜头,无大幅转头、偏头,脸部全程无遮挡。
3. 拍摄要点:视频开头静默闭口1-3秒,整条视频全程无剪辑、跳帧,全长须超过3分钟。
4. 环境声音:无其他人声掺入,无明显环境噪声,视频音画同步(声音与口型须对应)。
5. 拍摄背景:如果需我方扣像,则需提供绿幕视频,绿幕需铺满背景、无其他杂物。
视频格式要求:
1. 视频大小不超过5GB,时长不短于3分钟、不长于10分钟。
2. 视频格式为 mp4、mov。
3. 视频分辨率1080P、4K(3840*2160),宽高比符合16:9 (9:16)。
4. 视频帧率不低于25fps、不高于60fps。

二、拍摄指引(视频版)

1. 无需更换背景拍摄指引

?

2. 需要更换背景拍摄指引

?

三、拍摄指引(文字版)

拍摄场地布置

1. 场地选择

请选择光线稳定充分,安静无杂音的房间录制。

2. 模特服装造型选择

模特:五官端正、有颜值、有?质、说话??清晰、表演?然、优先上镜经验丰富的模特。
服装:服装纹理简单、颜色与绿幕有差异的服饰(不要选择反光材质/格子条纹的服装)。
发型:发型规整, 避免明显发缝、碎发;避免佩戴会晃动的耳坠。(仅针对绿幕抠图的素材有此要求,不需要更换背景的则无此限制)
?
?
?
?
?
?

3. 拍摄设备和布光

拍摄过程画面稳定不抖动,录制过程中光线不发生显著的变化。
拍摄画面分辨率在1080p及以上,不要开启 HDR 录制模式。
绿幕平整无褶皱,铺满画面。
注意:
如有后期有换背景需求可使用绿幕拍摄;如对固定背景有诉求可选择适宜的背景环境进行拍摄,后续生成的视频均会保留此背景。
?
?
?
?
?
?

拍摄录制

1. 视频录制站位

?
?
?

2. 拍摄监测实时预览

可通过obs等软件实时预览抠图效果,可前置发现配饰反光、面部&服装反绿光等情况,在拍摄现场可实时调整拍摄方案,避免反复录制耽误定制的进度。

3. 拍摄录制(需同期收音)

景别选择:若最终生成的视频用于竖屏场景,建议使用竖屏拍摄;横屏同理。当全身出镜时,确认人像尽量大,手部动作不要出画面。
录制过程:
1. 启动录制后, 模特先闭口1-3秒, 保持姿态不动。
2. 接下来, 模特自然说话3-5分钟;避免相同文案不断重复;说话过程可以自然小幅动作, 眼睛不要斜视、需正视摄像头。
3. 说话结束后,停止录制。

四、后期处理

1. 剪辑

掐头去尾,去掉开头、结尾多余画?。
剪辑?程的帧速率设置须和拍摄的素材帧速率保持?致,避免声画?型不对位。

2. 调?及美颜

修复画?瑕疵,确保模特颜值在线,但要保留模特?肤质感,不能太?、太平。

3. 调?

如果视频?的?频有噪?,需要去噪,确保声?质量良好,同期声清晰。

4. 抠像

若您具有抠像能力,可以对原始视频提前进行抠像处理。根据所提供视频素材,将支持提供不同的视频输出能力。
?
情况一:提供经过抠像处理后的“纯绿底视频”(下图视频2),数智人侧绿底背景视频直接输出(下图视频3)
需要提供1个加工后的绿底视频进行训练,数智人侧将直接使用绿底作为最终输出的视频背景,定制效率较高,交付时间短。
同时,数智人交互&播报接口里输出的视频&视频流,不支持实时换背景,即:①不支持替换背景输出;②不支持输出透明背景的webm视频。
?
?
?
客户拿到数智人输出的视频后,还需要在应用场景中进一步去绿处理。扣像指南如下:
抠除绿布背景,去除演员?上绿?反光,记得?其他背景颜?检查是否抠?净,要确保能适配任何背景画面。
抠像?净后,背景填充纯绿?,#00ff00 (R:0、G:255、B:0) 。
?
情况二:提供原始拍摄视频外,额外提供alpha通道的视频(下图视频2),数智人侧支持背景更换输出(下图视频3)
需要同时提供“视频1:原始拍摄视频”(也可以是经过加工的视频)和“视频2:alpha通道视频”,这两个视频的分辨率、时长需要完全一致。
此情况下,数智人交互&播报接口里输出的视频&视频流,可以支持实时换背景。
?
?
?
注意:
alpha 通道视频暂不支持通过 API 传输,需要客户线下提供。

五、小样本用于交互场景时录制要求

如果小样本需要用于实时交互场景,在录制3-5分钟视频时,对模特的手部动作有额外的要求。具体要求如下图所示:
?
?
?
1. 手部有动作片段:即数智人在交互场景下,适合“说话态”的片段;该片段里模特的手部可做一些尽量通用的动作,动作做完要尽快归位,单个动作不超过3秒钟。示意图如下:
?
?
2. 手部无明显动作片段:即数智人在交互场景下,适合“倾听等待态”的片段;该片段里,模特在保持自然说话的同时,手部尽量不要用明显的动作,示意图如下:
?
?
3. 录制 Demo 参考视频如下:
?
?


http://www.vxiaotou.com