视频 - 标签 - 腾讯云开发者社区-腾讯云

腾讯云

开发者社区

文档建议反馈控制台

首页TVP

#视频

Google“绝地反击”OpenAI新模型GPT-4o

数据猿 17分钟前2024-05-17 14:57:28

昨天被OpenAI的最新多模态大模型GPT-4o抢尽了风头，今天谷歌在I/O开发者大会上做出“绝地反击”，产品更新处处对标OpenAI。

200

视觉遮挡不再是难题：NVIDIA DeepStream单视图3D跟踪技术来帮忙

GPUS Lady

苏州吉浦迅科技有限公司 · 联合创始人 (已认证)

53分钟前2024-05-17 14:21:48

自动驾驶、智能安防、机器人导航等众多领域，视觉感知技术的准确性至关重要。然而，在实际应用中，物体遮挡问题却是一个常见的挑战，它可能导致感知系统出现误判或漏判，从...

200

【FFmpeg】Filter 过滤器 ④ ( 图片水印 - movie 过滤器 / overlay 过滤器 | movie 过滤器内置参数值简介 | 图片水印示例 )

韩曙亮 1天前2024-05-16 15:00:15

FFmpeg 中的 overlay 过滤器用于将一个视频流叠加在另一个视频流上 , 可以用于实现水印 / 字幕 / 画中画效果 ;

1610

腾讯云认证级别更名通知

腾讯产业互联网学堂1 1天前2024-05-15 18:46:17

腾讯云认证新级别发布之后，腾讯云认证原有级别名称与新级别名称具有相同效力。相关证书、文档、视频、政策发文、手册、宣传物料等所使用的原有级别名称可按上表1对应关系...

3710

谷歌Gemini时代来了！加固搜索护城河、赋能全家桶，Gemini 1.5 Pro升级至200万token

HyperAI超神经 1天前2024-05-15 18:40:15

Veo 可生成各种电影和视觉风格的 1080p 分辨率视频，视频时长可超过一分钟。谷歌表示，凭借对自然语言和视觉语义的深入理解，其所生成的视频可完美呈现用户的创...

7610

谷歌这次又“杀疯了”！200万token长文本能力问鼎全球最强，一场大会，AI被提了120次

深度学习与Python 1天前2024-05-15 18:32:47

Gemini 1.5 Pro 能够使用视频计算机视觉来分析图像（帧）和音频（语音）的视频，这使其具有人类水平的视觉感知。使用深度神经网络，Gemini 1.5 ...

5210

【他山之石】CVPR 2024 | 4D人体运动、渲染联合建模新框架，打造动态人体渲染新范式

马上科普尚尚 1天前2024-05-15 18:22:57

“他山之石，可以攻玉”，站在巨人的肩膀才能看得更高，走得更远。在科研的道路上，更需借助东风才能更快前行。为此，我们特别搜集整理了一些实用的代码链接，数据集，软件...

5410

谷歌2小时疯狂复仇，终极杀器硬刚GPT-4o！Gemini颠覆搜索，视频AI震破Sora

新智元 2天前2024-05-15 14:15:21

【新智元导读】昨天被OpenAI提前截胡的谷歌，今天不甘示弱地开启反击！大杀器Project Astra效果不输GPT-4o，文生视频模型Veo硬刚Sora，用...

5010

GPT-4o干掉初创全网实测，马斯克Karpathy等大佬纷表不服：OpenAI不过如此

新智元 2天前2024-05-15 14:14:14

官方公布的全能模型GPT-4o的炸裂演示，即便过去了一天，依旧让全网深陷其中，无法自拔。

7210

IUGC2024——产时超声检查挑战赛

医学处理分析专家 2天前2024-05-14 18:27:01

今天将分享产时超声检查挑战赛完整实现版本，为了方便大家学习理解整个流程，将整个流程步骤进行了整理，并给出详细的步骤结果。感兴趣的朋友赶紧动手试一试吧。

8710

【综述专栏】视频扩散模型！

马上科普尚尚 2天前2024-05-14 18:17:52

在科学研究中，从方法论上来讲，都应“先见森林，再见树木”。当前，人工智能学术研究方兴未艾，技术迅猛发展，可谓万木争荣，日新月异。对于AI从业者来说，在广袤的知识...

8510

OpenAI Sora负责人最新万字干货深访 · 完整版+视频

朱晓霞 2天前2024-05-14 17:31:33

这篇文章是关于OpenAI Sora项目团队负责人的采访，链接?见文章末尾?，主要包括以下内容：

12710

Sora是世界模拟器吗？全球首篇综述全面解析通用世界模型

机器之心 2天前2024-05-14 15:30:36

世界模型，即通过预测未来的范式对数字世界和物理世界进行理解，是通往实现通用人工智能（AGI）的关键路径之一。

9710

美国教授用2岁女儿训AI模型登Science！人类幼崽头戴相机训练全新AI

新智元 3天前2024-05-14 14:43:10

这个模型协调了两个神经网络、视觉编码器和语言编码器的对比目标，以自监督的方式进行训练（即仅使用儿童视角的录音，不使用外部标签），对比目标将视频帧的嵌入（向量）和...

8210

给文字动画注入语义灵魂！港科大开源「文字跳动」技术，每个单词都浪漫

新智元 3天前2024-05-14 14:40:21

在针对像素图的文生视频模型中，该工作与当下领先的文生视频模型Gen-2以及图生视频模型DynamiCrafter进行了比较。

12210

AI终结外语学习？未来人类只有母语一种语言

新智元 3天前2024-05-14 14:05:46

我们先来看一组数据，根据现代语言协会（MLA）的最新数据显示，2009年到2021年，美国大学非英语课程的注册人数下降了29.3%。

15010

DiT架构大一统：一个框架集成图像、视频、音频和3D生成，可编辑、能试玩

机器之心 3天前2024-05-14 12:32:44

今年 2 月初，Sora 的发布让 AI 社区更加看到了基础扩散模型的潜力。连同以往出现的 Stable Diffusion、PixArt-α 和 PixArt...

9510

CATO原理中的数学与魔术（八）——Royal Hummer及进阶一

magic2728 3天前2024-05-14 12:21:57

作为CATO原理魔术的代表作品，除了Baby Hummer外，还有一个名为Royal Hummer的姊妹篇，在《magical mathematics》中也有介...

11010

『GitHub项目圈选22』推荐5款深受好评的AI开源项目

Python兴趣圈 3天前2024-05-14 10:43:29

OpenGlass 这个项目可以让你使用不到 25 美元的现成组件，即可将任何眼镜变成可破解的智能眼镜。

15010

一款基于 GO 语言的轻量级视频终端下载项目，好强！

永恒君 3天前2024-05-14 10:38:56

Lux是一款基于Golang编写的快速、简单的视频下载库和命令行工具，支持众多个流行的视频网站，包括 YouTube、Bilibili、优酷、爱奇艺、腾讯视频、...

10310

#视频

Google“绝地反击”OpenAI新模型GPT-4o

视觉遮挡不再是难题：NVIDIA DeepStream单视图3D跟踪技术来帮忙

【FFmpeg】Filter 过滤器 ④ ( 图片水印 - movie 过滤器 / overlay 过滤器 | movie 过滤器内置参数值简介 | 图片水印示例 )

腾讯云认证级别更名通知

谷歌Gemini时代来了！加固搜索护城河、赋能全家桶，Gemini 1.5 Pro升级至200万token

谷歌这次又“杀疯了”！200万token长文本能力问鼎全球最强，一场大会，AI被提了120次

【他山之石】CVPR 2024 | 4D人体运动、渲染联合建模新框架，打造动态人体渲染新范式

谷歌2小时疯狂复仇，终极杀器硬刚GPT-4o！Gemini颠覆搜索，视频AI震破Sora

GPT-4o干掉初创全网实测，马斯克Karpathy等大佬纷表不服：OpenAI不过如此

IUGC2024——产时超声检查挑战赛

【综述专栏】视频扩散模型！

OpenAI Sora负责人最新万字干货深访 · 完整版+视频

Sora是世界模拟器吗？全球首篇综述全面解析通用世界模型

美国教授用2岁女儿训AI模型登Science！人类幼崽头戴相机训练全新AI

给文字动画注入语义灵魂！港科大开源「文字跳动」技术，每个单词都浪漫

AI终结外语学习？未来人类只有母语一种语言

DiT架构大一统：一个框架集成图像、视频、音频和3D生成，可编辑、能试玩

CATO原理中的数学与魔术（八）——Royal Hummer及进阶一

『GitHub项目圈选22』推荐5款深受好评的AI开源项目

一款基于 GO 语言的轻量级视频终端下载项目，好强！

热门专栏

机器之心

新智元

数控编程社区

量子位

TSINGSEE青犀视频

热门标签

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

#视频

Google“绝地反击”OpenAI新模型GPT-4o

视觉遮挡不再是难题：NVIDIA DeepStream单视图3D跟踪技术来帮忙

【FFmpeg】Filter 过滤器 ④ ( 图片水印 - movie 过滤器 / overlay 过滤器 | movie 过滤器内置参数值简介 | 图片水印示例 )

腾讯云认证级别更名通知

谷歌Gemini时代来了！加固搜索护城河、赋能全家桶，Gemini 1.5 Pro升级至200万token

谷歌这次又“杀疯了”！200万token长文本能力问鼎全球最强，一场大会，AI被提了120次

【他山之石】CVPR 2024 | 4D人体运动、渲染联合建模新框架，打造动态人体渲染新范式

谷歌2小时疯狂复仇，终极杀器硬刚GPT-4o！Gemini颠覆搜索，视频AI震破Sora

GPT-4o干掉初创全网实测，马斯克Karpathy等大佬纷表不服：OpenAI不过如此

IUGC2024——产时超声检查挑战赛

【综述专栏】视频扩散模型！

OpenAI Sora负责人最新万字干货深访 · 完整版+视频

Sora是世界模拟器吗？全球首篇综述全面解析通用世界模型

美国教授用2岁女儿训AI模型登Science！人类幼崽头戴相机训练全新AI

给文字动画注入语义灵魂！港科大开源「文字跳动」技术，每个单词都浪漫

AI终结外语学习？未来人类只有母语一种语言

DiT架构大一统：一个框架集成图像、视频、音频和3D生成，可编辑、能试玩

CATO原理中的数学与魔术（八）——Royal Hummer及进阶一

『GitHub项目圈选22』推荐5款 深受好评 的AI开源项目

一款基于 GO 语言的轻量级视频终端下载项目，好强！

机器之心

新智元

数控编程社区

量子位

TSINGSEE青犀视频

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

『GitHub项目圈选22』推荐5款深受好评的AI开源项目