
浏览次数: 时间:2025-03-29 13:19:46
事件:2月㊣10日,据豆包大模型团队官宣发布视频生成实验模型“VideoWor✅ld”,不同于Sora□□、DALL-E□□□、Midjourney等主流多模态模型,VideoWorld在业界首次实现无需依赖语言模型,即可认知世界。
视频生成成为通用知识学习方法,在现实世界充当“人工大脑”。作为一种通用视频㊣生成实验模型,VideoWorld去掉语言模型,实现了统一执行理解和推理任务。同时基于一种潜在动态模型,可高效压缩视频帧间的变化信息,显著提升知识学习效率和效果。且目前该项目代码与模型已开源。在不依赖任何强化学习搜索或奖励函数机✅制前提下,VideoWorl✅d达到了✅专业5段9x9围棋水平,并能够在多种✅环境中,执行机器人任㊣务。团队认为,视频生✅成可以成为一种通用的知识学习方法,并在现实世界充当思考和行动的“人工大脑”。
模型仅靠“视觉”即可学㊣习知识,“预测”未来,并“理解”因果关系。研究团队㊣构✅建了两个✅实验环境:视频围棋对战和视频模拟操控,它在保留丰富视觉信息的同时,压缩了关键决策和动作相关的视觉变化,实现了更有效的视频学习,且这种纯视觉㊣模型可“预测”未来,并能“理解”因果关系
以海康威视为代表的“视觉市场”有望在视频㊣大模型的能力催化下收益,作为全球知名的视频监控行业龙头企业,根据2024年度全球安防50强榜单,以97.22亿美元的㊣2023年安防产品销售收入稳居第一,超过后两名的总㊣和。2022年,明确智能物联(AIOT)战略,2023年,公司正式推出“观澜大模型”助力各行业实现数字化□□、智能化升级。根据Omdia报告,2022年海康威视在全球视频监控市场中的占有率达到25.9%,大幅领先于第二名。在庞大的视频监控部署网络下,开源视频大模型的诞生对海康而言无疑是一剂强心针。
萤石网络公司2023年智能家居摄✅像头业㊣务营收占比62.07%,且作为公司的现金牛业务及第一增长曲线,市场占有率处于市场前列,且连续多年在双11□□、618等购物节的天猫□□□、抖音等平台相关类目品牌排行中位列第一。且公司在视觉技术方面拥有硬件□□□□、软件□□□□、云平台高度融合的生态✅闭环镭✅威视监控,端云协同,为智能检测□□、智能识别□□、AI分析推理等功能提供了强大支✅持。视觉大模型的发布有望进一步助推视觉领域业务再上台阶。