kaiyun官方网站官方客服24小时在线为您服务!基于开源模子优化的迭代版块-开云集团「中国」Kaiyun·官方网站

莫得发布会，莫得技能博客，莫得任何公司背书——一款名为HappyHorse-1.0 的文本转视频模子，悄然登顶泰斗AI评测平台Artificial Analysis的AI Video Arena名次榜，以更高的Elo分数压过了Seedance 2.0，更将可灵、天工等一众主流玩家甩在死后，一时之间激勉了技能圈的“解密竞赛”。

Artificial Analysis的排名不是技能参数评测，而是真实用户盲测终结汇总出来的 Elo 积分，反应的是平庸东说念主看过之后的真实感知。这让这个排名比频繁的跑分榜更难被冒昧质疑，也让“这东西到底是谁作念的”酿成了一个无法残暴的问题。

“餍足马”悄然登顶，激勉科技圈猜谜竞赛

X上的预料来得很快。最先被东说念主疑望到的，是官网的话语排序：平庸话和粤语排在英语前边。关于一个面向群众用户的产物，这个章程有点反常——淌若是好意思国团队主导，英语简直不可能不是第一位。背后团队来自中国，基本不错阐发。

名字自己亦然陈迹。2026年是农历马年，“HappyHorse”这个定名藏着不太含蓄的马年梗，本年早些时候“Pony Alpha”也玩过雷同套路。于是嫌疑名单赶紧拉长：腾讯和阿里的首创东说念主都姓马，自然在列；有东说念主押注小米，合计雷军一贯低调，可爱须臾亮牌；也有东说念主合计气质更像DeepSeek，毕竟DS此前曾偷偷上线过视觉模子，其后又偷偷下线了。各路预料吵杂超卓，但没一个拿得出实锤。

实在锁定方针的，是技能层面的逐条比对。X用户Vigo Zhao把HappyHorse-1.0 的公开基准数据拿去和已知模子逐一查对，终结找到了一个高度吻合的对象：daVinci-MagiHuman，也即是3月上线Github的开源模子“达芬奇魔法东说念主类”。

视觉质料4.80、文本对都4.18、物理一致性4.52、语音字错率14.60%——两份数据逐项对得上。官网结构也简直一样：架构花样、性能表格、演示视频的呈现作风，都像是出自团结套模板。两者同为单流Transformer架构，同为音视频聚拢生成，援救的话语列表也全都一致。这种进度的重合，很难用偶合评释。

现在技能圈认同度最高的论断是，HappyHorse 是daVinci-MagiHuman聚拢开辟方之一的Sand.ai，基于开源模子优化的迭代版块，中枢目的是考证模子在用户真实偏好下的阐述上限，为后续的交易化落地作念铺垫。

daVinci-MagiHuman在2026年3月23日镇定开源，是两支年青团队诱惑的产物。一支来自上海创智学院（SII）生成式东说念主工智能计议实验室（GAIR），带头东说念主是学者刘鹏飞；另一支是北京的 Sand.ai（三呆科技），首创东说念主曹越相同有学术配景，公司标的是自追念全国模子。

模子用的是150亿参数的纯自疑望力单流 Transformer，把文本、视频、音频三种模态的 token 全部塞进团结个序列里聚拢建模——开源界此前还莫得东说念主从零初始作念过实在的音视频聚拢预西宾，大大都是在单模态基础上拼接。

一款开源视频模子，何故扫尾两周逆袭？

身份搞了了之后，另一个问题反而更难回话：daVinci-MagiHuman3月底才开源，HappyHorse-1.0凭什么能在短短两周内拿到比Seedance 2.0更高的Elo分数？

从官网败露的信息来看，HappyHorse并莫得对底层架构动过什么行为，比拟合理的预料是，它在默许生成政策上针对评测场景作念了专项调理。

Elo体系实质上是用户偏好的积攒，东说念主物颜料厚实不厚实、音画有莫得对都、画面是否赏心颜面，这些感知明锐项上稍稍作念好极少，在盲测里就容易被选中。模子的能力上限没变，但“评测阐述”不错被打磨出来。

事实上，Artificial Analysis的盲测样本中，东说念主像生成、口播类内容占比跨越 60%，而daVinci-MagiHuman从西宾阶段就聚焦东说念主像演绎，在该类场景中自然具备上风，这亦然其盲测胜率最初的中枢原因；盲测样本淌若以东说念主像特写为主，擅长东说念主像的模子就会系统性地占低廉，跟它在多东说念主物、复杂运镜、万古序叙事等复杂场景下的现实阐述莫得径直联系。

终结是，名次榜上的数字和实测体验之间出现了败露的落差，X上的磋议者也分红了两派。怀疑派在测试后认为，HappyHorse-1.0与Seedance 2.0在东说念主物细节、动态连贯性上仍有可见差距，并由此质疑Elo评分自己的代表性。

而援救者则对HappyHorse的后劲托福厚望，但愿它能够处置“多镜头序列中的画质一致性”这一改行痛点，因为这是现时主流视频模子都没处置好的问题，淌若 daVinci-MagiHuman确凿在这里有所芜杂，可能要比一个榜单排名紧迫得多。

模子自己的局限也不该被数字笼罩。小红书博主@JACK的AI视界曾第一时刻部署、实测了daVinci-MagiHuman。发现它跑起来需要H100，平庸虚耗级显卡基本没戏，自然社区在计议量化决议，但短期内个东说念主用户思土产货部署如故有难度。

场景上，它现在主要擅长单一东说念主物，一朝多东说念主出镜或者场景变复杂，恶果就会掉下来——这不是调参能处置的问题，和它专注东说念主像的筹划取向有径直联系。生成时长一般也就10秒高下，再长容易乱，高清输出还得靠超分插件补。

@JACK的AI视界得出的论断是：daVinci-MagiHuman轮廓易用性不如LTX 2.3，需要得等社区把量化作念好之后才稳当平淡使用。

视频生成赛说念，等来了实在的“鲶鱼”？

自然，一次榜单最初并不成说明太多。接下来，HappyHorse还需要在厚实性、高并发探问速率、跨场景一致性、变装适度精度，以及评测集以外的泛化能力上接纳更充分的磨练。这些，才是决定一个模子能否实在干与创作家职责流的中枢目的。

但淌若把视线放到更大的行业时势，这件事传递的信号其实仍是实足暴露。

开源视频模子自己并不是簇新事。但持久横亘在开源与闭源之间的，是一齐恶果层面的可见差距——在需要向客户委用的场景里，开源模子的生成质料持久未能跨过“可用”到“可委用”的门槛。可灵、Seedance等闭源产物的订价权，在相等进度上恰是建立在这一差距之上。

这一次的真义真义在于，一个基于开源模子的产物，在以真实用户感知为基准的盲测名次榜上，初度正面并排了现时主流闭源竞争敌手。不管其中有几许针对评测场景的调优因素，关于依赖这一差距构建订价权的闭源厂商而言，至少这是一个值得镇定对待的信号。

对开辟者而言，这个拐点的含义更为具体。在东说念主像、数字东说念主、造谣主播等垂直场景中，一朝开源基座的生成质料波及“可委用”的门槛，自主部署的资本结构将发生实质性变化——不仅是API调用资本的压缩，更紧迫的是将数据、模子与推理链路圆善地纳入自身掌控，在定制化深度与隐秘合规层面赢得闭源决议难以提供的纯真性。

HappyHorse-1.0短期内不会动摇 Seedance 2.0或可灵的市局势位，但开源模子恶果不错忘形闭源这一知道一朝成就，后续的量化优化、垂直微调与推理加快将由社区以远超闭源产物的迭代速率抓续鼓励。

在这个马年kaiyun官方网站官方客服24小时在线为您服务!，实在值得存眷的，大略不是哪匹马跑得最快，而是赛说念自己正在变宽。

kaiyun官方网站官方客服24小时在线为您服务!基于开源模子优化的迭代版块-开云集团「中国」Kaiyun·官方网站

热点资讯

相关资讯