HILOVEYOUTU 发表于 昨天 21:51

「1图就能生成逼真视频」字节跳动推AI模型 增深伪影片忧虑

https://pgw.worldjournal.com/gw/photo.php?u=https://uc.udn.com.tw/photo/wj/realtime/2025/02/09/31463677.jpg&x=0&y=0&sw=0&sh=0&sl=W&fw=800&exp=3600&q=75总部在北京的科技公司「字节跳动」日前推出仅靠一图片,就可生成完整视讯的AI模型「OmniHuman-1」,引发界内注意。 (路透)热门短影音平台TikTok在美国命运生死未卜之际,其在北京的母公司「字节跳动」(ByteDance)本周悄悄发布了一种堪称先进的视讯生成人工智能(AI)模型「OmniHuman-1」,只要一张图片就能生成影片,专家称是「所见过最厉害的」, 却也引发新的深伪影片(deepfakes)担忧。
美国广播公司新闻网(ABC News)报道,字节跳动在报告中称该模型以超过1万8700小时的真人影片进行训练,达到前所未见的准确性和个性化。
在示范影片中,著名的爱因斯坦肖像活了起来、栩栩如生地说话; 或是Ted演讲者发表演讲、音乐家边弹钢琴边唱歌,显示此模型只要单一影像和音频片段,就能产生任意高宽比的逼真影片。
AI专家阿杰德(Henry Ajder)表示这使得人们更容易沦为目标。 「以前可能需要数百甚至数千张图片来训练,才能制作有趣且几可乱真的影片。 现在只要一张图,用户就可以创造缺乏AI生成迹象(AI往往在手部动作或口型同步露馅)的影像,还可能躲过AI侦测工具的法眼... 这可能是我见过最厉害的模型,它将所有不同的多模式活动合而为一。 能够生成与自定义音频相配的影片非常引人注目,且不失真实度,它们非常令人印象深刻。」虽然OmniHuman尚未向公众发布,但阿杰德预测可能很快就会在字节跳动的产品上推出,包括TikTok。
ABC新闻撰稿人、前国安部情报主管科恩(John Cohen)称,AI生成的高品质影片,恐导致威胁急剧扩大,「美国正处于一个动态而危险的威胁环境中,这种威胁很大程度上是由外国情报机构、恐怖组织、犯罪集团、家暴者故意放置在网上的内容所推动,目的是煽动和告知犯罪及暴力活动。」而OmniHuman这种技术恐让不肖分子「更高效、更快速、更便宜」地制造深伪影片。点击下面文字可快速查看或发布对应的便民信息!纽约情报站让您的生活变的更简单:hug:电召车 :hug:顺风拼车:hug:汽车买卖 :hug:便捷搬家:hug:招聘求职 :hug:店铺转让:hug:房屋出售 :hug:商家黄页简介:纽约情报站是汇集全美75万粉丝的公众平台。除了实时新闻、找工招工信息发布、app社区互动,更有微信公众号推文探店等。如果你投稿、爆料、活动策划、商务合作,或者想邀请我们去探店,请联系主编微信: nyinfor

Kenny 发表于 昨天 22:11

吃出充成菜
页: [1]
查看完整版本: 「1图就能生成逼真视频」字节跳动推AI模型 增深伪影片忧虑