据小易智创xiaoyizc.com(不可错过的AI创业项目)观察:OpenAI的神奇视频生成工具Sora,自推出以来就备受热议,但其究竟源自何方,至今仍是个未解之谜。近期,真相似乎有了新的线索:Sora的训练数据中,很可能蕴藏着大量来自Twitch的游戏直播和攻略视频!这款神奇工具如同一位技艺非凡的“模仿大师”,仅需简单的文本提示或图像,就能轻松生成长达20秒的视频,兼容各种宽高比和分辨率。今年2月,OpenAI首次推出Sora时曾提到其模型在《我的世界》的视频中进行了“深度修炼”。那么,除了这一经典游戏外,Sora的“秘籍”还隐藏着哪些游戏宝藏呢?结果颇为震撼,Sora似乎对各种游戏类型都了如指掌。它不仅能生成一段带有“马里奥”影子的克隆游戏视频,尽管略显“瑕疵”;还能够模拟出激动人心的第一人称射击游戏画面,仿佛《使命召唤》与《反恐精英》的“完美结合”;更能重现90年代《忍者神龟》街机游戏的热血对战场景,让人仿佛回到童年美好时光。更为惊奇的是,Sora似乎对Twitch直播的形式也十分熟悉,显示出它曾“观看”了大量直播内容。Sora生成的视频截图,不仅精准捕捉了直播框架,连知名主播Auronplay的形象也惟妙惟肖地还原,甚至包括他左臂上的纹身。此外,Sora也“识别”了另一位Twitch主播Pokimane,并生成了与她外貌相似的角色视频。为了规避版权问题,OpenAI设置了过滤机制以防止Sora生成包含商标角色的视频。虽然OpenAI对其训练数据来源保持沉默,但种种迹象表明,游戏内容极有可能成为Sora训练集的一部分。OpenAI前CTO米拉·穆拉蒂在三月份接受采访时,并未否认Sora使用了YouTube、Instagram及Facebook上的内容进行训练。OpenAI在Sora的技术规范中也承认使用了“公开可用”的数据以及来自Shutterstock等媒体库的授权数据。如果确实将游戏内容纳入Sora的训练,这将可能引发一系列法律问题,尤其是在OpenAI基于Sora开发出更具互动性的体验后。知识产权律师约书亚·韦根斯伯格指出,未经授权使用游戏视频进行AI训练,将面临巨大风险,因为训练AI模型通常需要复制训练数据,而游戏视频中包含大量受版权保护的内容。生成式AI模型如Sora,基于概率运作,通过海量数据学习模式进行预测。这种能力使得它能够“学习”世界运作的奥秘。综上所述,Sora无疑是一项令人惊叹的技术,但其背后潜藏的问题亟待解决。
© 版权声明
文章版权归作者所有,未经允许请勿转载。