人工智能Sora.2运行原理及难度
阅读:3806 发布时间:2024/2/20 22:21:12 发布人:y0
上集说到,sora既是文生视频的意思,也是世界模拟器的意思。如果把人工智能定义为各行业、各赛道的王冠,那sora就是王冠上最耀眼的明珠。那它的运行原理是什么呢?这条赛道的难点是什么?
如果你对新兴科技感兴趣,对科技商业化感兴趣,请关注收藏。
算力,就是计算机的运算能力,对芯片的质量和数量、带宽、构架、软件优化等都有极其严苛的要求。就像google,你觉得你应该把数以百万台的服务器堆放在那里?答案是,那里电费价格低,水多能冷却,就放到哪里。
我们先看看openai的文本大模型chatgpt,人类要给计算机投喂大量的知识、文字、图片等等,并让它不断地学习、纠错、提升,理解人类,由于计算机是24小时不间断的学习,它成长很快,目前在很多方面已经远远超过我们普通人。
那再看看sora。视频是由一帧一帧的大量图片构成的,一小时的视频大概由十万张图片组成。由于图片增加了时间轴这个维度,每张照片的像素不同。但是,光线、人物、场景等等,既要有微小的差别,又要逻辑连贯,还要符合各种物理规律,比如力学、光学、电学等,牵一发而动全身。就像一滴墨水滴到水里,每时每刻,每个墨水分子的位置都在变动,要准确的展现出来,这对计算机的算力,比文本对算力的要求高太多太多,可以说是指数级。
现在,sora已经可以根据你的指令,随意生成一分钟的精彩视频。未来,将对各行各业产生那些颠覆性的影响?我下集再讲。欢迎大家在评论区留言讨论。
本文由世行联战略委员会黄顺利主席原创。
•联系方式[请注册登陆,打卡后查看]
无内容,
开放。
•更多参考: 无内容, 开放。
•我的资讯[按发布时间]
•部分会员[按打卡时间]