据最新消息,谷歌公司发布了一项名为Genie的新交互模型技术。这一技术的出现将为人工智能领域带来革命性的突破。
据了解,Genie拥有110亿个参数,并且能够通过用户提供的图片和提示词,在较短的时间内生成一款完整的2D平台游戏。其内部由潜在动作模型、视频tokenizer以及动态模型三个部分组成。潜在动作模型负责推断每一帧之间的可能动作;视频tokenizer则负责将原始视频帧转换为离散token;而动态模型则根据给定的潜在动作和过去帧token来预测视频下一个帧。这三个部分密切协作,使得Genie能够创建出高度交互性和可控性的虚拟世界。
据悉,该技术已经在网络上接受了超过20万小时的2D游戏视频训练,并已推出了一个研究预览版。然而需要注意的是,这些游戏仍然是以2D平台游戏为主,而非完全的VR游戏。
除此之外,Genie还能生成图像和其他资产,并能将你的草图转化为一个完全实现的开放世界。同时,它还可以根据玩家提供的操作预测下一个像素帧。更令人兴奋的是,Genie的应用场景远不止于此。这一技术也可以应用于设计相关的创作领域,进一步拓宽了创作者的想象空间。
本文属于原创文章,如若转载,请注明来源:谷歌发布Genie新技术 可生成2D平台游戏https://dcdv.zol.com.cn/857/8577102.html