猫色444 北京智源辩论院发布原生多模态寰球模子Emu3
本文转自:东谈主民日报国外版猫色444
《 东谈主民日报国外版 》( 2024年10月24日 第 09 版)
本报电 (记者刘峣)近日,北京智源东谈主工智能辩论院细腻发布原生多模态寰球模子Emu3。该模子已毕了视频、图像、文本三种模态的销毁斡旋与生成,告捷考据了基于下一个token(词元)瞻望的多模态时候范式,开释其在大鸿沟磨练和推理上的后劲。
据了解Emu3只基于下一个token瞻望,无需扩散模子或组合式顺序,把图像、文本和视频编码为一个突破空间,在多模态夹杂序列上重新启动聚会磨练一个Transformer。
男同智源辩论院院长王仲远默示猫色444,Emu3为构建多模态通用东谈主工智能提供了普遍的时候出息,有契机将基础要领开荒敛迹到一条时候道路上,为大鸿沟多模态磨练和推理提供基础。改日,多模态寰球模子将促进机器东谈主大脑、自动驾驶、多模态对话和推理等场景欺诈。