微软北大联合团队开发AI新应用 无限视觉生成技术
近日微软Research Asia联合北京大学以及Microsoft Azure AI共同研发了全新AI视觉生成技术“NUWA-Infinity: Autoregressive over Autoregressive Generation for Infinite Visual Synthesis”,引发热议,通过该技术可以使文本自动生成图像或者学习图像生成扩张图像等应用。
•以往的OpenAI的DALL・E2、Google的Imagen或者Parti等都可以通过文本直接生成图像,不过解像度只有1024×1024级别,而“NUWA-Infinity: Autoregressive over Autoregressive Generation for Infinite Visual Synthesis”却可以生成高达4096×1024级别的高清图像。
•不但如此,该技术还能学习现有的图像从而按照相同架构扩张为更大更清楚的图像,以及视频方面的转换等,具体能力多达五种:
让图像动起来(Image Animation)
根据文本生成视频(Text-to-Video)
根据文本生成图像(Text-to-Image)
图像补全(Image Outpainting)
图像生成(Image Generation)