字节与浙大联合推多模态大语言模型Vista-LLaMA 可解读视频内容

在自然语言处理领域,大型语言模型如GPT、GLM和LLaMA等的成功应用已经取得了显著的进展。然而,将这些技术扩展到视频内容理解领域则是一项全新的挑战。字节跳...
1 12 13 14