基于深度跨模态学习的视听图像情感智能感知与交互设计

在线阅读 下载PDF 导出详情
摘要 摘要:本文探讨深度跨模态学习在视听图像情感感知的进展,提出创新框架融合图像与声音,提升情感识别精度。采用前沿深度学习技术(Transformer、ViT)与多模态融合策略(GNN、自注意力),展望其在人机交互等领域的应用前景,并关注隐私伦理,确保技术可持续发展。
出处 《科技新时代》 2024年9期
出版日期 2024年08月06日(中国期刊网平台首次上网日期,不代表论文的发表时间)
  • 相关文献