Compréhension vidéo BERT
BERT (représentations d’encodeur bidirectionnelles issues des transformateurs) est un modèle de langage développé par Google.
Qu’est-ce que la compréhension vidéo BERT ?
La compréhension vidéo BERT désigne l’utilisation du modèle BERT (Bidirectional Encoder Representations from Transformers), une IA d’apprentissage profond, pour analyser et comprendre le contenu vidéo. BERT peut traiter les transcriptions vidéo, les sous-titres ou le texte associé afin d’en extraire le sens, le contexte et des informations, permettant des applications telles que la synthèse vidéo, la recherche, la recommandation et le balisage automatisé.

