Lancé en France le 3 juillet 2025, Veo 3 de Google permet à chacun de générer des vidéos courtes, avec image, son et dialogues, à partir d’un simple texte. Une avancée majeure dans la création assistée par intelligence artificielle, qui soulève autant d’enthousiasme que de questions.
Une IA vidéo multimodale accessible à tous
Présenté lors de la conférence Google I/O en mai 2025, Veo 3 est un générateur de vidéos capable d’animer des scènes réalistes à partir d’un prompt texte, tout en ajoutant automatiquement sons, bruitages et dialogues synchronisés. Cette nouveauté propulse l’outil bien au-delà de ses prédécesseurs, qui se limitaient à la vidéo muette ou sans cohérence audio-visuelle.
Désormais, quelques mots suffisent pour obtenir une séquence de quelques secondes où l’on entend la mer, les pas dans la neige, voire une voix off ou un personnage parler. L’outil gère également des aspects cinématographiques comme les mouvements de caméra, la gestion de la lumière, ou encore la continuité des scènes.
Fonctionnalités, limites et accès en France
Veo 3 est disponible en France via l’application Gemini pour les abonnés à l’offre Google AI Pro (21,99 €/mois). Une version « Fast » permet de générer jusqu’à trois vidéos par jour en 720p (8 secondes max), tandis que l’abonnement « Ultra » (275 €/mois) lève les restrictions de qualité et de quantité.
Si la qualité visuelle impressionne – avec des textures réalistes et des personnages crédibles –, certains points restent perfectibles : limitation de la durée, variabilité de la continuité visuelle, ou encore incohérences dans des scènes complexes. De plus, malgré une interface conviviale, l’efficacité dépend largement de la précision du prompt initial.
Des opportunités créatives… et des risques éthiques
Grâce à son intégration dans Gemini, et prochainement dans Canva ou Runway via API, Veo 3 démocratise la création vidéo pour les créateurs de contenus, enseignants, marketeurs et vidéastes amateurs. Toutefois, sa capacité à générer des vidéos hyperréalistes avec son soulève des inquiétudes autour des deepfakes et de la désinformation.
Pour y répondre, Google appose automatiquement un filigrane visible ainsi qu’un marquage numérique invisible (SynthID) pour authentifier chaque vidéo. L’entreprise annonce aussi des garde-fous comme des tests de red team et des vérifications manuelles sur les contenus les plus viraux.